mirror of
https://github.com/lobehub/lobe-chat.git
synced 2026-06-21 06:29:59 +00:00
Compare commits
39 Commits
| Author | SHA1 | Date | |
|---|---|---|---|
| f64f00fd6d | |||
| 5b89ec8bd9 | |||
| 3b37094dfb | |||
| b2a2fe3617 | |||
| 15ae35ca2a | |||
| e9e11cbbed | |||
| 1c9c8d75ee | |||
| 95ac795573 | |||
| a173f6e401 | |||
| 37bb8ba2b7 | |||
| 46d25092a4 | |||
| 88c86179ba | |||
| 127d38d702 | |||
| 09ca978f9c | |||
| 1696bf114b | |||
| feb42fcc9e | |||
| 25158750c0 | |||
| d3d7a158fc | |||
| 2212ea98ac | |||
| 8512f5a9ae | |||
| a2d40643c7 | |||
| 2ef77567f7 | |||
| 755e878a44 | |||
| 4cb1a185ff | |||
| 55462b95ff | |||
| 9a95886fe7 | |||
| fd44b088d6 | |||
| 790eeb86c3 | |||
| 637d75cde0 | |||
| 526b93470d | |||
| 4963c599c9 | |||
| 09f921d531 | |||
| d6f17f8246 | |||
| efb9311e6f | |||
| 1353d208e9 | |||
| 7e2f4ce5dd | |||
| ca5432ea6d | |||
| 86ff384587 | |||
| 00215c02eb |
+284
@@ -2,6 +2,290 @@
|
||||
|
||||
# Changelog
|
||||
|
||||
### [Version 1.98.2](https://github.com/lobehub/lobe-chat/compare/v1.98.1...v1.98.2)
|
||||
|
||||
<sup>Released on **2025-07-14**</sup>
|
||||
|
||||
#### 💄 Styles
|
||||
|
||||
- **misc**: Update i18n.
|
||||
|
||||
<br/>
|
||||
|
||||
<details>
|
||||
<summary><kbd>Improvements and Fixes</kbd></summary>
|
||||
|
||||
#### Styles
|
||||
|
||||
- **misc**: Update i18n, closes [#8422](https://github.com/lobehub/lobe-chat/issues/8422) ([5b89ec8](https://github.com/lobehub/lobe-chat/commit/5b89ec8))
|
||||
|
||||
</details>
|
||||
|
||||
<div align="right">
|
||||
|
||||
[](#readme-top)
|
||||
|
||||
</div>
|
||||
|
||||
### [Version 1.98.1](https://github.com/lobehub/lobe-chat/compare/v1.98.0...v1.98.1)
|
||||
|
||||
<sup>Released on **2025-07-14**</sup>
|
||||
|
||||
#### 💄 Styles
|
||||
|
||||
- **misc**: Fix discover translation.
|
||||
|
||||
<br/>
|
||||
|
||||
<details>
|
||||
<summary><kbd>Improvements and Fixes</kbd></summary>
|
||||
|
||||
#### Styles
|
||||
|
||||
- **misc**: Fix discover translation, closes [#8423](https://github.com/lobehub/lobe-chat/issues/8423) ([15ae35c](https://github.com/lobehub/lobe-chat/commit/15ae35c))
|
||||
|
||||
</details>
|
||||
|
||||
<div align="right">
|
||||
|
||||
[](#readme-top)
|
||||
|
||||
</div>
|
||||
|
||||
## [Version 1.98.0](https://github.com/lobehub/lobe-chat/compare/v1.97.17...v1.98.0)
|
||||
|
||||
<sup>Released on **2025-07-13**</sup>
|
||||
|
||||
#### ✨ Features
|
||||
|
||||
- **misc**: Add network proxy for desktop.
|
||||
|
||||
<br/>
|
||||
|
||||
<details>
|
||||
<summary><kbd>Improvements and Fixes</kbd></summary>
|
||||
|
||||
#### What's improved
|
||||
|
||||
- **misc**: Add network proxy for desktop, closes [#7848](https://github.com/lobehub/lobe-chat/issues/7848) ([46d2509](https://github.com/lobehub/lobe-chat/commit/46d2509))
|
||||
|
||||
</details>
|
||||
|
||||
<div align="right">
|
||||
|
||||
[](#readme-top)
|
||||
|
||||
</div>
|
||||
|
||||
### [Version 1.97.17](https://github.com/lobehub/lobe-chat/compare/v1.97.16...v1.97.17)
|
||||
|
||||
<sup>Released on **2025-07-13**</sup>
|
||||
|
||||
#### 💄 Styles
|
||||
|
||||
- **misc**: Support Hunyuan A13B thinking model.
|
||||
|
||||
<br/>
|
||||
|
||||
<details>
|
||||
<summary><kbd>Improvements and Fixes</kbd></summary>
|
||||
|
||||
#### Styles
|
||||
|
||||
- **misc**: Support Hunyuan A13B thinking model, closes [#8278](https://github.com/lobehub/lobe-chat/issues/8278) ([09ca978](https://github.com/lobehub/lobe-chat/commit/09ca978))
|
||||
|
||||
</details>
|
||||
|
||||
<div align="right">
|
||||
|
||||
[](#readme-top)
|
||||
|
||||
</div>
|
||||
|
||||
### [Version 1.97.16](https://github.com/lobehub/lobe-chat/compare/v1.97.15...v1.97.16)
|
||||
|
||||
<sup>Released on **2025-07-13**</sup>
|
||||
|
||||
#### 💄 Styles
|
||||
|
||||
- **misc**: Update i18n.
|
||||
|
||||
<br/>
|
||||
|
||||
<details>
|
||||
<summary><kbd>Improvements and Fixes</kbd></summary>
|
||||
|
||||
#### Styles
|
||||
|
||||
- **misc**: Update i18n, closes [#8410](https://github.com/lobehub/lobe-chat/issues/8410) ([2515875](https://github.com/lobehub/lobe-chat/commit/2515875))
|
||||
|
||||
</details>
|
||||
|
||||
<div align="right">
|
||||
|
||||
[](#readme-top)
|
||||
|
||||
</div>
|
||||
|
||||
### [Version 1.97.15](https://github.com/lobehub/lobe-chat/compare/v1.97.14...v1.97.15)
|
||||
|
||||
<sup>Released on **2025-07-12**</sup>
|
||||
|
||||
#### 🐛 Bug Fixes
|
||||
|
||||
- **misc**: Add vision support to Grok 4.
|
||||
|
||||
<br/>
|
||||
|
||||
<details>
|
||||
<summary><kbd>Improvements and Fixes</kbd></summary>
|
||||
|
||||
#### What's fixed
|
||||
|
||||
- **misc**: Add vision support to Grok 4, closes [#8386](https://github.com/lobehub/lobe-chat/issues/8386) ([8512f5a](https://github.com/lobehub/lobe-chat/commit/8512f5a))
|
||||
|
||||
</details>
|
||||
|
||||
<div align="right">
|
||||
|
||||
[](#readme-top)
|
||||
|
||||
</div>
|
||||
|
||||
### [Version 1.97.14](https://github.com/lobehub/lobe-chat/compare/v1.97.13...v1.97.14)
|
||||
|
||||
<sup>Released on **2025-07-12**</sup>
|
||||
|
||||
#### 🐛 Bug Fixes
|
||||
|
||||
- **misc**: Revert "💄 style: Open new topic by tap Just Chat again".
|
||||
|
||||
#### 💄 Styles
|
||||
|
||||
- **misc**: Add Kimi K2 model.
|
||||
|
||||
<br/>
|
||||
|
||||
<details>
|
||||
<summary><kbd>Improvements and Fixes</kbd></summary>
|
||||
|
||||
#### What's fixed
|
||||
|
||||
- **misc**: Revert "💄 style: Open new topic by tap Just Chat again", closes [#8402](https://github.com/lobehub/lobe-chat/issues/8402) ([55462b9](https://github.com/lobehub/lobe-chat/commit/55462b9))
|
||||
|
||||
#### Styles
|
||||
|
||||
- **misc**: Add Kimi K2 model, closes [#8401](https://github.com/lobehub/lobe-chat/issues/8401) ([4cb1a18](https://github.com/lobehub/lobe-chat/commit/4cb1a18))
|
||||
|
||||
</details>
|
||||
|
||||
<div align="right">
|
||||
|
||||
[](#readme-top)
|
||||
|
||||
</div>
|
||||
|
||||
### [Version 1.97.13](https://github.com/lobehub/lobe-chat/compare/v1.97.12...v1.97.13)
|
||||
|
||||
<sup>Released on **2025-07-12**</sup>
|
||||
|
||||
#### 💄 Styles
|
||||
|
||||
- **misc**: Support new Doubao thinking models, update i18n.
|
||||
|
||||
<br/>
|
||||
|
||||
<details>
|
||||
<summary><kbd>Improvements and Fixes</kbd></summary>
|
||||
|
||||
#### Styles
|
||||
|
||||
- **misc**: Support new Doubao thinking models, closes [#8174](https://github.com/lobehub/lobe-chat/issues/8174) ([637d75c](https://github.com/lobehub/lobe-chat/commit/637d75c))
|
||||
- **misc**: Update i18n, closes [#8400](https://github.com/lobehub/lobe-chat/issues/8400) ([790eeb8](https://github.com/lobehub/lobe-chat/commit/790eeb8))
|
||||
|
||||
</details>
|
||||
|
||||
<div align="right">
|
||||
|
||||
[](#readme-top)
|
||||
|
||||
</div>
|
||||
|
||||
### [Version 1.97.12](https://github.com/lobehub/lobe-chat/compare/v1.97.11...v1.97.12)
|
||||
|
||||
<sup>Released on **2025-07-11**</sup>
|
||||
|
||||
#### 🐛 Bug Fixes
|
||||
|
||||
- **misc**: Grok-4 reasoning model universal matching.
|
||||
|
||||
<br/>
|
||||
|
||||
<details>
|
||||
<summary><kbd>Improvements and Fixes</kbd></summary>
|
||||
|
||||
#### What's fixed
|
||||
|
||||
- **misc**: Grok-4 reasoning model universal matching, closes [#8390](https://github.com/lobehub/lobe-chat/issues/8390) ([d6f17f8](https://github.com/lobehub/lobe-chat/commit/d6f17f8))
|
||||
|
||||
</details>
|
||||
|
||||
<div align="right">
|
||||
|
||||
[](#readme-top)
|
||||
|
||||
</div>
|
||||
|
||||
### [Version 1.97.11](https://github.com/lobehub/lobe-chat/compare/v1.97.10...v1.97.11)
|
||||
|
||||
<sup>Released on **2025-07-11**</sup>
|
||||
|
||||
#### 💄 Styles
|
||||
|
||||
- **misc**: Open new topic by tap Just Chat again.
|
||||
|
||||
<br/>
|
||||
|
||||
<details>
|
||||
<summary><kbd>Improvements and Fixes</kbd></summary>
|
||||
|
||||
#### Styles
|
||||
|
||||
- **misc**: Open new topic by tap Just Chat again, closes [#8311](https://github.com/lobehub/lobe-chat/issues/8311) ([7e2f4ce](https://github.com/lobehub/lobe-chat/commit/7e2f4ce))
|
||||
|
||||
</details>
|
||||
|
||||
<div align="right">
|
||||
|
||||
[](#readme-top)
|
||||
|
||||
</div>
|
||||
|
||||
### [Version 1.97.10](https://github.com/lobehub/lobe-chat/compare/v1.97.9...v1.97.10)
|
||||
|
||||
<sup>Released on **2025-07-11**</sup>
|
||||
|
||||
#### 💄 Styles
|
||||
|
||||
- **misc**: Update i18n.
|
||||
|
||||
<br/>
|
||||
|
||||
<details>
|
||||
<summary><kbd>Improvements and Fixes</kbd></summary>
|
||||
|
||||
#### Styles
|
||||
|
||||
- **misc**: Update i18n, closes [#8387](https://github.com/lobehub/lobe-chat/issues/8387) ([00215c0](https://github.com/lobehub/lobe-chat/commit/00215c0))
|
||||
|
||||
</details>
|
||||
|
||||
<div align="right">
|
||||
|
||||
[](#readme-top)
|
||||
|
||||
</div>
|
||||
|
||||
### [Version 1.97.9](https://github.com/lobehub/lobe-chat/compare/v1.97.8...v1.97.9)
|
||||
|
||||
<sup>Released on **2025-07-10**</sup>
|
||||
|
||||
@@ -1,4 +1,5 @@
|
||||
lockfile=false
|
||||
shamefully-hoist=true
|
||||
|
||||
electron_mirror=https://npmmirror.com/mirrors/electron/
|
||||
electron_builder_binaries_mirror=https://npmmirror.com/mirrors/electron-builder-binaries/
|
||||
|
||||
@@ -1,6 +1,6 @@
|
||||
{
|
||||
"name": "lobehub-desktop-dev",
|
||||
"version": "0.0.10",
|
||||
"version": "0.0.0",
|
||||
"description": "LobeHub Desktop Application",
|
||||
"homepage": "https://lobehub.com",
|
||||
"repository": {
|
||||
@@ -24,6 +24,7 @@
|
||||
"lint": "eslint --cache ",
|
||||
"pg-server": "bun run scripts/pglite-server.ts",
|
||||
"start": "electron-vite preview",
|
||||
"test": "vite --run",
|
||||
"typecheck": "tsgo --noEmit -p tsconfig.json"
|
||||
},
|
||||
"dependencies": {
|
||||
@@ -45,10 +46,10 @@
|
||||
"@types/resolve": "^1.20.6",
|
||||
"@types/semver": "^7.7.0",
|
||||
"@types/set-cookie-parser": "^2.4.10",
|
||||
"@typescript/native-preview": "latest",
|
||||
"@typescript/native-preview": "7.0.0-dev.20250711.1",
|
||||
"consola": "^3.1.0",
|
||||
"cookie": "^1.0.2",
|
||||
"electron": "^37.2.0",
|
||||
"electron": "~37.1.0",
|
||||
"electron-builder": "^26.0.12",
|
||||
"electron-is": "^3.0.0",
|
||||
"electron-log": "^5.3.3",
|
||||
@@ -58,17 +59,19 @@
|
||||
"fix-path": "^4.0.0",
|
||||
"just-diff": "^6.0.2",
|
||||
"lodash": "^4.17.21",
|
||||
"pglite-server": "^0.1.4",
|
||||
"lodash-es": "^4.17.21",
|
||||
"resolve": "^1.22.8",
|
||||
"semver": "^7.5.4",
|
||||
"set-cookie-parser": "^2.7.1",
|
||||
"tsx": "^4.19.3",
|
||||
"typescript": "^5.7.3",
|
||||
"undici": "^7.9.0",
|
||||
"vite": "^6.2.5"
|
||||
},
|
||||
"pnpm": {
|
||||
"onlyBuiltDependencies": [
|
||||
"electron"
|
||||
"electron",
|
||||
"electron-builder"
|
||||
]
|
||||
}
|
||||
}
|
||||
|
||||
@@ -1,14 +0,0 @@
|
||||
import { PGlite } from "@electric-sql/pglite";
|
||||
import { createServer } from "pglite-server";
|
||||
|
||||
// 创建或连接到您现有的 PGlite 数据库
|
||||
const db = new PGlite("/Users/arvinxx/Library/Application Support/lobehub-desktop/lobehub-local-db");
|
||||
await db.waitReady;
|
||||
|
||||
// 创建服务器并监听端口
|
||||
const PORT = 6543;
|
||||
const pgServer = createServer(db);
|
||||
|
||||
pgServer.listen(PORT, () => {
|
||||
console.log(`PGlite 服务器已启动,监听端口 ${PORT}`);
|
||||
});
|
||||
@@ -1,6 +1,8 @@
|
||||
/**
|
||||
* 应用设置存储相关常量
|
||||
*/
|
||||
import { NetworkProxySettings } from '@lobechat/electron-client-ipc';
|
||||
|
||||
import { appStorageDir } from '@/const/dir';
|
||||
import { DEFAULT_SHORTCUTS_CONFIG } from '@/shortcuts';
|
||||
import { ElectronMainStore } from '@/types/store';
|
||||
@@ -10,6 +12,15 @@ import { ElectronMainStore } from '@/types/store';
|
||||
*/
|
||||
export const STORE_NAME = 'lobehub-settings';
|
||||
|
||||
export const defaultProxySettings: NetworkProxySettings = {
|
||||
enableProxy: false,
|
||||
proxyBypass: 'localhost, 127.0.0.1, ::1',
|
||||
proxyPort: '',
|
||||
proxyRequireAuth: false,
|
||||
proxyServer: '',
|
||||
proxyType: 'http',
|
||||
};
|
||||
|
||||
/**
|
||||
* 存储默认值
|
||||
*/
|
||||
@@ -17,6 +28,7 @@ export const STORE_DEFAULTS: ElectronMainStore = {
|
||||
dataSyncConfig: { storageMode: 'local' },
|
||||
encryptedTokens: {},
|
||||
locale: 'auto',
|
||||
networkProxy: defaultProxySettings,
|
||||
shortcuts: DEFAULT_SHORTCUTS_CONFIG,
|
||||
storagePath: appStorageDir,
|
||||
};
|
||||
|
||||
@@ -0,0 +1,172 @@
|
||||
import { NetworkProxySettings } from '@lobechat/electron-client-ipc';
|
||||
import { merge } from 'lodash';
|
||||
import { isEqual } from 'lodash-es';
|
||||
|
||||
import { defaultProxySettings } from '@/const/store';
|
||||
import { createLogger } from '@/utils/logger';
|
||||
|
||||
import {
|
||||
ProxyConfigValidator,
|
||||
ProxyConnectionTester,
|
||||
ProxyDispatcherManager,
|
||||
ProxyTestResult,
|
||||
} from '../modules/networkProxy';
|
||||
import { ControllerModule, ipcClientEvent } from './index';
|
||||
|
||||
// Create logger
|
||||
const logger = createLogger('controllers:NetworkProxyCtr');
|
||||
|
||||
/**
|
||||
* 网络代理控制器
|
||||
* 处理桌面应用的网络代理相关功能
|
||||
*/
|
||||
export default class NetworkProxyCtr extends ControllerModule {
|
||||
/**
|
||||
* 获取代理设置
|
||||
*/
|
||||
@ipcClientEvent('getProxySettings')
|
||||
async getDesktopSettings(): Promise<NetworkProxySettings> {
|
||||
try {
|
||||
const settings = this.app.storeManager.get(
|
||||
'networkProxy',
|
||||
defaultProxySettings,
|
||||
) as NetworkProxySettings;
|
||||
logger.debug('Retrieved proxy settings:', {
|
||||
enableProxy: settings.enableProxy,
|
||||
proxyType: settings.proxyType,
|
||||
});
|
||||
return settings;
|
||||
} catch (error) {
|
||||
logger.error('Failed to get proxy settings:', error);
|
||||
return defaultProxySettings;
|
||||
}
|
||||
}
|
||||
|
||||
/**
|
||||
* 设置代理配置
|
||||
*/
|
||||
@ipcClientEvent('setProxySettings')
|
||||
async setProxySettings(config: NetworkProxySettings): Promise<void> {
|
||||
try {
|
||||
// 验证配置
|
||||
const validation = ProxyConfigValidator.validate(config);
|
||||
if (!validation.isValid) {
|
||||
const errorMessage = `Invalid proxy configuration: ${validation.errors.join(', ')}`;
|
||||
logger.error(errorMessage);
|
||||
throw new Error(errorMessage);
|
||||
}
|
||||
|
||||
// 获取当前配置
|
||||
const currentConfig = this.app.storeManager.get(
|
||||
'networkProxy',
|
||||
defaultProxySettings,
|
||||
) as NetworkProxySettings;
|
||||
|
||||
// 检查是否有变化
|
||||
if (isEqual(currentConfig, config)) {
|
||||
logger.debug('Proxy settings unchanged, skipping update');
|
||||
return;
|
||||
}
|
||||
|
||||
// 合并配置
|
||||
const newConfig = merge({}, currentConfig, config);
|
||||
|
||||
// 应用代理设置
|
||||
await ProxyDispatcherManager.applyProxySettings(newConfig);
|
||||
|
||||
// 保存到存储
|
||||
this.app.storeManager.set('networkProxy', newConfig);
|
||||
|
||||
logger.info('Proxy settings updated successfully', {
|
||||
enableProxy: newConfig.enableProxy,
|
||||
proxyPort: newConfig.proxyPort,
|
||||
proxyServer: newConfig.proxyServer,
|
||||
proxyType: newConfig.proxyType,
|
||||
});
|
||||
} catch (error) {
|
||||
logger.error('Failed to update proxy settings:', error);
|
||||
throw error;
|
||||
}
|
||||
}
|
||||
|
||||
/**
|
||||
* 测试代理连接
|
||||
*/
|
||||
@ipcClientEvent('testProxyConnection')
|
||||
async testProxyConnection(url: string): Promise<{ message?: string; success: boolean }> {
|
||||
try {
|
||||
const result = await ProxyConnectionTester.testConnection(url);
|
||||
|
||||
if (result.success) {
|
||||
return { success: true };
|
||||
} else {
|
||||
throw new Error(result.message || 'Connection test failed');
|
||||
}
|
||||
} catch (error) {
|
||||
const errorMessage = error instanceof Error ? error.message : 'Unknown error';
|
||||
logger.error('Proxy connection test failed:', errorMessage);
|
||||
throw new Error(`Connection failed: ${errorMessage}`);
|
||||
}
|
||||
}
|
||||
|
||||
/**
|
||||
* 测试指定代理配置
|
||||
*/
|
||||
@ipcClientEvent('testProxyConfig')
|
||||
async testProxyConfig({
|
||||
config,
|
||||
testUrl,
|
||||
}: {
|
||||
config: NetworkProxySettings;
|
||||
testUrl?: string;
|
||||
}): Promise<ProxyTestResult> {
|
||||
try {
|
||||
return await ProxyConnectionTester.testProxyConfig(config, testUrl);
|
||||
} catch (error) {
|
||||
const errorMessage = error instanceof Error ? error.message : 'Unknown error';
|
||||
logger.error('Proxy config test failed:', errorMessage);
|
||||
return {
|
||||
message: `Proxy config test failed: ${errorMessage}`,
|
||||
success: false,
|
||||
};
|
||||
}
|
||||
}
|
||||
|
||||
/**
|
||||
* 应用初始代理设置
|
||||
*/
|
||||
async afterAppReady(): Promise<void> {
|
||||
try {
|
||||
// 获取存储的代理设置
|
||||
const networkProxy = this.app.storeManager.get(
|
||||
'networkProxy',
|
||||
defaultProxySettings,
|
||||
) as NetworkProxySettings;
|
||||
|
||||
// 验证配置
|
||||
const validation = ProxyConfigValidator.validate(networkProxy);
|
||||
if (!validation.isValid) {
|
||||
logger.warn('Invalid stored proxy configuration, using defaults:', validation.errors);
|
||||
await ProxyDispatcherManager.applyProxySettings(defaultProxySettings);
|
||||
return;
|
||||
}
|
||||
|
||||
// 应用代理设置
|
||||
await ProxyDispatcherManager.applyProxySettings(networkProxy);
|
||||
|
||||
logger.info('Initial proxy settings applied successfully', {
|
||||
enableProxy: networkProxy.enableProxy,
|
||||
proxyType: networkProxy.proxyType,
|
||||
});
|
||||
} catch (error) {
|
||||
logger.error('Failed to apply initial proxy settings:', error);
|
||||
// 出错时使用默认设置
|
||||
try {
|
||||
await ProxyDispatcherManager.applyProxySettings(defaultProxySettings);
|
||||
logger.info('Fallback to default proxy settings');
|
||||
} catch (fallbackError) {
|
||||
logger.error('Failed to apply fallback proxy settings:', fallbackError);
|
||||
}
|
||||
}
|
||||
}
|
||||
}
|
||||
@@ -0,0 +1,401 @@
|
||||
import { NetworkProxySettings } from '@lobechat/electron-client-ipc';
|
||||
import { beforeEach, describe, expect, it, vi } from 'vitest';
|
||||
|
||||
import type { App } from '@/core/App';
|
||||
|
||||
import NetworkProxyCtr from '../NetworkProxyCtr';
|
||||
|
||||
// 模拟 logger
|
||||
vi.mock('@/utils/logger', () => ({
|
||||
createLogger: () => ({
|
||||
debug: vi.fn(),
|
||||
info: vi.fn(),
|
||||
warn: vi.fn(),
|
||||
error: vi.fn(),
|
||||
}),
|
||||
}));
|
||||
|
||||
// 模拟 undici
|
||||
vi.mock('undici', () => ({
|
||||
fetch: vi.fn(),
|
||||
getGlobalDispatcher: vi.fn(),
|
||||
setGlobalDispatcher: vi.fn(),
|
||||
ProxyAgent: vi.fn(),
|
||||
}));
|
||||
|
||||
// 模拟 defaultProxySettings
|
||||
vi.mock('@/const/store', () => ({
|
||||
defaultProxySettings: {
|
||||
enableProxy: false,
|
||||
proxyBypass: 'localhost,127.0.0.1,::1',
|
||||
proxyPort: '',
|
||||
proxyRequireAuth: false,
|
||||
proxyServer: '',
|
||||
proxyType: 'http',
|
||||
},
|
||||
}));
|
||||
|
||||
// 模拟 fetch
|
||||
global.fetch = vi.fn();
|
||||
|
||||
// 模拟 App 及其依赖项
|
||||
const mockStoreManager = {
|
||||
get: vi.fn(),
|
||||
set: vi.fn(),
|
||||
};
|
||||
|
||||
const mockApp = {
|
||||
storeManager: mockStoreManager,
|
||||
} as unknown as App;
|
||||
|
||||
describe('NetworkProxyCtr', () => {
|
||||
let networkProxyCtr: NetworkProxyCtr;
|
||||
|
||||
beforeEach(() => {
|
||||
vi.clearAllMocks();
|
||||
networkProxyCtr = new NetworkProxyCtr(mockApp);
|
||||
|
||||
// 重置全局 fetch mock
|
||||
(global.fetch as any).mockReset();
|
||||
});
|
||||
|
||||
describe('ProxyConfigValidator', () => {
|
||||
const validConfig: NetworkProxySettings = {
|
||||
enableProxy: true,
|
||||
proxyType: 'http',
|
||||
proxyServer: 'proxy.example.com',
|
||||
proxyPort: '8080',
|
||||
proxyRequireAuth: false,
|
||||
proxyBypass: 'localhost,127.0.0.1,::1',
|
||||
};
|
||||
|
||||
it('should validate enabled proxy config with all required fields', () => {
|
||||
// 通过测试公共方法来间接测试验证逻辑
|
||||
expect(() => networkProxyCtr.setProxySettings(validConfig)).not.toThrow();
|
||||
});
|
||||
|
||||
it('should validate disabled proxy config', () => {
|
||||
const disabledConfig: NetworkProxySettings = {
|
||||
...validConfig,
|
||||
enableProxy: false,
|
||||
};
|
||||
|
||||
expect(() => networkProxyCtr.setProxySettings(disabledConfig)).not.toThrow();
|
||||
});
|
||||
|
||||
it('should reject invalid proxy type', async () => {
|
||||
const invalidConfig: NetworkProxySettings = {
|
||||
...validConfig,
|
||||
proxyType: 'invalid' as any,
|
||||
};
|
||||
|
||||
await expect(networkProxyCtr.setProxySettings(invalidConfig)).rejects.toThrow();
|
||||
});
|
||||
|
||||
it('should reject missing proxy server', async () => {
|
||||
const invalidConfig: NetworkProxySettings = {
|
||||
...validConfig,
|
||||
proxyServer: '',
|
||||
};
|
||||
|
||||
await expect(networkProxyCtr.setProxySettings(invalidConfig)).rejects.toThrow();
|
||||
});
|
||||
|
||||
it('should reject invalid proxy port', async () => {
|
||||
const invalidConfig: NetworkProxySettings = {
|
||||
...validConfig,
|
||||
proxyPort: 'invalid',
|
||||
};
|
||||
|
||||
await expect(networkProxyCtr.setProxySettings(invalidConfig)).rejects.toThrow();
|
||||
});
|
||||
|
||||
it('should reject missing auth credentials when auth is required', async () => {
|
||||
const invalidConfig: NetworkProxySettings = {
|
||||
...validConfig,
|
||||
proxyRequireAuth: true,
|
||||
proxyUsername: '',
|
||||
proxyPassword: '',
|
||||
};
|
||||
|
||||
await expect(networkProxyCtr.setProxySettings(invalidConfig)).rejects.toThrow();
|
||||
});
|
||||
});
|
||||
|
||||
describe('getDesktopSettings', () => {
|
||||
it('should return stored proxy settings', async () => {
|
||||
const expectedSettings: NetworkProxySettings = {
|
||||
enableProxy: true,
|
||||
proxyType: 'http',
|
||||
proxyServer: 'proxy.example.com',
|
||||
proxyPort: '8080',
|
||||
proxyRequireAuth: false,
|
||||
proxyBypass: 'localhost,127.0.0.1,::1',
|
||||
};
|
||||
|
||||
mockStoreManager.get.mockReturnValue(expectedSettings);
|
||||
|
||||
const result = await networkProxyCtr.getDesktopSettings();
|
||||
|
||||
expect(result).toEqual(expectedSettings);
|
||||
expect(mockStoreManager.get).toHaveBeenCalledWith('networkProxy', expect.any(Object));
|
||||
});
|
||||
|
||||
it('should return default settings when store fails', async () => {
|
||||
mockStoreManager.get.mockImplementation(() => {
|
||||
throw new Error('Store error');
|
||||
});
|
||||
|
||||
const result = await networkProxyCtr.getDesktopSettings();
|
||||
|
||||
expect(result).toEqual({
|
||||
enableProxy: false,
|
||||
proxyBypass: 'localhost,127.0.0.1,::1',
|
||||
proxyPort: '',
|
||||
proxyRequireAuth: false,
|
||||
proxyServer: '',
|
||||
proxyType: 'http',
|
||||
});
|
||||
});
|
||||
});
|
||||
|
||||
describe('setProxySettings', () => {
|
||||
const validConfig: NetworkProxySettings = {
|
||||
enableProxy: true,
|
||||
proxyType: 'http',
|
||||
proxyServer: 'proxy.example.com',
|
||||
proxyPort: '8080',
|
||||
proxyRequireAuth: false,
|
||||
proxyBypass: 'localhost,127.0.0.1,::1',
|
||||
};
|
||||
|
||||
it('should save valid proxy settings', async () => {
|
||||
mockStoreManager.get.mockReturnValue({
|
||||
enableProxy: false,
|
||||
proxyType: 'http',
|
||||
proxyServer: '',
|
||||
proxyPort: '',
|
||||
proxyRequireAuth: false,
|
||||
proxyBypass: 'localhost,127.0.0.1,::1',
|
||||
});
|
||||
|
||||
await networkProxyCtr.setProxySettings(validConfig);
|
||||
|
||||
expect(mockStoreManager.set).toHaveBeenCalledWith(
|
||||
'networkProxy',
|
||||
expect.objectContaining(validConfig),
|
||||
);
|
||||
});
|
||||
|
||||
it('should skip update if settings are unchanged', async () => {
|
||||
mockStoreManager.get.mockReturnValue(validConfig);
|
||||
|
||||
await networkProxyCtr.setProxySettings(validConfig);
|
||||
|
||||
expect(mockStoreManager.set).not.toHaveBeenCalled();
|
||||
});
|
||||
|
||||
it('should throw error for invalid configuration', async () => {
|
||||
const invalidConfig: NetworkProxySettings = {
|
||||
...validConfig,
|
||||
proxyServer: '',
|
||||
};
|
||||
|
||||
await expect(networkProxyCtr.setProxySettings(invalidConfig)).rejects.toThrow();
|
||||
});
|
||||
});
|
||||
|
||||
describe('testProxyConnection', () => {
|
||||
it('should return success for successful connection', async () => {
|
||||
const mockResponse = {
|
||||
ok: true,
|
||||
status: 200,
|
||||
statusText: 'OK',
|
||||
};
|
||||
|
||||
(global.fetch as any).mockResolvedValueOnce(mockResponse);
|
||||
|
||||
const result = await networkProxyCtr.testProxyConnection('https://www.google.com');
|
||||
|
||||
expect(result).toEqual({ success: true });
|
||||
expect(global.fetch).toHaveBeenCalledWith('https://www.google.com', expect.any(Object));
|
||||
});
|
||||
|
||||
it('should throw error for failed connection', async () => {
|
||||
const mockResponse = {
|
||||
ok: false,
|
||||
status: 404,
|
||||
statusText: 'Not Found',
|
||||
};
|
||||
|
||||
(global.fetch as any).mockResolvedValueOnce(mockResponse);
|
||||
|
||||
await expect(networkProxyCtr.testProxyConnection('https://www.google.com')).rejects.toThrow();
|
||||
});
|
||||
|
||||
it('should throw error for network error', async () => {
|
||||
(global.fetch as any).mockRejectedValueOnce(new Error('Network error'));
|
||||
|
||||
await expect(networkProxyCtr.testProxyConnection('https://www.google.com')).rejects.toThrow();
|
||||
});
|
||||
});
|
||||
|
||||
describe('testProxyConfig', () => {
|
||||
const validConfig: NetworkProxySettings = {
|
||||
enableProxy: true,
|
||||
proxyType: 'http',
|
||||
proxyServer: 'proxy.example.com',
|
||||
proxyPort: '8080',
|
||||
proxyRequireAuth: false,
|
||||
proxyBypass: 'localhost,127.0.0.1,::1',
|
||||
};
|
||||
|
||||
it('should return success for valid config and successful connection', async () => {
|
||||
const mockResponse = {
|
||||
ok: true,
|
||||
status: 200,
|
||||
statusText: 'OK',
|
||||
};
|
||||
|
||||
(global.fetch as any).mockResolvedValueOnce(mockResponse);
|
||||
|
||||
const result = await networkProxyCtr.testProxyConfig({ config: validConfig });
|
||||
|
||||
expect(result.success).toBe(true);
|
||||
expect(result.responseTime).toBeGreaterThanOrEqual(0);
|
||||
});
|
||||
|
||||
it('should return failure for invalid config', async () => {
|
||||
const invalidConfig: NetworkProxySettings = {
|
||||
...validConfig,
|
||||
proxyServer: '',
|
||||
};
|
||||
|
||||
const result = await networkProxyCtr.testProxyConfig({ config: invalidConfig });
|
||||
|
||||
expect(result.success).toBe(false);
|
||||
expect(result.message).toContain('Invalid proxy configuration');
|
||||
});
|
||||
|
||||
it('should test direct connection for disabled proxy', async () => {
|
||||
const disabledConfig: NetworkProxySettings = {
|
||||
...validConfig,
|
||||
enableProxy: false,
|
||||
};
|
||||
|
||||
const mockResponse = {
|
||||
ok: true,
|
||||
status: 200,
|
||||
statusText: 'OK',
|
||||
};
|
||||
|
||||
(global.fetch as any).mockResolvedValueOnce(mockResponse);
|
||||
|
||||
const result = await networkProxyCtr.testProxyConfig({ config: disabledConfig });
|
||||
|
||||
expect(result.success).toBe(true);
|
||||
});
|
||||
|
||||
it('should return failure for connection error', async () => {
|
||||
(global.fetch as any).mockRejectedValueOnce(new Error('Connection failed'));
|
||||
|
||||
const result = await networkProxyCtr.testProxyConfig({ config: validConfig });
|
||||
|
||||
expect(result.success).toBe(false);
|
||||
expect(result.message).toContain('Connection failed');
|
||||
});
|
||||
});
|
||||
|
||||
describe('afterAppReady', () => {
|
||||
it('should apply stored proxy settings on app ready', async () => {
|
||||
const storedConfig: NetworkProxySettings = {
|
||||
enableProxy: true,
|
||||
proxyType: 'http',
|
||||
proxyServer: 'proxy.example.com',
|
||||
proxyPort: '8080',
|
||||
proxyRequireAuth: false,
|
||||
proxyBypass: 'localhost,127.0.0.1,::1',
|
||||
};
|
||||
|
||||
mockStoreManager.get.mockReturnValue(storedConfig);
|
||||
|
||||
await networkProxyCtr.afterAppReady();
|
||||
|
||||
expect(mockStoreManager.get).toHaveBeenCalledWith('networkProxy', expect.any(Object));
|
||||
});
|
||||
|
||||
it('should use default settings if stored config is invalid', async () => {
|
||||
const invalidConfig: NetworkProxySettings = {
|
||||
enableProxy: true,
|
||||
proxyType: 'http',
|
||||
proxyServer: '', // 无效的服务器
|
||||
proxyPort: '8080',
|
||||
proxyRequireAuth: false,
|
||||
proxyBypass: 'localhost,127.0.0.1,::1',
|
||||
};
|
||||
|
||||
mockStoreManager.get.mockReturnValue(invalidConfig);
|
||||
|
||||
await networkProxyCtr.afterAppReady();
|
||||
|
||||
expect(mockStoreManager.get).toHaveBeenCalledWith('networkProxy', expect.any(Object));
|
||||
});
|
||||
|
||||
it('should handle errors gracefully', async () => {
|
||||
mockStoreManager.get.mockImplementation(() => {
|
||||
throw new Error('Store error');
|
||||
});
|
||||
|
||||
// 不应该抛出错误
|
||||
await expect(networkProxyCtr.afterAppReady()).resolves.not.toThrow();
|
||||
});
|
||||
});
|
||||
|
||||
describe('ProxyUrlBuilder', () => {
|
||||
it('should build URL without authentication', () => {
|
||||
const config: NetworkProxySettings = {
|
||||
enableProxy: true,
|
||||
proxyType: 'http',
|
||||
proxyServer: 'proxy.example.com',
|
||||
proxyPort: '8080',
|
||||
proxyRequireAuth: false,
|
||||
proxyBypass: 'localhost,127.0.0.1,::1',
|
||||
};
|
||||
|
||||
// 通过测试代理设置来间接测试 URL 构建
|
||||
expect(() => networkProxyCtr.setProxySettings(config)).not.toThrow();
|
||||
});
|
||||
|
||||
it('should build URL with authentication', () => {
|
||||
const config: NetworkProxySettings = {
|
||||
enableProxy: true,
|
||||
proxyType: 'http',
|
||||
proxyServer: 'proxy.example.com',
|
||||
proxyPort: '8080',
|
||||
proxyRequireAuth: true,
|
||||
proxyUsername: 'user',
|
||||
proxyPassword: 'pass',
|
||||
proxyBypass: 'localhost,127.0.0.1,::1',
|
||||
};
|
||||
|
||||
// 通过测试代理设置来间接测试 URL 构建
|
||||
expect(() => networkProxyCtr.setProxySettings(config)).not.toThrow();
|
||||
});
|
||||
|
||||
it('should handle special characters in credentials', () => {
|
||||
const config: NetworkProxySettings = {
|
||||
enableProxy: true,
|
||||
proxyType: 'http',
|
||||
proxyServer: 'proxy.example.com',
|
||||
proxyPort: '8080',
|
||||
proxyRequireAuth: true,
|
||||
proxyUsername: 'user@domain',
|
||||
proxyPassword: 'pass:word',
|
||||
proxyBypass: 'localhost,127.0.0.1,::1',
|
||||
};
|
||||
|
||||
// 通过测试代理设置来间接测试 URL 构建
|
||||
expect(() => networkProxyCtr.setProxySettings(config)).not.toThrow();
|
||||
});
|
||||
});
|
||||
});
|
||||
@@ -381,6 +381,8 @@ export default class Browser {
|
||||
}
|
||||
|
||||
broadcast = <T extends MainBroadcastEventKey>(channel: T, data?: MainBroadcastParams<T>) => {
|
||||
if (this._browserWindow.isDestroyed()) return;
|
||||
|
||||
logger.debug(`Broadcasting to window ${this.identifier}, channel: ${channel}`);
|
||||
this._browserWindow.webContents.send(channel, data);
|
||||
};
|
||||
|
||||
@@ -0,0 +1,116 @@
|
||||
import { NetworkProxySettings } from '@lobechat/electron-client-ipc';
|
||||
import { Agent, ProxyAgent, getGlobalDispatcher, setGlobalDispatcher } from 'undici';
|
||||
|
||||
import { createLogger } from '@/utils/logger';
|
||||
|
||||
import { ProxyUrlBuilder } from './urlBuilder';
|
||||
|
||||
// Create logger
|
||||
const logger = createLogger('modules:networkProxy:dispatcher');
|
||||
|
||||
/**
|
||||
* 代理管理器
|
||||
*/
|
||||
export class ProxyDispatcherManager {
|
||||
private static isChanging = false;
|
||||
private static changeQueue: Array<() => Promise<void>> = [];
|
||||
|
||||
/**
|
||||
* 应用代理设置(带并发控制)
|
||||
*/
|
||||
static async applyProxySettings(config: NetworkProxySettings): Promise<void> {
|
||||
return new Promise((resolve, reject) => {
|
||||
const operation = async () => {
|
||||
try {
|
||||
await this.doApplyProxySettings(config);
|
||||
resolve();
|
||||
} catch (error) {
|
||||
reject(error);
|
||||
}
|
||||
};
|
||||
|
||||
if (this.isChanging) {
|
||||
// 如果正在切换,加入队列
|
||||
this.changeQueue.push(operation);
|
||||
} else {
|
||||
// 立即执行
|
||||
operation();
|
||||
}
|
||||
});
|
||||
}
|
||||
|
||||
/**
|
||||
* 执行代理设置应用
|
||||
*/
|
||||
private static async doApplyProxySettings(config: NetworkProxySettings): Promise<void> {
|
||||
this.isChanging = true;
|
||||
|
||||
try {
|
||||
const currentDispatcher = getGlobalDispatcher();
|
||||
|
||||
// 禁用代理,恢复默认连接
|
||||
if (!config.enableProxy) {
|
||||
await this.safeDestroyDispatcher(currentDispatcher);
|
||||
// 创建一个新的默认 Agent 来替代代理
|
||||
setGlobalDispatcher(new Agent());
|
||||
logger.debug('Proxy disabled, reset to direct connection mode');
|
||||
return;
|
||||
}
|
||||
|
||||
// 构建代理 URL
|
||||
const proxyUrl = ProxyUrlBuilder.build(config);
|
||||
|
||||
// 创建代理 agent
|
||||
const agent = this.createProxyAgent(config.proxyType, proxyUrl);
|
||||
|
||||
// 切换代理前销毁旧 dispatcher
|
||||
await this.safeDestroyDispatcher(currentDispatcher);
|
||||
setGlobalDispatcher(agent);
|
||||
|
||||
logger.info(
|
||||
`Proxy settings applied: ${config.proxyType}://${config.proxyServer}:${config.proxyPort}`,
|
||||
);
|
||||
logger.debug(
|
||||
'Global request proxy set, all Node.js network requests will go through this proxy',
|
||||
);
|
||||
} finally {
|
||||
this.isChanging = false;
|
||||
|
||||
// 处理队列中的下一个操作
|
||||
if (this.changeQueue.length > 0) {
|
||||
const nextOperation = this.changeQueue.shift();
|
||||
if (nextOperation) {
|
||||
setTimeout(() => nextOperation(), 0);
|
||||
}
|
||||
}
|
||||
}
|
||||
}
|
||||
|
||||
/**
|
||||
* 创建代理 agent
|
||||
*/
|
||||
static createProxyAgent(proxyType: string, proxyUrl: string) {
|
||||
try {
|
||||
// undici 的 ProxyAgent 支持 http, https 和 socks5
|
||||
return new ProxyAgent({ uri: proxyUrl });
|
||||
} catch (error) {
|
||||
logger.error(`Failed to create proxy agent for ${proxyType}:`, error);
|
||||
throw new Error(
|
||||
`Failed to create proxy agent: ${error instanceof Error ? error.message : 'Unknown error'}`,
|
||||
);
|
||||
}
|
||||
}
|
||||
|
||||
/**
|
||||
* 安全销毁 dispatcher
|
||||
*/
|
||||
private static async safeDestroyDispatcher(dispatcher: any): Promise<void> {
|
||||
try {
|
||||
if (dispatcher && typeof dispatcher.destroy === 'function') {
|
||||
await dispatcher.destroy();
|
||||
}
|
||||
} catch (error) {
|
||||
logger.warn('Failed to destroy dispatcher:', error);
|
||||
}
|
||||
}
|
||||
}
|
||||
@@ -0,0 +1,6 @@
|
||||
export { ProxyDispatcherManager } from './dispatcher';
|
||||
export type { ProxyTestResult } from './tester';
|
||||
export { ProxyConnectionTester } from './tester';
|
||||
export { ProxyUrlBuilder } from './urlBuilder';
|
||||
export type { ProxyValidationResult } from './validator';
|
||||
export { ProxyConfigValidator } from './validator';
|
||||
@@ -0,0 +1,163 @@
|
||||
import { NetworkProxySettings } from '@lobechat/electron-client-ipc';
|
||||
import { fetch, getGlobalDispatcher, setGlobalDispatcher } from 'undici';
|
||||
|
||||
import { createLogger } from '@/utils/logger';
|
||||
|
||||
import { ProxyDispatcherManager } from './dispatcher';
|
||||
import { ProxyUrlBuilder } from './urlBuilder';
|
||||
import { ProxyConfigValidator } from './validator';
|
||||
|
||||
// Create logger
|
||||
const logger = createLogger('modules:networkProxy:tester');
|
||||
|
||||
/**
|
||||
* 代理连接测试结果
|
||||
*/
|
||||
export interface ProxyTestResult {
|
||||
message?: string;
|
||||
responseTime?: number;
|
||||
success: boolean;
|
||||
}
|
||||
|
||||
/**
|
||||
* 代理连接测试器
|
||||
*/
|
||||
export class ProxyConnectionTester {
|
||||
private static readonly DEFAULT_TIMEOUT = 10_000; // 10秒超时
|
||||
private static readonly DEFAULT_TEST_URL = 'https://www.google.com';
|
||||
|
||||
/**
|
||||
* 测试代理连接
|
||||
*/
|
||||
static async testConnection(
|
||||
url: string = this.DEFAULT_TEST_URL,
|
||||
timeout: number = this.DEFAULT_TIMEOUT,
|
||||
): Promise<ProxyTestResult> {
|
||||
const startTime = Date.now();
|
||||
|
||||
try {
|
||||
logger.info(`Testing proxy connection with URL: ${url}`);
|
||||
|
||||
const controller = new AbortController();
|
||||
const timeoutId = setTimeout(() => controller.abort(), timeout);
|
||||
|
||||
const response = await fetch(url, {
|
||||
headers: {
|
||||
'User-Agent': 'LobeChat-Desktop/1.0.0',
|
||||
},
|
||||
signal: controller.signal,
|
||||
});
|
||||
|
||||
clearTimeout(timeoutId);
|
||||
|
||||
if (!response.ok) {
|
||||
throw new Error(`HTTP ${response.status}: ${response.statusText}`);
|
||||
}
|
||||
|
||||
const responseTime = Date.now() - startTime;
|
||||
|
||||
logger.info(`Proxy connection test successful, response time: ${responseTime}ms`);
|
||||
|
||||
return {
|
||||
responseTime,
|
||||
success: true,
|
||||
};
|
||||
} catch (error) {
|
||||
const responseTime = Date.now() - startTime;
|
||||
const errorMessage = error instanceof Error ? error.message : 'Unknown error';
|
||||
|
||||
logger.error(`Proxy connection test failed after ${responseTime}ms:`, errorMessage);
|
||||
|
||||
return {
|
||||
message: errorMessage,
|
||||
responseTime,
|
||||
success: false,
|
||||
};
|
||||
}
|
||||
}
|
||||
|
||||
/**
|
||||
* 测试指定代理配置的连接
|
||||
*/
|
||||
static async testProxyConfig(
|
||||
config: NetworkProxySettings,
|
||||
testUrl: string = this.DEFAULT_TEST_URL,
|
||||
): Promise<ProxyTestResult> {
|
||||
// 验证配置
|
||||
const validation = ProxyConfigValidator.validate(config);
|
||||
if (!validation.isValid) {
|
||||
return {
|
||||
message: `Invalid proxy configuration: ${validation.errors.join(', ')}`,
|
||||
success: false,
|
||||
};
|
||||
}
|
||||
|
||||
// 如果未启用代理,直接测试
|
||||
if (!config.enableProxy) {
|
||||
return this.testConnection(testUrl);
|
||||
}
|
||||
|
||||
// 创建临时代理 agent 进行测试
|
||||
try {
|
||||
const proxyUrl = ProxyUrlBuilder.build(config);
|
||||
logger.debug(`Testing proxy with URL: ${proxyUrl}`);
|
||||
|
||||
const agent = ProxyDispatcherManager.createProxyAgent(config.proxyType, proxyUrl);
|
||||
|
||||
const startTime = Date.now();
|
||||
const controller = new AbortController();
|
||||
const timeoutId = setTimeout(() => controller.abort(), this.DEFAULT_TIMEOUT);
|
||||
|
||||
// 临时设置代理进行测试
|
||||
const originalDispatcher = getGlobalDispatcher();
|
||||
setGlobalDispatcher(agent);
|
||||
|
||||
try {
|
||||
const response = await fetch(testUrl, {
|
||||
dispatcher: agent,
|
||||
headers: {
|
||||
'User-Agent': 'LobeChat-Desktop/1.0.0',
|
||||
},
|
||||
signal: controller.signal,
|
||||
});
|
||||
|
||||
clearTimeout(timeoutId);
|
||||
|
||||
if (!response.ok) {
|
||||
throw new Error(`HTTP ${response.status}: ${response.statusText}`);
|
||||
}
|
||||
|
||||
const responseTime = Date.now() - startTime;
|
||||
logger.info(`Proxy test successful, response time: ${responseTime}ms`);
|
||||
|
||||
return {
|
||||
responseTime,
|
||||
success: true,
|
||||
};
|
||||
} catch (fetchError) {
|
||||
clearTimeout(timeoutId);
|
||||
throw fetchError;
|
||||
} finally {
|
||||
// 恢复原来的 dispatcher
|
||||
setGlobalDispatcher(originalDispatcher);
|
||||
// 清理临时创建的代理 agent
|
||||
if (agent && typeof agent.destroy === 'function') {
|
||||
try {
|
||||
await agent.destroy();
|
||||
} catch (error) {
|
||||
logger.warn('Failed to destroy test agent:', error);
|
||||
}
|
||||
}
|
||||
}
|
||||
} catch (error) {
|
||||
const errorMessage = error instanceof Error ? error.message : 'Unknown error';
|
||||
|
||||
logger.error(`Proxy test failed: ${errorMessage}`, error);
|
||||
|
||||
return {
|
||||
message: `Proxy test failed: ${errorMessage}`,
|
||||
success: false,
|
||||
};
|
||||
}
|
||||
}
|
||||
}
|
||||
@@ -0,0 +1,25 @@
|
||||
import { NetworkProxySettings } from '@lobechat/electron-client-ipc';
|
||||
|
||||
/**
|
||||
* 代理 URL 构建器
|
||||
*/
|
||||
export const ProxyUrlBuilder = {
|
||||
/**
|
||||
* 构建代理 URL
|
||||
*/
|
||||
build(config: NetworkProxySettings): string {
|
||||
const { proxyType, proxyServer, proxyPort, proxyRequireAuth, proxyUsername, proxyPassword } =
|
||||
config;
|
||||
|
||||
let proxyUrl = `${proxyType}://${proxyServer}:${proxyPort}`;
|
||||
|
||||
// 添加认证信息
|
||||
if (proxyRequireAuth && proxyUsername && proxyPassword) {
|
||||
const encodedUsername = encodeURIComponent(proxyUsername);
|
||||
const encodedPassword = encodeURIComponent(proxyPassword);
|
||||
proxyUrl = `${proxyType}://${encodedUsername}:${encodedPassword}@${proxyServer}:${proxyPort}`;
|
||||
}
|
||||
|
||||
return proxyUrl;
|
||||
},
|
||||
};
|
||||
@@ -0,0 +1,80 @@
|
||||
import { NetworkProxySettings } from '@lobechat/electron-client-ipc';
|
||||
|
||||
/**
|
||||
* 代理配置验证结果
|
||||
*/
|
||||
export interface ProxyValidationResult {
|
||||
errors: string[];
|
||||
isValid: boolean;
|
||||
}
|
||||
|
||||
/**
|
||||
* 代理配置验证器
|
||||
*/
|
||||
export class ProxyConfigValidator {
|
||||
private static readonly SUPPORTED_TYPES = ['http', 'https', 'socks5'] as const;
|
||||
private static readonly DEFAULT_BYPASS = 'localhost,127.0.0.1,::1';
|
||||
|
||||
/**
|
||||
* 验证代理配置
|
||||
*/
|
||||
static validate(config: NetworkProxySettings): ProxyValidationResult {
|
||||
const errors: string[] = [];
|
||||
|
||||
// 如果未启用代理,跳过验证
|
||||
if (!config.enableProxy) {
|
||||
return { errors: [], isValid: true };
|
||||
}
|
||||
|
||||
// 验证代理类型
|
||||
if (!this.SUPPORTED_TYPES.includes(config.proxyType as any)) {
|
||||
errors.push(
|
||||
`Unsupported proxy type: ${config.proxyType}. Supported types: ${this.SUPPORTED_TYPES.join(', ')}`,
|
||||
);
|
||||
}
|
||||
|
||||
// 验证代理服务器
|
||||
if (!config.proxyServer?.trim()) {
|
||||
errors.push('Proxy server is required when proxy is enabled');
|
||||
} else if (!this.isValidHost(config.proxyServer)) {
|
||||
errors.push('Invalid proxy server format');
|
||||
}
|
||||
|
||||
// 验证代理端口
|
||||
if (!config.proxyPort?.trim()) {
|
||||
errors.push('Proxy port is required when proxy is enabled');
|
||||
} else {
|
||||
const port = parseInt(config.proxyPort, 10);
|
||||
if (isNaN(port) || port < 1 || port > 65_535) {
|
||||
errors.push('Proxy port must be a valid number between 1 and 65535');
|
||||
}
|
||||
}
|
||||
|
||||
// 验证认证信息
|
||||
if (config.proxyRequireAuth) {
|
||||
if (!config.proxyUsername?.trim()) {
|
||||
errors.push('Proxy username is required when authentication is enabled');
|
||||
}
|
||||
if (!config.proxyPassword?.trim()) {
|
||||
errors.push('Proxy password is required when authentication is enabled');
|
||||
}
|
||||
}
|
||||
|
||||
return {
|
||||
errors,
|
||||
isValid: errors.length === 0,
|
||||
};
|
||||
}
|
||||
|
||||
/**
|
||||
* 验证主机名格式
|
||||
*/
|
||||
private static isValidHost(host: string): boolean {
|
||||
// 简单的主机名验证(IP 地址或域名)
|
||||
const ipRegex = /^(\d{1,3}\.){3}\d{1,3}$/;
|
||||
const domainRegex =
|
||||
/^[\dA-Za-z]([\dA-Za-z-]*[\dA-Za-z])?(\.[\dA-Za-z]([\dA-Za-z-]*[\dA-Za-z])?)*$/;
|
||||
|
||||
return ipRegex.test(host) || domainRegex.test(host);
|
||||
}
|
||||
}
|
||||
@@ -1,4 +1,4 @@
|
||||
import { DataSyncConfig } from '@lobechat/electron-client-ipc';
|
||||
import { DataSyncConfig, NetworkProxySettings } from '@lobechat/electron-client-ipc';
|
||||
|
||||
export interface ElectronMainStore {
|
||||
dataSyncConfig: DataSyncConfig;
|
||||
@@ -7,6 +7,7 @@ export interface ElectronMainStore {
|
||||
refreshToken?: string;
|
||||
};
|
||||
locale: string;
|
||||
networkProxy: NetworkProxySettings;
|
||||
shortcuts: Record<string, string>;
|
||||
storagePath: string;
|
||||
}
|
||||
|
||||
@@ -19,8 +19,9 @@ export const createLogger = (namespace: string) => {
|
||||
error: (message, ...args) => {
|
||||
if (process.env.NODE_ENV === 'production') {
|
||||
electronLog.error(message, ...args);
|
||||
} else {
|
||||
console.error(message, ...args);
|
||||
}
|
||||
debugLogger(`ERROR: ${message}`, ...args);
|
||||
},
|
||||
info: (message, ...args) => {
|
||||
if (process.env.NODE_ENV === 'production') {
|
||||
|
||||
@@ -1,4 +1,75 @@
|
||||
[
|
||||
{
|
||||
"children": {
|
||||
"improvements": ["Fix discover translation."]
|
||||
},
|
||||
"date": "2025-07-14",
|
||||
"version": "1.98.1"
|
||||
},
|
||||
{
|
||||
"children": {
|
||||
"features": ["Add network proxy for desktop."]
|
||||
},
|
||||
"date": "2025-07-13",
|
||||
"version": "1.98.0"
|
||||
},
|
||||
{
|
||||
"children": {
|
||||
"improvements": ["Support Hunyuan A13B thinking model."]
|
||||
},
|
||||
"date": "2025-07-13",
|
||||
"version": "1.97.17"
|
||||
},
|
||||
{
|
||||
"children": {
|
||||
"improvements": ["Update i18n."]
|
||||
},
|
||||
"date": "2025-07-13",
|
||||
"version": "1.97.16"
|
||||
},
|
||||
{
|
||||
"children": {
|
||||
"fixes": ["Add vision support to Grok 4."]
|
||||
},
|
||||
"date": "2025-07-12",
|
||||
"version": "1.97.15"
|
||||
},
|
||||
{
|
||||
"children": {
|
||||
"fixes": ["Revert \"💄 style: Open new topic by tap Just Chat again\"."],
|
||||
"improvements": ["Add Kimi K2 model."]
|
||||
},
|
||||
"date": "2025-07-12",
|
||||
"version": "1.97.14"
|
||||
},
|
||||
{
|
||||
"children": {
|
||||
"improvements": ["Support new Doubao thinking models, update i18n."]
|
||||
},
|
||||
"date": "2025-07-12",
|
||||
"version": "1.97.13"
|
||||
},
|
||||
{
|
||||
"children": {
|
||||
"fixes": ["Grok-4 reasoning model universal matching."]
|
||||
},
|
||||
"date": "2025-07-11",
|
||||
"version": "1.97.12"
|
||||
},
|
||||
{
|
||||
"children": {
|
||||
"improvements": ["Open new topic by tap Just Chat again."]
|
||||
},
|
||||
"date": "2025-07-11",
|
||||
"version": "1.97.11"
|
||||
},
|
||||
{
|
||||
"children": {
|
||||
"improvements": ["Update i18n."]
|
||||
},
|
||||
"date": "2025-07-11",
|
||||
"version": "1.97.10"
|
||||
},
|
||||
{
|
||||
"children": {
|
||||
"improvements": ["Integrate Amazon Cognito for user authentication."]
|
||||
|
||||
@@ -46,6 +46,9 @@
|
||||
"reasoningEffort": {
|
||||
"title": "شدة الاستدلال"
|
||||
},
|
||||
"thinking": {
|
||||
"title": "مفتاح التفكير العميق"
|
||||
},
|
||||
"title": "وظائف توسيع النموذج"
|
||||
},
|
||||
"history": {
|
||||
|
||||
@@ -1,4 +1,43 @@
|
||||
{
|
||||
"proxy": {
|
||||
"auth": "يتطلب المصادقة",
|
||||
"authDesc": "إذا كان خادم الوكيل يتطلب اسم مستخدم وكلمة مرور",
|
||||
"authSettings": "إعدادات المصادقة",
|
||||
"basicSettings": "إعدادات الوكيل",
|
||||
"basicSettingsDesc": "تكوين معلمات اتصال خادم الوكيل",
|
||||
"bypass": "العناوين التي لا تستخدم الوكيل",
|
||||
"connectionTest": "اختبار الاتصال",
|
||||
"enable": "تفعيل الوكيل",
|
||||
"enableDesc": "عند التفعيل، سيتم الوصول إلى الشبكة عبر خادم الوكيل",
|
||||
"password": "كلمة المرور",
|
||||
"password_placeholder": "الرجاء إدخال كلمة المرور",
|
||||
"port": "المنفذ",
|
||||
"resetButton": "إعادة تعيين",
|
||||
"saveButton": "حفظ",
|
||||
"saveFailed": "فشل الحفظ: {{error}}",
|
||||
"saveSuccess": "تم حفظ إعدادات الوكيل بنجاح",
|
||||
"server": "عنوان الخادم",
|
||||
"testButton": "اختبار الاتصال",
|
||||
"testDescription": "اختبر الاتصال باستخدام إعدادات الوكيل الحالية للتحقق من صحة التكوين",
|
||||
"testFailed": "فشل الاتصال",
|
||||
"testSuccessWithTime": "تم اختبار الاتصال بنجاح، استغرق {{time}} مللي ثانية",
|
||||
"testUrl": "عنوان الاختبار",
|
||||
"testUrlPlaceholder": "الرجاء إدخال عنوان URL للاختبار",
|
||||
"testing": "جارٍ اختبار الاتصال...",
|
||||
"type": "نوع الوكيل",
|
||||
"unsavedChanges": "لديك تغييرات غير محفوظة",
|
||||
"username": "اسم المستخدم",
|
||||
"username_placeholder": "الرجاء إدخال اسم المستخدم",
|
||||
"validation": {
|
||||
"passwordRequired": "كلمة المرور مطلوبة عند تفعيل المصادقة",
|
||||
"portInvalid": "يجب أن يكون المنفذ رقمًا بين 1 و 65535",
|
||||
"portRequired": "المنفذ مطلوب عند تفعيل الوكيل",
|
||||
"serverInvalid": "يرجى إدخال عنوان خادم صالح (IP أو اسم نطاق)",
|
||||
"serverRequired": "عنوان الخادم مطلوب عند تفعيل الوكيل",
|
||||
"typeRequired": "نوع الوكيل مطلوب عند تفعيل الوكيل",
|
||||
"usernameRequired": "اسم المستخدم مطلوب عند تفعيل المصادقة"
|
||||
}
|
||||
},
|
||||
"remoteServer": {
|
||||
"authError": "فشل التفويض: {{error}}",
|
||||
"authPending": "يرجى إكمال التفويض في المتصفح",
|
||||
|
||||
+99
-45
@@ -71,44 +71,23 @@
|
||||
"DeepSeek-V3": {
|
||||
"description": "DeepSeek-V3 هو نموذج MoE تم تطويره ذاتيًا بواسطة شركة DeepSeek. حقق DeepSeek-V3 نتائج تقييم تفوقت على نماذج مفتوحة المصدر الأخرى مثل Qwen2.5-72B و Llama-3.1-405B، وفي الأداء ينافس النماذج المغلقة الرائدة عالميًا مثل GPT-4o و Claude-3.5-Sonnet."
|
||||
},
|
||||
"Doubao-1.5-thinking-pro-m": {
|
||||
"description": "Doubao-1.5 هو نموذج تفكير عميق جديد (نسخة m تأتي مع قدرة استدلال عميق متعددة الوسائط أصلية)، يظهر أداءً بارزًا في مجالات الرياضيات، البرمجة، الاستدلال العلمي، والكتابة الإبداعية، حيث حقق أو اقترب من المستوى الأول في عدة معايير مرموقة مثل AIME 2024، Codeforces، وGPQA. يدعم نافذة سياق تصل إلى 128k، وإخراج يصل إلى 16k."
|
||||
},
|
||||
"Doubao-1.5-thinking-vision-pro": {
|
||||
"description": "نموذج تفكير بصري عميق جديد، يتمتع بقدرات فهم واستدلال متعددة الوسائط أقوى، وقد حقق أداءً متميزًا في 37 من 59 معيار تقييم علني."
|
||||
},
|
||||
"Doubao-1.5-vision-pro": {
|
||||
"description": "Doubao-1.5-vision-pro هو نموذج كبير متعدد الوسائط تم ترقيته حديثًا، يدعم التعرف على الصور بدقة غير محدودة ونسب عرض إلى ارتفاع متطرفة، ويعزز قدرات الاستدلال البصري، التعرف على الوثائق، فهم المعلومات التفصيلية، واتباع التعليمات."
|
||||
},
|
||||
"Doubao-1.5-vision-pro-32k": {
|
||||
"description": "دو باو 1.5 فيجن برو هو نموذج كبير متعدد الوسائط تم تحديثه حديثًا، يدعم التعرف على الصور بدقة أي دقة ونسب عرض إلى ارتفاع متطرفة، مما يعزز القدرة على الاستدلال البصري، والتعرف على الوثائق، وفهم المعلومات التفصيلية، والامتثال للتعليمات."
|
||||
},
|
||||
"Doubao-lite-128k": {
|
||||
"description": "دو باو-لايت يوفر سرعة استجابة فائقة وقيمة جيدة للكلفة، ويقدم خيارات أكثر مرونة للعملاء في سيناريوهات مختلفة. يدعم الاستدلال والتنقيح بسعة سياق 128k."
|
||||
"description": "Doubao-lite يتميز بسرعة استجابة فائقة وقيمة أفضل مقابل المال، ويوفر خيارات أكثر مرونة للعملاء في سيناريوهات مختلفة. يدعم الاستدلال والتخصيص مع نافذة سياق 128k."
|
||||
},
|
||||
"Doubao-lite-32k": {
|
||||
"description": "دو باو-لايت يوفر سرعة استجابة فائقة وقيمة جيدة للكلفة، ويقدم خيارات أكثر مرونة للعملاء في سيناريوهات مختلفة. يدعم الاستدلال والتنقيح بسعة سياق 32k."
|
||||
"description": "Doubao-lite يتميز بسرعة استجابة فائقة وقيمة أفضل مقابل المال، ويوفر خيارات أكثر مرونة للعملاء في سيناريوهات مختلفة. يدعم الاستدلال والتخصيص مع نافذة سياق 32k."
|
||||
},
|
||||
"Doubao-lite-4k": {
|
||||
"description": "دو باو-لايت يوفر سرعة استجابة فائقة وقيمة جيدة للكلفة، ويقدم خيارات أكثر مرونة للعملاء في سيناريوهات مختلفة. يدعم الاستدلال والتنقيح بسعة سياق 4k."
|
||||
"description": "Doubao-lite يتميز بسرعة استجابة فائقة وقيمة أفضل مقابل المال، ويوفر خيارات أكثر مرونة للعملاء في سيناريوهات مختلفة. يدعم الاستدلال والتخصيص مع نافذة سياق 4k."
|
||||
},
|
||||
"Doubao-pro-128k": {
|
||||
"description": "النموذج الرئيسي الأفضل أداءً، مناسب لمعالجة المهام المعقدة، يقدم أداءً جيدًا في السيناريوهات مثل الاستجابة المرجعية، والتلخيص، والإبداع، وتصنيف النصوص، وألعاب الأدوار. يدعم الاستدلال والتنقيح بسعة سياق 128k."
|
||||
},
|
||||
"Doubao-pro-256k": {
|
||||
"description": "أفضل نموذج رئيسي من حيث الأداء، مناسب لمعالجة المهام المعقدة، حيث يظهر أداءً جيدًا في سيناريوهات مثل الأسئلة والأجوبة المرجعية، والتلخيص، والإبداع، وتصنيف النصوص، وأدوار الشخصيات. يدعم استدلال نافذة السياق 256k والتعديل الدقيق."
|
||||
"description": "النموذج الرئيسي الأكثر فعالية، مناسب لمعالجة المهام المعقدة، ويحقق أداءً ممتازًا في سيناريوهات مثل الأسئلة المرجعية، التلخيص، الإبداع، تصنيف النصوص، ولعب الأدوار. يدعم الاستدلال والتخصيص مع نافذة سياق 128k."
|
||||
},
|
||||
"Doubao-pro-32k": {
|
||||
"description": "النموذج الرئيسي الأفضل أداءً، مناسب لمعالجة المهام المعقدة، يقدم أداءً جيدًا في السيناريوهات مثل الاستجابة المرجعية، والتلخيص، والإبداع، وتصنيف النصوص، وألعاب الأدوار. يدعم الاستدلال والتنقيح بسعة سياق 32k."
|
||||
"description": "النموذج الرئيسي الأكثر فعالية، مناسب لمعالجة المهام المعقدة، ويحقق أداءً ممتازًا في سيناريوهات مثل الأسئلة المرجعية، التلخيص، الإبداع، تصنيف النصوص، ولعب الأدوار. يدعم الاستدلال والتخصيص مع نافذة سياق 32k."
|
||||
},
|
||||
"Doubao-pro-4k": {
|
||||
"description": "النموذج الرئيسي الأفضل أداءً، مناسب لمعالجة المهام المعقدة، يقدم أداءً جيدًا في السيناريوهات مثل الاستجابة المرجعية، والتلخيص، والإبداع، وتصنيف النصوص، وألعاب الأدوار. يدعم الاستدلال والتنقيح بسعة سياق 4k."
|
||||
},
|
||||
"Doubao-vision-lite-32k": {
|
||||
"description": "نموذج دو باو فيجن هو نموذج كبير متعدد الوسائط تم إطلاقه من قبل دو باو، يتمتع بقدرة قوية على فهم الصور والاستدلال، بالإضافة إلى القدرة الدقيقة على فهم التعليمات. أظهر النموذج أداءً قويًا في استخراج معلومات النصوص من الصور، ومهام الاستدلال المعتمدة على الصور، مما يجعله مناسبًا لمهام الأسئلة والأجوبة البصرية الأكثر تعقيدًا وعمومية."
|
||||
},
|
||||
"Doubao-vision-pro-32k": {
|
||||
"description": "نموذج دو باو فيجن هو نموذج كبير متعدد الوسائط تم إطلاقه من قبل دو باو، يتمتع بقدرة قوية على فهم الصور والاستدلال، بالإضافة إلى القدرة الدقيقة على فهم التعليمات. أظهر النموذج أداءً قويًا في استخراج معلومات النصوص من الصور، ومهام الاستدلال المعتمدة على الصور، مما يجعله مناسبًا لمهام الأسئلة والأجوبة البصرية الأكثر تعقيدًا وعمومية."
|
||||
"description": "النموذج الرئيسي الأكثر فعالية، مناسب لمعالجة المهام المعقدة، ويحقق أداءً ممتازًا في سيناريوهات مثل الأسئلة المرجعية، التلخيص، الإبداع، تصنيف النصوص، ولعب الأدوار. يدعم الاستدلال والتخصيص مع نافذة سياق 4k."
|
||||
},
|
||||
"ERNIE-3.5-128K": {
|
||||
"description": "نموذج اللغة الكبير الرائد الذي طورته بايدو، يغطي كمية هائلة من البيانات باللغة الصينية والإنجليزية، ويتميز بقدرات عامة قوية، يمكنه تلبية معظم متطلبات الحوار، والإجابة على الأسئلة، وإنشاء المحتوى، وتطبيقات الإضافات؛ يدعم الاتصال التلقائي بإضافات بحث بايدو، مما يضمن تحديث معلومات الإجابة."
|
||||
@@ -224,24 +203,21 @@
|
||||
"Pro/Qwen/Qwen2.5-VL-7B-Instruct": {
|
||||
"description": "Qwen2.5-VL هو العضو الجديد في سلسلة Qwen، يتمتع بقدرات فهم بصري قوية، يمكنه تحليل النصوص والرسوم البيانية والتخطيطات في الصور، وفهم مقاطع الفيديو الطويلة واستيعاب الأحداث. بإمكانه القيام بالاستدلال والتعامل مع الأدوات، يدعم تحديد الكائنات متعددة التنسيقات وإنشاء مخرجات منظمة، كما تم تحسين ديناميكية الدقة ومعدل الإطارات في التدريب لفهم الفيديو، مع تعزيز كفاءة مشفر الرؤية."
|
||||
},
|
||||
"Pro/THUDM/GLM-4.1V-9B-Thinking": {
|
||||
"description": "GLM-4.1V-9B-Thinking هو نموذج لغة بصري مفتوح المصدر (VLM) تم إصداره بشكل مشترك من قبل Zhizhu AI ومختبر KEG بجامعة تسينغهوا، مصمم خصيصًا لمعالجة المهام الإدراكية متعددة الوسائط المعقدة. يعتمد النموذج على النموذج الأساسي GLM-4-9B-0414، ومن خلال إدخال آلية الاستدلال \"سلسلة التفكير\" (Chain-of-Thought) واستخدام استراتيجيات التعلم المعزز، تم تحسين قدرته على الاستدلال عبر الوسائط واستقراره بشكل ملحوظ."
|
||||
},
|
||||
"Pro/THUDM/glm-4-9b-chat": {
|
||||
"description": "GLM-4-9B-Chat هو الإصدار مفتوح المصدر من نموذج GLM-4 الذي أطلقته Zhizhu AI. أظهر هذا النموذج أداءً ممتازًا في مجالات الدلالات، والرياضيات، والاستدلال، والشيفرة، والمعرفة. بالإضافة إلى دعم المحادثات متعددة الجولات، يتمتع GLM-4-9B-Chat أيضًا بميزات متقدمة مثل تصفح الويب، وتنفيذ الشيفرة، واستدعاء الأدوات المخصصة (Function Call)، والاستدلال على النصوص الطويلة. يدعم النموذج 26 لغة، بما في ذلك الصينية، والإنجليزية، واليابانية، والكورية، والألمانية. أظهر GLM-4-9B-Chat أداءً ممتازًا في العديد من اختبارات المعايير مثل AlignBench-v2 وMT-Bench وMMLU وC-Eval. يدعم النموذج طول سياق يصل إلى 128K، مما يجعله مناسبًا للأبحاث الأكاديمية والتطبيقات التجارية."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1": {
|
||||
"description": "DeepSeek-R1 هو نموذج استدلال مدفوع بالتعلم المعزز (RL)، يعالج مشكلات التكرار وقابلية القراءة في النموذج. قبل التعلم المعزز، أدخل DeepSeek-R1 بيانات بدء التشغيل الباردة، مما أدى إلى تحسين أداء الاستدلال. إنه يتفوق في المهام الرياضية، والبرمجة، والاستدلال مقارنةً بـ OpenAI-o1، وقد حسّن الأداء العام من خلال طرق تدريب مصممة بعناية."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1-0120": {
|
||||
"description": "DeepSeek-R1 هو نموذج استدلال مدفوع بالتعلم المعزز (RL)، يعالج مشاكل التكرار وقابلية القراءة في النماذج. قبل التعلم المعزز، أدخل DeepSeek-R1 بيانات بدء باردة لتحسين أداء الاستدلال. يظهر أداءً مماثلًا لـ OpenAI-o1 في مهام الرياضيات، البرمجة، والاستدلال، مع تحسينات شاملة بفضل طرق التدريب المصممة بعناية."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B": {
|
||||
"description": "DeepSeek-R1-Distill-Qwen-7B هو نموذج تم الحصول عليه من خلال تقطير المعرفة بناءً على Qwen2.5-Math-7B. تم ضبط هذا النموذج باستخدام 800 ألف عينة مختارة تم إنشاؤها بواسطة DeepSeek-R1، مما يظهر قدرات استدلالية ممتازة. أظهر أداءً متميزًا في العديد من الاختبارات المعيارية، حيث حقق دقة 92.8٪ في MATH-500، ومعدل نجاح 55.5٪ في AIME 2024، ودرجة 1189 في CodeForces، مما يظهر قدرات قوية في الرياضيات والبرمجة كنموذج بحجم 7B."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-V3": {
|
||||
"description": "DeepSeek-V3 هو نموذج لغوي مختلط الخبراء (MoE) يحتوي على 6710 مليار معلمة، يستخدم الانتباه المتعدد الرؤوس (MLA) وهيكل DeepSeekMoE، ويجمع بين استراتيجيات توازن الحمل بدون خسائر مساعدة، مما يحسن كفاءة الاستدلال والتدريب. تم تدريبه مسبقًا على 14.8 تريليون توكن عالية الجودة، وتم إجراء تعديل دقيق تحت الإشراف والتعلم المعزز، مما يجعل DeepSeek-V3 يتفوق على نماذج مفتوحة المصدر الأخرى، ويقترب من النماذج المغلقة الرائدة."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-V3-1226": {
|
||||
"description": "DeepSeek-V3 هو نموذج لغوي مختلط الخبراء (MoE) يحتوي على 6710 مليار معلمة، ويستخدم الانتباه المتعدد الرؤوس (MLA) وبنية DeepSeekMoE، مع دمج استراتيجية توازن الحمل بدون خسارة مساعدة، لتحسين كفاءة الاستدلال والتدريب. تم تدريبه مسبقًا على 14.8 تريليون توكن عالي الجودة، وتمت معالجته من خلال التعديل الإشرافي والتعلم المعزز، يتفوق DeepSeek-V3 في الأداء على النماذج مفتوحة المصدر الأخرى، ويقترب من النماذج المغلقة الرائدة."
|
||||
},
|
||||
"QwQ-32B-Preview": {
|
||||
"description": "QwQ-32B-Preview هو نموذج معالجة اللغة الطبيعية المبتكر، قادر على معالجة مهام توليد الحوار وفهم السياق بشكل فعال."
|
||||
},
|
||||
@@ -404,6 +380,9 @@
|
||||
"THUDM/GLM-4-9B-0414": {
|
||||
"description": "GLM-4-9B-0414 هو نموذج صغير من سلسلة GLM، يحتوي على 9 مليار معلمة. يرث هذا النموذج الخصائص التقنية من سلسلة GLM-4-32B، لكنه يوفر خيارات نشر أخف. على الرغم من حجمه الصغير، لا يزال GLM-4-9B-0414 يظهر قدرة ممتازة في توليد الأكواد، تصميم الويب، توليد الرسوم البيانية SVG، والكتابة المعتمدة على البحث."
|
||||
},
|
||||
"THUDM/GLM-4.1V-9B-Thinking": {
|
||||
"description": "GLM-4.1V-9B-Thinking هو نموذج لغة بصري مفتوح المصدر (VLM) تم إصداره بشكل مشترك من قبل Zhizhu AI ومختبر KEG بجامعة تسينغهوا، مصمم خصيصًا لمعالجة المهام الإدراكية متعددة الوسائط المعقدة. يعتمد النموذج على النموذج الأساسي GLM-4-9B-0414، ومن خلال إدخال آلية الاستدلال \"سلسلة التفكير\" (Chain-of-Thought) واستخدام استراتيجيات التعلم المعزز، تم تحسين قدرته على الاستدلال عبر الوسائط واستقراره بشكل ملحوظ."
|
||||
},
|
||||
"THUDM/GLM-Z1-32B-0414": {
|
||||
"description": "GLM-Z1-32B-0414 هو نموذج استدلال يتمتع بقدرة على التفكير العميق. تم تطوير هذا النموذج بناءً على GLM-4-32B-0414 من خلال بدء التشغيل البارد وتعزيز التعلم، وتم تدريبه بشكل إضافي في المهام الرياضية، البرمجية، والمنطقية. مقارنة بالنموذج الأساسي، حقق GLM-Z1-32B-0414 تحسينًا ملحوظًا في القدرة الرياضية وحل المهام المعقدة."
|
||||
},
|
||||
@@ -560,6 +539,9 @@
|
||||
"anthropic/claude-sonnet-4": {
|
||||
"description": "كلود سونيت 4 يمكنه إنتاج استجابات شبه فورية أو تفكير تدريجي مطول، حيث يمكن للمستخدمين رؤية هذه العمليات بوضوح. كما يمكن لمستخدمي API التحكم بدقة في مدة تفكير النموذج."
|
||||
},
|
||||
"ascend-tribe/pangu-pro-moe": {
|
||||
"description": "Pangu-Pro-MoE 72B-A16B هو نموذج لغة ضخم نادر التنشيط يحتوي على 72 مليار معلمة و16 مليار معلمة نشطة، يعتمد على بنية الخبراء المختلطين المجمعة (MoGE). في مرحلة اختيار الخبراء، يتم تجميع الخبراء وتقيد تنشيط عدد متساوٍ من الخبراء داخل كل مجموعة لكل رمز، مما يحقق توازنًا في تحميل الخبراء ويعزز بشكل كبير كفاءة نشر النموذج على منصة Ascend."
|
||||
},
|
||||
"aya": {
|
||||
"description": "Aya 23 هو نموذج متعدد اللغات أطلقته Cohere، يدعم 23 لغة، مما يسهل التطبيقات اللغوية المتنوعة."
|
||||
},
|
||||
@@ -569,6 +551,9 @@
|
||||
"baichuan/baichuan2-13b-chat": {
|
||||
"description": "Baichuan-13B هو نموذج لغوي كبير مفتوح المصدر قابل للاستخدام التجاري تم تطويره بواسطة Baichuan Intelligence، ويحتوي على 13 مليار معلمة، وقد حقق أفضل النتائج في المعايير الصينية والإنجليزية."
|
||||
},
|
||||
"baidu/ERNIE-4.5-300B-A47B": {
|
||||
"description": "ERNIE-4.5-300B-A47B هو نموذج لغة ضخم يعتمد على بنية الخبراء المختلطين (MoE) تم تطويره بواسطة شركة بايدو. يحتوي النموذج على 300 مليار معلمة إجمالاً، لكنه ينشط فقط 47 مليار معلمة لكل رمز أثناء الاستدلال، مما يوازن بين الأداء القوي والكفاءة الحسابية. كأحد النماذج الأساسية في سلسلة ERNIE 4.5، يظهر أداءً متميزًا في مهام فهم النصوص، التوليد، الاستدلال، والبرمجة. يستخدم النموذج طريقة تدريب مسبق مبتكرة متعددة الوسائط ومتغايرة تعتمد على MoE، من خلال التدريب المشترك للنصوص والوسائط البصرية، مما يعزز قدراته الشاملة، خاصة في الالتزام بالتعليمات وتذكر المعرفة العالمية."
|
||||
},
|
||||
"c4ai-aya-expanse-32b": {
|
||||
"description": "Aya Expanse هو نموذج متعدد اللغات عالي الأداء بسعة 32B، يهدف إلى تحدي أداء النماذج أحادية اللغة من خلال تحسين التعليمات، وتداول البيانات، وتدريب التفضيلات، وابتكارات دمج النماذج. يدعم 23 لغة."
|
||||
},
|
||||
@@ -726,7 +711,7 @@
|
||||
"description": "Compound-beta-mini هو نظام ذكاء اصطناعي مركب، مدعوم بنماذج مفتوحة متاحة في GroqCloud، يمكنه استخدام الأدوات بشكل ذكي وانتقائي للإجابة على استفسارات المستخدمين."
|
||||
},
|
||||
"computer-use-preview": {
|
||||
"description": "نموذج computer-use-preview هو نموذج مخصص مصمم خصيصًا لـ \"أدوات استخدام الكمبيوتر\"، تم تدريبه لفهم وتنفيذ المهام المتعلقة بالكمبيوتر."
|
||||
"description": "نموذج computer-use-preview هو نموذج مخصص لأدوات \"استخدام الحاسوب\"، تم تدريبه لفهم وتنفيذ المهام المتعلقة بالحاسوب."
|
||||
},
|
||||
"dall-e-2": {
|
||||
"description": "النموذج الثاني من DALL·E، يدعم توليد صور أكثر واقعية ودقة، بدقة تعادل أربعة أضعاف الجيل الأول."
|
||||
@@ -914,17 +899,53 @@
|
||||
"doubao-1.5-thinking-pro": {
|
||||
"description": "نموذج Doubao-1.5 الجديد للتفكير العميق، يتميز بأداء بارز في مجالات الرياضيات، البرمجة، الاستدلال العلمي، وكذلك في المهام العامة مثل الكتابة الإبداعية. حقق أو اقترب من المستوى الأول في العديد من المعايير المرموقة مثل AIME 2024 وCodeforces وGPQA. يدعم نافذة سياق بحجم 128k و16k للإخراج."
|
||||
},
|
||||
"doubao-1.5-thinking-pro-m": {
|
||||
"description": "نموذج التفكير العميق الجديد Doubao-1.5 (الإصدار m مزود بقدرات استدلال متعددة الوسائط أصلية)، يتميز بأداء بارز في المجالات المتخصصة مثل الرياضيات، البرمجة، الاستدلال العلمي، والمهام العامة مثل الكتابة الإبداعية. وصل أو اقترب من المستوى الأول في معايير AIME 2024، Codeforces، GPQA وغيرها. يدعم نافذة سياق 128k وإخراج 16k."
|
||||
},
|
||||
"doubao-1.5-thinking-vision-pro": {
|
||||
"description": "نموذج التفكير العميق البصري الجديد، يتمتع بقدرات فهم واستدلال متعددة الوسائط عامة أقوى، وحقق أداءً متفوقًا في 37 من أصل 59 معيار تقييم عام."
|
||||
},
|
||||
"doubao-1.5-ui-tars": {
|
||||
"description": "Doubao-1.5-UI-TARS هو نموذج وكيل موجه أصلاً للتفاعل مع واجهات المستخدم الرسومية (GUI). يتفاعل بسلاسة مع GUI من خلال قدرات شبيهة بالبشر في الإدراك، الاستدلال، والعمل."
|
||||
},
|
||||
"doubao-1.5-vision-lite": {
|
||||
"description": "Doubao-1.5-vision-lite هو نموذج كبير متعدد الوسائط تم ترقيته حديثًا، يدعم التعرف على الصور بدقة غير محدودة ونسب عرض إلى ارتفاع متطرفة، ويعزز قدرات الاستدلال البصري، التعرف على الوثائق، فهم المعلومات التفصيلية، واتباع التعليمات. يدعم نافذة سياق 128k، وطول الإخراج يدعم حتى 16k توكن."
|
||||
},
|
||||
"doubao-1.5-vision-pro": {
|
||||
"description": "نموذج متعدد الوسائط مطور Doubao-1.5-vision-pro يدعم التعرف على الصور بأي دقة ونسب أبعاد متطرفة، معزّز بقدرات الاستدلال البصري، التعرف على الوثائق، فهم التفاصيل، والامتثال للتعليمات."
|
||||
},
|
||||
"doubao-1.5-vision-pro-32k": {
|
||||
"description": "نموذج متعدد الوسائط مطور Doubao-1.5-vision-pro يدعم التعرف على الصور بأي دقة ونسب أبعاد متطرفة، معزّز بقدرات الاستدلال البصري، التعرف على الوثائق، فهم التفاصيل، والامتثال للتعليمات."
|
||||
},
|
||||
"doubao-lite-128k": {
|
||||
"description": "يتميز بسرعة استجابة فائقة وقيمة أفضل مقابل المال، ويوفر خيارات أكثر مرونة للعملاء في سيناريوهات مختلفة. يدعم الاستدلال والتخصيص مع نافذة سياق 128k."
|
||||
},
|
||||
"doubao-lite-32k": {
|
||||
"description": "يتميز بسرعة استجابة فائقة وقيمة أفضل مقابل المال، ويوفر خيارات أكثر مرونة للعملاء في سيناريوهات مختلفة. يدعم الاستدلال والتخصيص مع نافذة سياق 32k."
|
||||
},
|
||||
"doubao-lite-4k": {
|
||||
"description": "يتميز بسرعة استجابة فائقة وقيمة أفضل مقابل المال، ويوفر خيارات أكثر مرونة للعملاء في سيناريوهات مختلفة. يدعم الاستدلال والتخصيص مع نافذة سياق 4k."
|
||||
},
|
||||
"doubao-pro-256k": {
|
||||
"description": "النموذج الرئيسي الأكثر فعالية، مناسب لمعالجة المهام المعقدة، ويحقق أداءً ممتازًا في سيناريوهات مثل الأسئلة المرجعية، التلخيص، الإبداع، تصنيف النصوص، ولعب الأدوار. يدعم الاستدلال والتخصيص مع نافذة سياق 256k."
|
||||
},
|
||||
"doubao-pro-32k": {
|
||||
"description": "النموذج الرئيسي الأكثر فعالية، مناسب لمعالجة المهام المعقدة، ويحقق أداءً ممتازًا في سيناريوهات مثل الأسئلة المرجعية، التلخيص، الإبداع، تصنيف النصوص، ولعب الأدوار. يدعم الاستدلال والتخصيص مع نافذة سياق 32k."
|
||||
},
|
||||
"doubao-seed-1.6": {
|
||||
"description": "نموذج Doubao-Seed-1.6 متعدد الوسائط للتفكير العميق، يدعم ثلاثة أوضاع تفكير: تلقائي/تفكير/عدم تفكير. في وضع عدم التفكير، يتحسن أداء النموذج بشكل كبير مقارنة بـ Doubao-1.5-pro/250115. يدعم نافذة سياق تصل إلى 256k وطول إخراج يصل إلى 16k رمز."
|
||||
"description": "نموذج Doubao-Seed-1.6 متعدد الوسائط للتفكير العميق، يدعم ثلاثة أوضاع تفكير: تلقائي/تفكير/عدم تفكير. في وضع عدم التفكير، يتحسن أداء النموذج بشكل كبير مقارنة بـ Doubao-1.5-pro/250115. يدعم نافذة سياق بحجم 256k وطول إخراج يصل إلى 16k رمز."
|
||||
},
|
||||
"doubao-seed-1.6-flash": {
|
||||
"description": "نموذج Doubao-Seed-1.6-flash هو نموذج متعدد الوسائط للتفكير العميق بسرعات استدلال فائقة، حيث يحتاج TPOT فقط إلى 10 مللي ثانية؛ يدعم فهم النصوص والرؤية، وتفوق قدرات فهم النصوص على الجيل السابق lite، وفهم الرؤية يضاهي نماذج pro المنافسة. يدعم نافذة سياق تصل إلى 256k وطول إخراج يصل إلى 16k رمز."
|
||||
"description": "نموذج Doubao-Seed-1.6-flash للتفكير العميق متعدد الوسائط مع سرعة استدلال فائقة، حيث يحتاج TPOT فقط إلى 10 مللي ثانية؛ يدعم فهم النصوص والرؤية، وتفوق قدرات فهم النصوص على الجيل السابق lite، وفهم الرؤية يضاهي نماذج pro المنافسة. يدعم نافذة سياق بحجم 256k وطول إخراج يصل إلى 16k رمز."
|
||||
},
|
||||
"doubao-seed-1.6-thinking": {
|
||||
"description": "نموذج Doubao-Seed-1.6-thinking يعزز قدرات التفكير بشكل كبير، مقارنة بـ Doubao-1.5-thinking-pro، مع تحسينات إضافية في القدرات الأساسية مثل البرمجة والرياضيات والاستدلال المنطقي، ويدعم الفهم البصري. يدعم نافذة سياق تصل إلى 256k وطول إخراج يصل إلى 16k رمز."
|
||||
"description": "نموذج Doubao-Seed-1.6-thinking يعزز قدرات التفكير بشكل كبير، مقارنة بـ Doubao-1.5-thinking-pro، مع تحسينات إضافية في القدرات الأساسية مثل البرمجة والرياضيات والاستدلال المنطقي، ويدعم الفهم البصري. يدعم نافذة سياق بحجم 256k وطول إخراج يصل إلى 16k رمز."
|
||||
},
|
||||
"doubao-vision-lite-32k": {
|
||||
"description": "نموذج Doubao-vision هو نموذج متعدد الوسائط أطلقته Doubao، يتمتع بقدرات قوية في فهم الصور والاستدلال، بالإضافة إلى دقة عالية في فهم التعليمات. أظهر النموذج أداءً قويًا في استخراج المعلومات من النصوص والصور، والمهام الاستدلالية القائمة على الصور، مما يجعله مناسبًا لمهام الأسئلة البصرية المعقدة والواسعة."
|
||||
},
|
||||
"doubao-vision-pro-32k": {
|
||||
"description": "نموذج Doubao-vision هو نموذج متعدد الوسائط أطلقته Doubao، يتمتع بقدرات قوية في فهم الصور والاستدلال، بالإضافة إلى دقة عالية في فهم التعليمات. أظهر النموذج أداءً قويًا في استخراج المعلومات من النصوص والصور، والمهام الاستدلالية القائمة على الصور، مما يجعله مناسبًا لمهام الأسئلة البصرية المعقدة والواسعة."
|
||||
},
|
||||
"emohaa": {
|
||||
"description": "Emohaa هو نموذج نفسي، يتمتع بقدرات استشارية متخصصة، يساعد المستخدمين في فهم القضايا العاطفية."
|
||||
@@ -1082,9 +1103,6 @@
|
||||
"gemini-2.5-pro": {
|
||||
"description": "Gemini 2.5 Pro هو نموذج التفكير الأكثر تقدمًا من Google، قادر على استدلال المشكلات المعقدة في البرمجة والرياضيات ومجالات STEM، بالإضافة إلى تحليل مجموعات البيانات الكبيرة ومستودعات الأكواد والوثائق باستخدام سياق طويل."
|
||||
},
|
||||
"gemini-2.5-pro-exp-03-25": {
|
||||
"description": "نموذج Gemini 2.5 Pro التجريبي هو الأكثر تقدمًا من Google، قادر على استنتاج المشكلات المعقدة في البرمجة والرياضيات وعلوم STEM، بالإضافة إلى تحليل مجموعات البيانات الكبيرة ومكتبات الشيفرات والمستندات باستخدام سياقات طويلة."
|
||||
},
|
||||
"gemini-2.5-pro-preview-03-25": {
|
||||
"description": "معاينة Gemini 2.5 Pro هي نموذج التفكير الأكثر تقدمًا من Google، قادر على الاستدلال حول الشيفرات، الرياضيات، والمشكلات المعقدة في مجالات STEM، بالإضافة إلى تحليل مجموعات البيانات الكبيرة، مكتبات الشيفرات، والمستندات باستخدام سياقات طويلة."
|
||||
},
|
||||
@@ -1151,6 +1169,12 @@
|
||||
"glm-4-plus": {
|
||||
"description": "GLM-4-Plus كنموذج رائد ذكي، يتمتع بقدرات قوية في معالجة النصوص الطويلة والمهام المعقدة، مع تحسين شامل في الأداء."
|
||||
},
|
||||
"glm-4.1v-thinking-flash": {
|
||||
"description": "سلسلة نماذج GLM-4.1V-Thinking هي أقوى نماذج اللغة البصرية المعروفة على مستوى 10 مليارات معلمة، وتدمج مهام اللغة البصرية المتقدمة من نفس المستوى، بما في ذلك فهم الفيديو، الأسئلة والأجوبة على الصور، حل المسائل العلمية، التعرف على النصوص OCR، تفسير الوثائق والرسوم البيانية، وكلاء واجهة المستخدم الرسومية، ترميز صفحات الويب الأمامية، والتثبيت الأرضي، وغيرها. تتفوق قدرات هذه المهام على نموذج Qwen2.5-VL-72B الذي يحتوي على أكثر من 8 أضعاف عدد المعلمات. من خلال تقنيات التعلم المعزز الرائدة، يتقن النموذج تحسين دقة وإثراء الإجابات عبر استدلال سلسلة التفكير، متفوقًا بشكل ملحوظ على النماذج التقليدية غير المعتمدة على التفكير من حيث النتائج النهائية وقابلية التفسير."
|
||||
},
|
||||
"glm-4.1v-thinking-flashx": {
|
||||
"description": "سلسلة نماذج GLM-4.1V-Thinking هي أقوى نماذج اللغة البصرية المعروفة على مستوى 10 مليارات معلمة، وتدمج مهام اللغة البصرية المتقدمة من نفس المستوى، بما في ذلك فهم الفيديو، الأسئلة والأجوبة على الصور، حل المسائل العلمية، التعرف على النصوص OCR، تفسير الوثائق والرسوم البيانية، وكلاء واجهة المستخدم الرسومية، ترميز صفحات الويب الأمامية، والتثبيت الأرضي، وغيرها. تتفوق قدرات هذه المهام على نموذج Qwen2.5-VL-72B الذي يحتوي على أكثر من 8 أضعاف عدد المعلمات. من خلال تقنيات التعلم المعزز الرائدة، يتقن النموذج تحسين دقة وإثراء الإجابات عبر استدلال سلسلة التفكير، متفوقًا بشكل ملحوظ على النماذج التقليدية غير المعتمدة على التفكير من حيث النتائج النهائية وقابلية التفسير."
|
||||
},
|
||||
"glm-4v": {
|
||||
"description": "GLM-4V يوفر قدرات قوية في فهم الصور والاستدلال، ويدعم مجموعة متنوعة من المهام البصرية."
|
||||
},
|
||||
@@ -1172,6 +1196,9 @@
|
||||
"glm-z1-flash": {
|
||||
"description": "سلسلة GLM-Z1 تتمتع بقدرة استدلال معقدة قوية، تظهر أداءً ممتازًا في مجالات الاستدلال المنطقي، الرياضيات، والبرمجة. الحد الأقصى لطول السياق هو 32K."
|
||||
},
|
||||
"glm-z1-flashx": {
|
||||
"description": "سرعة عالية وتكلفة منخفضة: نسخة محسنة من Flash، سرعة استدلال فائقة، وضمان تزامن أسرع."
|
||||
},
|
||||
"glm-zero-preview": {
|
||||
"description": "يمتلك GLM-Zero-Preview قدرة قوية على الاستدلال المعقد، ويظهر أداءً ممتازًا في مجالات الاستدلال المنطقي، والرياضيات، والبرمجة."
|
||||
},
|
||||
@@ -1223,6 +1250,9 @@
|
||||
"google/gemma-2b-it": {
|
||||
"description": "Gemma Instruct (2B) يوفر قدرة أساسية على معالجة التعليمات، مناسب للتطبيقات الخفيفة."
|
||||
},
|
||||
"google/gemma-3-1b-it": {
|
||||
"description": "Gemma 3 1B هو نموذج لغة مفتوح المصدر من جوجل، وضع معايير جديدة في الكفاءة والأداء."
|
||||
},
|
||||
"google/gemma-3-27b-it": {
|
||||
"description": "جيمّا 3 27B هو نموذج لغوي مفتوح المصدر من جوجل، وقد وضع معايير جديدة من حيث الكفاءة والأداء."
|
||||
},
|
||||
@@ -1313,6 +1343,9 @@
|
||||
"gpt-4o-mini-search-preview": {
|
||||
"description": "نسخة معاينة بحث GPT-4o mini هي نموذج مدرب خصيصًا لفهم وتنفيذ استعلامات البحث على الويب، باستخدام واجهة برمجة تطبيقات Chat Completions. بالإضافة إلى رسوم الرموز، يتم فرض رسوم على استعلامات البحث على الويب لكل استدعاء أداة."
|
||||
},
|
||||
"gpt-4o-mini-transcribe": {
|
||||
"description": "GPT-4o Mini Transcribe هو نموذج تحويل الصوت إلى نص يستخدم GPT-4o لتفريغ الصوت. مقارنةً بنموذج Whisper الأصلي، يحسن معدل الخطأ في الكلمات ويعزز التعرف على اللغة والدقة. استخدمه للحصول على تفريغ أكثر دقة."
|
||||
},
|
||||
"gpt-4o-mini-tts": {
|
||||
"description": "GPT-4o mini TTS هو نموذج تحويل النص إلى كلام، مبني على GPT-4o mini، يقدم إنتاج كلمات صوتية عالية الجودة بسعر أقل."
|
||||
},
|
||||
@@ -1322,12 +1355,15 @@
|
||||
"gpt-4o-realtime-preview-2024-10-01": {
|
||||
"description": "الإصدار الفوري من GPT-4o، يدعم إدخال وإخراج الصوت والنص في الوقت الحقيقي."
|
||||
},
|
||||
"gpt-4o-realtime-preview-2024-12-17": {
|
||||
"description": "الإصدار الفوري من GPT-4o، يدعم إدخال وإخراج الصوت والنص في الوقت الحقيقي."
|
||||
"gpt-4o-realtime-preview-2025-06-03": {
|
||||
"description": "نسخة GPT-4o الحية، تدعم الإدخال والإخراج الصوتي والنصي في الوقت الحقيقي."
|
||||
},
|
||||
"gpt-4o-search-preview": {
|
||||
"description": "نسخة معاينة بحث GPT-4o هي نموذج مدرب خصيصًا لفهم وتنفيذ استعلامات البحث على الويب، باستخدام واجهة برمجة تطبيقات Chat Completions. بالإضافة إلى رسوم الرموز، يتم فرض رسوم على استعلامات البحث على الويب لكل استدعاء أداة."
|
||||
},
|
||||
"gpt-4o-transcribe": {
|
||||
"description": "GPT-4o Transcribe هو نموذج تحويل الصوت إلى نص يستخدم GPT-4o لتفريغ الصوت. مقارنةً بنموذج Whisper الأصلي، يحسن معدل الخطأ في الكلمات ويعزز التعرف على اللغة والدقة. استخدمه للحصول على تفريغ أكثر دقة."
|
||||
},
|
||||
"grok-2-1212": {
|
||||
"description": "لقد تم تحسين هذا النموذج في الدقة، والامتثال للتعليمات، والقدرة على التعامل مع لغات متعددة."
|
||||
},
|
||||
@@ -1346,9 +1382,15 @@
|
||||
"grok-3-mini-fast": {
|
||||
"description": "نموذج خفيف الوزن، يفكر قبل المحادثة. سريع وذكي، مناسب للمهام المنطقية التي لا تتطلب معرفة متخصصة عميقة، ويستطيع تتبع مسار التفكير الأصلي."
|
||||
},
|
||||
"grok-4": {
|
||||
"description": "نموذجنا الرائد الأحدث والأقوى، يتميز بأداء ممتاز في معالجة اللغة الطبيعية، الحسابات الرياضية، والاستدلال — إنه لاعب شامل مثالي."
|
||||
},
|
||||
"gryphe/mythomax-l2-13b": {
|
||||
"description": "MythoMax l2 13B هو نموذج لغوي يجمع بين الإبداع والذكاء من خلال دمج عدة نماذج رائدة."
|
||||
},
|
||||
"hunyuan-a13b": {
|
||||
"description": "هو أول نموذج استدلال مختلط من Hunyuan، نسخة مطورة من hunyuan-standard-256K، يحتوي على 80 مليار معلمة و13 مليار معلمة نشطة. الوضع الافتراضي هو وضع التفكير البطيء، ويدعم التبديل بين أوضاع التفكير السريع والبطيء عبر المعلمات أو التعليمات، حيث يتم التبديل بإضافة / no_think قبل الاستعلام. تم تحسين القدرات الشاملة مقارنة بالجيل السابق، مع تحسينات ملحوظة في الرياضيات، العلوم، فهم النصوص الطويلة، وقدرات الوكيل."
|
||||
},
|
||||
"hunyuan-code": {
|
||||
"description": "نموذج توليد الشيفرة الأحدث من Hunyuan، تم تدريبه على نموذج أساسي من بيانات الشيفرة عالية الجودة بحجم 200B، مع تدريب عالي الجودة على بيانات SFT لمدة ستة أشهر، وزيادة طول نافذة السياق إلى 8K، ويحتل مرتبة متقدمة في مؤشرات التقييم التلقائي لتوليد الشيفرة في خمس لغات؛ كما أنه في الطليعة في تقييمات الشيفرة عالية الجودة عبر عشرة معايير في خمس لغات."
|
||||
},
|
||||
@@ -1400,6 +1442,9 @@
|
||||
"hunyuan-t1-vision": {
|
||||
"description": "نموذج تفكير عميق متعدد الوسائط من Hunyuan، يدعم سلاسل التفكير الأصلية متعددة الوسائط، بارع في معالجة مختلف سيناريوهات الاستدلال على الصور، ويحقق تحسينًا شاملاً مقارنة بنموذج التفكير السريع في مسائل العلوم."
|
||||
},
|
||||
"hunyuan-t1-vision-20250619": {
|
||||
"description": "أحدث نموذج تفكير عميق متعدد الوسائط t1-vision من Hunyuan، يدعم سلسلة التفكير الأصلية متعددة الوسائط، مع تحسين شامل مقارنة بالإصدار الافتراضي السابق."
|
||||
},
|
||||
"hunyuan-turbo": {
|
||||
"description": "نسخة المعاينة من الجيل الجديد من نموذج اللغة الكبير، يستخدم هيكل نموذج الخبراء المختلط (MoE) الجديد، مما يوفر كفاءة استدلال أسرع وأداء أقوى مقارنة بـ hunyuan-pro."
|
||||
},
|
||||
@@ -1430,6 +1475,12 @@
|
||||
"hunyuan-turbos-role-plus": {
|
||||
"description": "أحدث نموذج تمثيل الأدوار من Hunyuan، نموذج تم تدريبه بدقة من قبل Hunyuan الرسمي، يعتمد على نموذج Hunyuan مع بيانات مشاهد تمثيل الأدوار للتدريب الإضافي، ويقدم أداءً أساسيًا أفضل في مشاهد تمثيل الأدوار."
|
||||
},
|
||||
"hunyuan-turbos-vision": {
|
||||
"description": "هذا النموذج مناسب لمشاهد فهم النصوص والصور، وهو نموذج اللغة البصرية الرائد من الجيل الجديد المبني على أحدث إصدار من Hunyuan turbos، يركز على مهام فهم النصوص والصور، بما في ذلك التعرف على الكيانات بناءً على الصور، الأسئلة المعرفية، إنشاء النصوص، وحل المسائل عبر التصوير، مع تحسين شامل مقارنة بالجيل السابق."
|
||||
},
|
||||
"hunyuan-turbos-vision-20250619": {
|
||||
"description": "أحدث نموذج رائد للغة البصرية turbos-vision من Hunyuan، مع تحسين شامل في مهام فهم النصوص والصور، بما في ذلك التعرف على الكيانات بناءً على الصور، الأسئلة المعرفية، إنشاء النصوص، وحل المسائل عبر التصوير، مقارنة بالإصدار الافتراضي السابق."
|
||||
},
|
||||
"hunyuan-vision": {
|
||||
"description": "نموذج Hunyuan الأحدث متعدد الوسائط، يدعم إدخال الصور والنصوص لتوليد محتوى نصي."
|
||||
},
|
||||
@@ -1457,6 +1508,9 @@
|
||||
"jina-deepsearch-v1": {
|
||||
"description": "البحث العميق يجمع بين البحث عبر الإنترنت، والقراءة، والاستدلال، مما يتيح إجراء تحقيق شامل. يمكنك اعتباره وكيلًا يتولى مهام البحث الخاصة بك - حيث يقوم بإجراء بحث واسع النطاق ويخضع لعدة تكرارات قبل تقديم الإجابة. تتضمن هذه العملية بحثًا مستمرًا، واستدلالًا، وحل المشكلات من زوايا متعددة. وهذا يختلف اختلافًا جوهريًا عن النماذج الكبيرة القياسية التي تولد الإجابات مباشرة من البيانات المدربة مسبقًا، وكذلك عن أنظمة RAG التقليدية التي تعتمد على البحث السطحي لمرة واحدة."
|
||||
},
|
||||
"kimi-k2-0711-preview": {
|
||||
"description": "kimi-k2 هو نموذج أساسي بمعمارية MoE يتمتع بقدرات فائقة في البرمجة والوكيل، مع إجمالي 1 تريليون معلمة و32 مليار معلمة مفعلة. في اختبارات الأداء الأساسية في مجالات المعرفة العامة، البرمجة، الرياضيات، والوكيل، يتفوق نموذج K2 على النماذج المفتوحة المصدر الرئيسية الأخرى."
|
||||
},
|
||||
"kimi-latest": {
|
||||
"description": "يستخدم منتج كيمي المساعد الذكي أحدث نموذج كبير من كيمي، وقد يحتوي على ميزات لم تستقر بعد. يدعم فهم الصور، وسيختار تلقائيًا نموذج 8k/32k/128k كنموذج للتسعير بناءً على طول سياق الطلب."
|
||||
},
|
||||
@@ -1869,7 +1923,7 @@
|
||||
"description": "o1 هو نموذج استدلال جديد من OpenAI، مناسب للمهام المعقدة التي تتطلب معرفة عامة واسعة. يحتوي هذا النموذج على 128K من السياق وتاريخ انتهاء المعرفة في أكتوبر 2023."
|
||||
},
|
||||
"o1-pro": {
|
||||
"description": "سلسلة نماذج o1 مدربة بالتعلم المعزز، قادرة على التفكير قبل الإجابة وتنفيذ مهام استدلال معقدة. يستخدم نموذج o1-pro موارد حسابية أكبر للتفكير بشكل أعمق، مما يضمن تقديم إجابات ذات جودة أعلى باستمرار."
|
||||
"description": "نماذج سلسلة o1 مدربة بالتعلم المعزز، قادرة على التفكير قبل الإجابة وتنفيذ مهام استدلال معقدة. يستخدم نموذج o1-pro موارد حسابية أكبر للتفكير الأعمق، مما يضمن تقديم إجابات ذات جودة أعلى باستمرار."
|
||||
},
|
||||
"o3": {
|
||||
"description": "o3 هو نموذج قوي شامل، يظهر أداءً ممتازًا في مجالات متعددة. يضع معايير جديدة في المهام الرياضية، العلمية، البرمجية، واستدلال الرؤية. كما أنه بارع في الكتابة التقنية واتباع التعليمات. يمكن للمستخدمين استخدامه لتحليل النصوص، الأكواد، والصور، وحل المشكلات المعقدة متعددة الخطوات."
|
||||
@@ -1881,7 +1935,7 @@
|
||||
"description": "o3-mini هو أحدث نموذج استدلال صغير لدينا، يقدم ذكاءً عالياً تحت نفس تكاليف التأخير والأداء مثل o1-mini."
|
||||
},
|
||||
"o3-pro": {
|
||||
"description": "نموذج o3-pro يستخدم المزيد من الحسابات للتفكير بشكل أعمق وتقديم إجابات أفضل دائمًا، ويدعم فقط الاستخدام ضمن Responses API."
|
||||
"description": "نموذج o3-pro يستخدم موارد حسابية أكبر للتفكير الأعمق وتقديم إجابات أفضل باستمرار، ويدعم الاستخدام فقط عبر واجهة برمجة التطبيقات Responses API."
|
||||
},
|
||||
"o4-mini": {
|
||||
"description": "o4-mini هو أحدث نموذج صغير من سلسلة o. تم تحسينه للاستدلال السريع والفعال، ويظهر كفاءة وأداء عاليين في المهام البرمجية والرؤية."
|
||||
@@ -2349,7 +2403,7 @@
|
||||
"description": "نموذج v0-1.5-md مناسب للمهام اليومية وتوليد واجهات المستخدم (UI)"
|
||||
},
|
||||
"whisper-1": {
|
||||
"description": "نموذج التعرف على الصوت العام، يدعم التعرف على الصوت متعدد اللغات، والترجمة الصوتية، والتعرف على اللغات."
|
||||
"description": "نموذج التعرف على الصوت العام، يدعم التعرف على الصوت بعدة لغات، الترجمة الصوتية، والتعرف على اللغة."
|
||||
},
|
||||
"wizardlm2": {
|
||||
"description": "WizardLM 2 هو نموذج لغوي تقدمه Microsoft AI، يتميز بأداء ممتاز في الحوار المعقد، واللغات المتعددة، والاستدلال، والمساعدين الذكيين."
|
||||
|
||||
@@ -520,6 +520,7 @@
|
||||
"hotkey": "اختصارات لوحة المفاتيح",
|
||||
"llm": "نموذج اللغة",
|
||||
"provider": "مزود خدمة الذكاء الاصطناعي",
|
||||
"proxy": "وكيل الشبكة",
|
||||
"storage": "تخزين البيانات",
|
||||
"sync": "مزامنة السحابة",
|
||||
"system-agent": "مساعد النظام",
|
||||
|
||||
@@ -46,6 +46,9 @@
|
||||
"reasoningEffort": {
|
||||
"title": "Интензитет на разсъждение"
|
||||
},
|
||||
"thinking": {
|
||||
"title": "Превключвател за дълбоко мислене"
|
||||
},
|
||||
"title": "Разширени функции на модела"
|
||||
},
|
||||
"history": {
|
||||
|
||||
@@ -1,4 +1,43 @@
|
||||
{
|
||||
"proxy": {
|
||||
"auth": "Необходимо удостоверяване",
|
||||
"authDesc": "Ако прокси сървърът изисква потребителско име и парола",
|
||||
"authSettings": "Настройки за удостоверяване",
|
||||
"basicSettings": "Настройки на прокси",
|
||||
"basicSettingsDesc": "Конфигуриране на параметрите за връзка с прокси сървъра",
|
||||
"bypass": "Адреси без прокси",
|
||||
"connectionTest": "Тест на връзката",
|
||||
"enable": "Активиране на прокси",
|
||||
"enableDesc": "При активиране достъпът до мрежата ще се осъществява чрез прокси сървъра",
|
||||
"password": "Парола",
|
||||
"password_placeholder": "Моля, въведете парола",
|
||||
"port": "Порт",
|
||||
"resetButton": "Нулиране",
|
||||
"saveButton": "Запазване",
|
||||
"saveFailed": "Грешка при запазване: {{error}}",
|
||||
"saveSuccess": "Настройките на прокси сървъра бяха успешно запазени",
|
||||
"server": "Адрес на сървъра",
|
||||
"testButton": "Тествай връзката",
|
||||
"testDescription": "Тествайте връзката с текущата прокси конфигурация, за да проверите дали работи правилно",
|
||||
"testFailed": "Връзката неуспешна",
|
||||
"testSuccessWithTime": "Връзката е успешна, време за изпълнение {{time}} ms",
|
||||
"testUrl": "Тестов адрес",
|
||||
"testUrlPlaceholder": "Моля, въведете URL за тест",
|
||||
"testing": "Тест на връзката...",
|
||||
"type": "Тип прокси",
|
||||
"unsavedChanges": "Имате незапазени промени",
|
||||
"username": "Потребителско име",
|
||||
"username_placeholder": "Моля, въведете потребителско име",
|
||||
"validation": {
|
||||
"passwordRequired": "Паролата е задължителна при активиране на удостоверяване",
|
||||
"portInvalid": "Портът трябва да е число между 1 и 65535",
|
||||
"portRequired": "Портът е задължителен при активиране на прокси",
|
||||
"serverInvalid": "Моля, въведете валиден адрес на сървъра (IP или домейн)",
|
||||
"serverRequired": "Адресът на сървъра е задължителен при активиране на прокси",
|
||||
"typeRequired": "Типът прокси е задължителен при активиране на прокси",
|
||||
"usernameRequired": "Потребителското име е задължително при активиране на удостоверяване"
|
||||
}
|
||||
},
|
||||
"remoteServer": {
|
||||
"authError": "Упълномощаването не бе успешно: {{error}}",
|
||||
"authPending": "Моля, завършете упълномощаването в браузъра",
|
||||
|
||||
+98
-44
@@ -71,44 +71,23 @@
|
||||
"DeepSeek-V3": {
|
||||
"description": "DeepSeek-V3 е MoE модел, разработен от компанията DeepSeek. DeepSeek-V3 постига резултати в множество оценки, които надминават други отворени модели като Qwen2.5-72B и Llama-3.1-405B, като по отношение на производителност е наравно с водещите затворени модели в света като GPT-4o и Claude-3.5-Sonnet."
|
||||
},
|
||||
"Doubao-1.5-thinking-pro-m": {
|
||||
"description": "Doubao-1.5 е новият модел за дълбочинно разсъждение (версия m идва с вградена многомодална дълбочинна разсъждаваща способност), който показва отлични резултати в професионални области като математика, програмиране, научни разсъждения и в общи задачи като креативно писане, достигайки или приближавайки се до водещото ниво в индустрията в множество авторитетни бенчмаркове като AIME 2024, Codeforces, GPQA. Поддържа контекстен прозорец от 128k и изход от 16k."
|
||||
},
|
||||
"Doubao-1.5-thinking-vision-pro": {
|
||||
"description": "Напълно нов модел за дълбочинно визуално мислене, с по-силни способности за общо мултимодално разбиране и разсъждение, постигнал SOTA представяне в 37 от 59 публични оценъчни стандарта."
|
||||
},
|
||||
"Doubao-1.5-vision-pro": {
|
||||
"description": "Doubao-1.5-vision-pro е ново обновление на мултимодалния модел, поддържащ разпознаване на изображения с произволна резолюция и екстремни съотношения на дължина и ширина, подобряващ способностите за визуални разсъждения, разпознаване на документи, разбиране на детайлна информация и следване на инструкции."
|
||||
},
|
||||
"Doubao-1.5-vision-pro-32k": {
|
||||
"description": "Doubao-1.5-vision-pro е ново обновен мултимодален голям модел, който поддържа разпознаване на изображения с произволна резолюция и екстремни съотношения на страните, подобрявайки способностите за визуално разсъждение, разпознаване на документи, разбиране на детайлна информация и следване на инструкции."
|
||||
},
|
||||
"Doubao-lite-128k": {
|
||||
"description": "Doubao-lite предлага изключителна скорост на отговор и по-добра цена, предоставяйки на клиентите гъвкави опции за различни сценарии. Поддържа извеждане и фин настройка на контекстов прозорец от 128k."
|
||||
"description": "Doubao-lite предлага изключително бърза реакция и по-добро съотношение цена-качество, осигурявайки по-гъвкави опции за различни сценарии на клиентите. Поддържа разсъждения и финна настройка с контекстен прозорец от 128k."
|
||||
},
|
||||
"Doubao-lite-32k": {
|
||||
"description": "Doubao-lite предлага изключителна скорост на отговор и по-добра цена, предоставяйки на клиентите гъвкави опции за различни сценарии. Поддържа извеждане и фин настройка на контекстов прозорец от 32k."
|
||||
"description": "Doubao-lite предлага изключително бърза реакция и по-добро съотношение цена-качество, осигурявайки по-гъвкави опции за различни сценарии на клиентите. Поддържа разсъждения и финна настройка с контекстен прозорец от 32k."
|
||||
},
|
||||
"Doubao-lite-4k": {
|
||||
"description": "Doubao-lite предлага изключителна скорост на отговор и по-добра цена, предоставяйки на клиентите гъвкави опции за различни сценарии. Поддържа извеждане и фин настройка на контекстов прозорец от 4k."
|
||||
"description": "Doubao-lite предлага изключително бърза реакция и по-добро съотношение цена-качество, осигурявайки по-гъвкави опции за различни сценарии на клиентите. Поддържа разсъждения и финна настройка с контекстен прозорец от 4k."
|
||||
},
|
||||
"Doubao-pro-128k": {
|
||||
"description": "Най-добрият модел за основни задачи, подходящ за работа с комплексни задачи, с много добри резултати в справочния отговор, обобщение, творчество, текстова класификация и ролеви игри. Поддържа извеждане и фин настройка на контекстов прозорец от 128k."
|
||||
},
|
||||
"Doubao-pro-256k": {
|
||||
"description": "Най-добрият основен модел, подходящ за обработка на сложни задачи, с отлични резултати в сценарии като отговори на въпроси, резюмиране, творчество, текстова класификация и ролеви игри. Поддържа разсъждения и фина настройка с контекстен прозорец от 256k."
|
||||
"description": "Най-ефективният основен модел, подходящ за обработка на сложни задачи, с отлични резултати в справки, обобщения, творчество, текстова класификация и ролеви игри. Поддържа разсъждения и финна настройка с контекстен прозорец от 128k."
|
||||
},
|
||||
"Doubao-pro-32k": {
|
||||
"description": "Най-добрият модел за основни задачи, подходящ за работа с комплексни задачи, с много добри резултати в справочния отговор, обобщение, творчество, текстова класификация и ролеви игри. Поддържа извеждане и фин настройка на контекстов прозорец от 32k."
|
||||
"description": "Най-ефективният основен модел, подходящ за обработка на сложни задачи, с отлични резултати в справки, обобщения, творчество, текстова класификация и ролеви игри. Поддържа разсъждения и финна настройка с контекстен прозорец от 32k."
|
||||
},
|
||||
"Doubao-pro-4k": {
|
||||
"description": "Най-добрият модел за основни задачи, подходящ за работа с комплексни задачи, с много добри резултати в справочния отговор, обобщение, творчество, текстова класификация и ролеви игри. Поддържа извеждане и фин настройка на контекстов прозорец от 4k."
|
||||
},
|
||||
"Doubao-vision-lite-32k": {
|
||||
"description": "Doubao-vision моделът е мултимодален голям модел, представен от Doubao, който притежава мощни способности за разбиране и разсъждение на изображения, както и прецизно разбиране на инструкции. Моделът показва силни резултати в извличането на текстова информация от изображения и в задачи за разсъждение, базирани на изображения, и може да се прилага в по-сложни и по-широки визуални въпроси."
|
||||
},
|
||||
"Doubao-vision-pro-32k": {
|
||||
"description": "Doubao-vision моделът е мултимодален голям модел, представен от Doubao, който притежава мощни способности за разбиране и разсъждение на изображения, както и прецизно разбиране на инструкции. Моделът показва силни резултати в извличането на текстова информация от изображения и в задачи за разсъждение, базирани на изображения, и може да се прилага в по-сложни и по-широки визуални въпроси."
|
||||
"description": "Най-ефективният основен модел, подходящ за обработка на сложни задачи, с отлични резултати в справки, обобщения, творчество, текстова класификация и ролеви игри. Поддържа разсъждения и финна настройка с контекстен прозорец от 4k."
|
||||
},
|
||||
"ERNIE-3.5-128K": {
|
||||
"description": "Флагманският модел на Baidu, разработен самостоятелно, е мащабен езиков модел, който обхваща огромно количество китайски и английски текстове. Той притежава мощни общи способности и може да отговори на почти всички изисквания за диалогови въпроси и отговори, генериране на съдържание и приложения с плъгини; поддържа автоматично свързване с плъгина за търсене на Baidu, осигурявайки актуалност на информацията за отговорите."
|
||||
@@ -224,24 +203,21 @@
|
||||
"Pro/Qwen/Qwen2.5-VL-7B-Instruct": {
|
||||
"description": "Qwen2.5-VL е нов член от серията Qwen, който разполага с мощни възможности за визуално разбиране. Той може да анализира текст, диаграми и оформление в изображения, да разбира дълги видеоклипове и да улавя събития. Може да извършва логически изводи, да работи с инструменти, поддържа локализиране на обекти в различни формати и генериране на структуриран изход. Оптимизиран е с динамична резолюция и честота на кадрите за разбиране на видео и подобрена ефективност на визуалния кодиращ модул."
|
||||
},
|
||||
"Pro/THUDM/GLM-4.1V-9B-Thinking": {
|
||||
"description": "GLM-4.1V-9B-Thinking е отворен визуално-езиков модел (VLM), съвместно разработен от Zhizhu AI и KEG лабораторията на Университета Цинхуа, специално проектиран за обработка на сложни мултимодални когнитивни задачи. Моделът е базиран на основния модел GLM-4-9B-0414 и значително подобрява способностите си за кросмодално разсъждение и стабилност чрез въвеждането на механизма за разсъждение „верига на мисълта“ (Chain-of-Thought) и използването на стратегии за подсилено обучение."
|
||||
},
|
||||
"Pro/THUDM/glm-4-9b-chat": {
|
||||
"description": "GLM-4-9B-Chat е отворената версия на предварително обучен модел от серията GLM-4, пусната от Zhizhu AI. Моделът показва отлични резултати в семантика, математика, разсъждения, код и знания. Освен че поддържа многократни разговори, GLM-4-9B-Chat предлага и напреднали функции като уеб браузинг, изпълнение на код, извикване на персонализирани инструменти (Function Call) и разсъждения с дълги текстове. Моделът поддържа 26 езика, включително китайски, английски, японски, корейски и немски. В множество бенчмаркове, GLM-4-9B-Chat показва отлична производителност, като AlignBench-v2, MT-Bench, MMLU и C-Eval. Моделът поддържа максимална контекстна дължина от 128K, подходящ за академични изследвания и търговски приложения."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1": {
|
||||
"description": "DeepSeek-R1 е модел за инференция, управляван от обучение с подсилване (RL), който решава проблемите с повторяемостта и четимостта в моделите. Преди RL, DeepSeek-R1 въвежда данни за студен старт, за да оптимизира допълнително производителността на инференцията. Той показва сравними резултати с OpenAI-o1 в математически, кодови и инференционни задачи и подобрява общата ефективност чрез внимателно проектирани методи на обучение."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1-0120": {
|
||||
"description": "DeepSeek-R1 е модел за разсъждение, задвижван от усилено обучение (RL), който решава проблеми с повторяемост и четимост в модела. Преди RL, DeepSeek-R1 въвежда студено стартиране на данни за допълнително оптимизиране на разсъжденията. Моделът постига резултати, сравними с OpenAI-o1 в задачи по математика, кодиране и разсъждение, и подобрява общата ефективност чрез внимателно проектирани методи за обучение."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B": {
|
||||
"description": "DeepSeek-R1-Distill-Qwen-7B е модел, получен чрез дистилация на знания от Qwen2.5-Math-7B. Този модел е фино настроен с 800 000 избрани проби, генерирани от DeepSeek-R1, и демонстрира изключителни способности за разсъждение. Той се представя отлично в множество тестове, постигайки 92,8% точност в MATH-500, 55,5% успеваемост в AIME 2024 и рейтинг от 1189 в CodeForces, показвайки силни математически и програмистки способности за модел с мащаб 7B."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-V3": {
|
||||
"description": "DeepSeek-V3 е модел на езика с 6710 милиарда параметри, който използва архитектура на смесени експерти (MoE) с много глави на потенциално внимание (MLA) и стратегия за баланс на натоварването без помощни загуби, оптимизираща производителността на инференцията и обучението. Чрез предварително обучение на 14.8 трилиона висококачествени токени и последващо супервизирано фино настройване и обучение с подсилване, DeepSeek-V3 надминава производителността на други отворени модели и е близо до водещите затворени модели."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-V3-1226": {
|
||||
"description": "DeepSeek-V3 е хибриден езиков модел (MoE) с 6710 милиарда параметри, използващ многоглаво внимание (MLA) и архитектурата DeepSeekMoE, комбинираща стратегия за баланс на натоварването без помощни загуби, оптимизираща ефективността на извеждане и обучение. Чрез предварително обучение на 14.8 трилиона висококачествени токени и последващо наблюдавано фино настройване и обучение с подсилване, DeepSeek-V3 надминава други отворени модели по производителност, приближавайки се до водещите затворени модели."
|
||||
},
|
||||
"QwQ-32B-Preview": {
|
||||
"description": "QwQ-32B-Preview е иновативен модел за обработка на естествен език, способен да обработва ефективно сложни задачи за генериране на диалог и разбиране на контекста."
|
||||
},
|
||||
@@ -404,6 +380,9 @@
|
||||
"THUDM/GLM-4-9B-0414": {
|
||||
"description": "GLM-4-9B-0414 е малкият модел от серията GLM, с 9 милиарда параметри. Този модел наследява техническите характеристики на GLM-4-32B серията, но предлага по-леко решение за внедряване. Въпреки по-малкия си размер, GLM-4-9B-0414 все още показва отлични способности в генерирането на код, уеб дизайн, генериране на SVG графики и писане на базата на търсене."
|
||||
},
|
||||
"THUDM/GLM-4.1V-9B-Thinking": {
|
||||
"description": "GLM-4.1V-9B-Thinking е отворен визуално-езиков модел (VLM), съвместно разработен от Zhizhu AI и KEG лабораторията на Университета Цинхуа, специално проектиран за обработка на сложни мултимодални когнитивни задачи. Моделът е базиран на основния модел GLM-4-9B-0414 и значително подобрява способностите си за кросмодално разсъждение и стабилност чрез въвеждането на механизма за разсъждение „верига на мисълта“ (Chain-of-Thought) и използването на стратегии за подсилено обучение."
|
||||
},
|
||||
"THUDM/GLM-Z1-32B-0414": {
|
||||
"description": "GLM-Z1-32B-0414 е модел за разсъждение с дълбоки способности за разсъждение. Този модел е разработен на базата на GLM-4-32B-0414 чрез студен старт и разширено обучение с подсилване и е допълнително обучен в задачи по математика, код и логика. В сравнение с основния модел, GLM-Z1-32B-0414 значително подобрява математическите способности и способността за решаване на сложни задачи."
|
||||
},
|
||||
@@ -560,6 +539,9 @@
|
||||
"anthropic/claude-sonnet-4": {
|
||||
"description": "Claude Sonnet 4 може да генерира почти мигновени отговори или удължено стъпково мислене, което потребителите могат ясно да проследят. Потребителите на API също така имат прецизен контрол върху времето за мислене на модела."
|
||||
},
|
||||
"ascend-tribe/pangu-pro-moe": {
|
||||
"description": "Pangu-Pro-MoE 72B-A16B е голям езиков модел с 72 милиарда параметри и 16 милиарда активирани параметри, базиран на архитектурата с групирани смесени експерти (MoGE). Той групира експертите по време на избора им и ограничава активацията на токените да активират равен брой експерти във всяка група, което осигурява балансирано натоварване на експертите и значително подобрява ефективността на разгръщане на модела на платформата Ascend."
|
||||
},
|
||||
"aya": {
|
||||
"description": "Aya 23 е многозначен модел, представен от Cohere, поддържащ 23 езика, предоставяйки удобство за многоезични приложения."
|
||||
},
|
||||
@@ -569,6 +551,9 @@
|
||||
"baichuan/baichuan2-13b-chat": {
|
||||
"description": "Baichuan-13B е отворен, комерсиален голям езиков модел, разработен от Baichuan Intelligence, с 13 милиарда параметри, който постига най-добрите резултати в своя размер на авторитетни бенчмаркове на китайски и английски."
|
||||
},
|
||||
"baidu/ERNIE-4.5-300B-A47B": {
|
||||
"description": "ERNIE-4.5-300B-A47B е голям езиков модел, разработен от Baidu, базиран на архитектурата с хибридни експерти (MoE). Моделът има общо 300 милиарда параметри, но при инференция активира само 47 милиарда параметри на токен, което осигурява висока производителност и изчислителна ефективност. Като един от основните модели в серията ERNIE 4.5, той демонстрира изключителни способности в задачи като разбиране на текст, генериране, разсъждение и програмиране. Моделът използва иновативен мултимодален хетерогенен MoE метод за предварително обучение, който чрез съвместно обучение на текстови и визуални модалности значително подобрява цялостните му възможности, особено в следването на инструкции и запаметяването на световни знания."
|
||||
},
|
||||
"c4ai-aya-expanse-32b": {
|
||||
"description": "Aya Expanse е високопроизводителен многоезичен модел с 32B, проектиран да предизвика представянето на едноезични модели чрез иновации в настройката на инструкции, арбитраж на данни, обучение на предпочитания и комбиниране на модели. Той поддържа 23 езика."
|
||||
},
|
||||
@@ -726,7 +711,7 @@
|
||||
"description": "Compound-beta-mini е композитна AI система, подкрепена от публично достъпни модели в GroqCloud, която интелигентно и селективно използва инструменти за отговор на запитвания на потребителите."
|
||||
},
|
||||
"computer-use-preview": {
|
||||
"description": "Моделът computer-use-preview е специално създаден за „инструменти за използване на компютър“, обучен да разбира и изпълнява задачи, свързани с компютри."
|
||||
"description": "Моделът computer-use-preview е специално разработен за „инструменти за използване на компютър“, обучен да разбира и изпълнява задачи, свързани с компютри."
|
||||
},
|
||||
"dall-e-2": {
|
||||
"description": "Второ поколение модел DALL·E, поддържащ по-реалистично и точно генериране на изображения, с резолюция 4 пъти по-висока от първото поколение."
|
||||
@@ -914,17 +899,53 @@
|
||||
"doubao-1.5-thinking-pro": {
|
||||
"description": "Doubao-1.5 е нов модел за дълбоко мислене, който се отличава в специализирани области като математика, програмиране и научно разсъждение, както и в общи задачи като креативно писане. Той достига или е близо до нивото на водещите в индустрията в множество авторитетни бенчмаркове, включително AIME 2024, Codeforces и GPQA. Поддържа контекстен прозорец от 128k и 16k изход."
|
||||
},
|
||||
"doubao-1.5-thinking-pro-m": {
|
||||
"description": "Новият дълбок мисловен модел Doubao-1.5 (версия m с вградена мултимодална дълбока разсъдителна способност), отличаващ се в математика, програмиране, научно разсъждение и творческо писане, постигащ или приближаващ се до водещите нива в индустрията на авторитетни тестове като AIME 2024, Codeforces и GPQA. Поддържа контекстен прозорец от 128k и изход до 16k."
|
||||
},
|
||||
"doubao-1.5-thinking-vision-pro": {
|
||||
"description": "Нов визуален дълбок мисловен модел с по-силни универсални мултимодални разбиране и разсъждения, постигнал SOTA резултати в 37 от 59 публични тестови бази."
|
||||
},
|
||||
"doubao-1.5-ui-tars": {
|
||||
"description": "Doubao-1.5-UI-TARS е агентен модел, специално създаден за графичен потребителски интерфейс (GUI). Чрез човешки подобни способности за възприятие, разсъждение и действие, осигурява безпроблемно взаимодействие с GUI."
|
||||
},
|
||||
"doubao-1.5-vision-lite": {
|
||||
"description": "Doubao-1.5-vision-lite е ново обновление на мултимодалния модел, поддържащ разпознаване на изображения с произволна резолюция и екстремни съотношения на дължина и ширина, подобряващ способностите за визуални разсъждения, разпознаване на документи, разбиране на детайлна информация и следване на инструкции. Поддържа контекстуален прозорец от 128k, с максимална дължина на изхода от 16k токена."
|
||||
},
|
||||
"doubao-1.5-vision-pro": {
|
||||
"description": "Новоподобреният мултимодален голям модел Doubao-1.5-vision-pro поддържа разпознаване на изображения с всякаква резолюция и екстремни съотношения на страните, подобрявайки визуалното разсъждение, разпознаване на документи, разбиране на детайлна информация и следване на инструкции."
|
||||
},
|
||||
"doubao-1.5-vision-pro-32k": {
|
||||
"description": "Новоподобреният мултимодален голям модел Doubao-1.5-vision-pro поддържа разпознаване на изображения с всякаква резолюция и екстремни съотношения на страните, подобрявайки визуалното разсъждение, разпознаване на документи, разбиране на детайлна информация и следване на инструкции."
|
||||
},
|
||||
"doubao-lite-128k": {
|
||||
"description": "Предлага изключително бърза реакция и по-добро съотношение цена-качество, осигурявайки по-гъвкави опции за различни сценарии на клиентите. Поддържа разсъждения и финна настройка с контекстен прозорец от 128k."
|
||||
},
|
||||
"doubao-lite-32k": {
|
||||
"description": "Предлага изключително бърза реакция и по-добро съотношение цена-качество, осигурявайки по-гъвкави опции за различни сценарии на клиентите. Поддържа разсъждения и финна настройка с контекстен прозорец от 32k."
|
||||
},
|
||||
"doubao-lite-4k": {
|
||||
"description": "Предлага изключително бърза реакция и по-добро съотношение цена-качество, осигурявайки по-гъвкави опции за различни сценарии на клиентите. Поддържа разсъждения и финна настройка с контекстен прозорец от 4k."
|
||||
},
|
||||
"doubao-pro-256k": {
|
||||
"description": "Най-ефективният основен модел, подходящ за обработка на сложни задачи, с отлични резултати в справки, обобщения, творчество, текстова класификация и ролеви игри. Поддържа разсъждения и финна настройка с контекстен прозорец от 256k."
|
||||
},
|
||||
"doubao-pro-32k": {
|
||||
"description": "Най-ефективният основен модел, подходящ за обработка на сложни задачи, с отлични резултати в справки, обобщения, творчество, текстова класификация и ролеви игри. Поддържа разсъждения и финна настройка с контекстен прозорец от 32k."
|
||||
},
|
||||
"doubao-seed-1.6": {
|
||||
"description": "Doubao-Seed-1.6 е нов мултимодален модел за дълбоко мислене, който поддържа три режима на мислене: auto, thinking и non-thinking. В non-thinking режим моделът значително превъзхожда Doubao-1.5-pro/250115. Поддържа контекстен прозорец от 256k и максимална дължина на изхода до 16k токена."
|
||||
"description": "Doubao-Seed-1.6 е нов много модален модел за дълбоко мислене, който поддържа три режима на мислене: auto, thinking и non-thinking. В non-thinking режим моделът значително превъзхожда Doubao-1.5-pro/250115. Поддържа контекстен прозорец от 256k и максимална дължина на изхода до 16k токена."
|
||||
},
|
||||
"doubao-seed-1.6-flash": {
|
||||
"description": "Doubao-Seed-1.6-flash е мултимодален модел за дълбоко мислене с изключително бързо изчисление, TPOT отнема само 10ms; поддържа както текстово, така и визуално разбиране, като текстовите му възможности надминават предишното поколение lite, а визуалното разбиране е на нивото на професионалните модели на конкурентите. Поддържа контекстен прозорец от 256k и максимална дължина на изхода до 16k токена."
|
||||
"description": "Doubao-Seed-1.6-flash е изключително бърз много модален модел за дълбоко мислене с TPOT само 10ms; поддържа както текстово, така и визуално разбиране, като текстовите му възможности надминават предишното поколение lite, а визуалното разбиране е на нивото на професионалните модели на конкурентите. Поддържа контекстен прозорец от 256k и максимална дължина на изхода до 16k токена."
|
||||
},
|
||||
"doubao-seed-1.6-thinking": {
|
||||
"description": "Doubao-Seed-1.6-thinking моделът значително подобрява способностите за мислене в сравнение с Doubao-1.5-thinking-pro, с допълнителни подобрения в кодиране, математика и логическо разсъждение, като поддържа визуално разбиране. Поддържа контекстен прозорец от 256k и максимална дължина на изхода до 16k токена."
|
||||
"description": "Doubao-Seed-1.6-thinking моделът значително подобрява способностите за мислене в сравнение с Doubao-1.5-thinking-pro, с допълнителни подобрения в кодиране, математика и логическо разсъждение, като поддържа и визуално разбиране. Поддържа контекстен прозорец от 256k и максимална дължина на изхода до 16k токена."
|
||||
},
|
||||
"doubao-vision-lite-32k": {
|
||||
"description": "Моделът Doubao-vision е мултимодален голям модел, разработен от Doubao, с мощни способности за разбиране и разсъждение върху изображения, както и прецизно разбиране на инструкции. Моделът показва силна производителност при извличане на информация от изображения и текст, както и при задачи за разсъждение, базирани на изображения, подходящ за по-сложни и широки визуални въпроси."
|
||||
},
|
||||
"doubao-vision-pro-32k": {
|
||||
"description": "Моделът Doubao-vision е мултимодален голям модел, разработен от Doubao, с мощни способности за разбиране и разсъждение върху изображения, както и прецизно разбиране на инструкции. Моделът показва силна производителност при извличане на информация от изображения и текст, както и при задачи за разсъждение, базирани на изображения, подходящ за по-сложни и широки визуални въпроси."
|
||||
},
|
||||
"emohaa": {
|
||||
"description": "Emohaa е психологически модел с професионални консултантски способности, помагащ на потребителите да разберат емоционалните проблеми."
|
||||
@@ -1082,9 +1103,6 @@
|
||||
"gemini-2.5-pro": {
|
||||
"description": "Gemini 2.5 Pro е най-напредналият мисловен модел на Google, способен да разсъждава върху сложни проблеми в областта на кода, математиката и STEM, както и да анализира големи набори от данни, кодови бази и документи с дълъг контекст."
|
||||
},
|
||||
"gemini-2.5-pro-exp-03-25": {
|
||||
"description": "Gemini 2.5 Pro Experimental е най-напредналият модел на мислене на Google, способен да разсъждава по сложни проблеми в код, математика и STEM области, както и да анализира големи набори от данни, кодови библиотеки и документи, използвайки дълъг контекст."
|
||||
},
|
||||
"gemini-2.5-pro-preview-03-25": {
|
||||
"description": "Gemini 2.5 Pro Preview е най-напредналият модел на Google за мислене, способен да разсъждава по сложни проблеми в кодиране, математика и STEM области, както и да анализира големи набори от данни, кодови библиотеки и документи с дълъг контекст."
|
||||
},
|
||||
@@ -1151,6 +1169,12 @@
|
||||
"glm-4-plus": {
|
||||
"description": "GLM-4-Plus, като флагман с висока интелигентност, разполага с мощни способности за обработка на дълги текстове и сложни задачи, с цялостно подобрена производителност."
|
||||
},
|
||||
"glm-4.1v-thinking-flash": {
|
||||
"description": "Серията модели GLM-4.1V-Thinking е най-мощният визуален модел сред известните VLM модели с размер около 10 милиарда параметри, обединяващ водещи в класа си задачи за визуално-езиково разбиране, включително видео разбиране, въпроси и отговори върху изображения, решаване на предметни задачи, OCR разпознаване на текст, интерпретация на документи и графики, GUI агент, кодиране на уеб страници, Grounding и други. Някои от задачите дори превъзхождат модели с 8 пъти повече параметри като Qwen2.5-VL-72B. Чрез водещи техники за подсилено обучение моделът овладява разсъждения чрез вериги на мисълта, което значително подобрява точността и богатството на отговорите, превъзхождайки традиционните модели без мисловен процес по отношение на крайния резултат и обяснимостта."
|
||||
},
|
||||
"glm-4.1v-thinking-flashx": {
|
||||
"description": "Серията модели GLM-4.1V-Thinking е най-мощният визуален модел сред известните VLM модели с размер около 10 милиарда параметри, обединяващ водещи в класа си задачи за визуално-езиково разбиране, включително видео разбиране, въпроси и отговори върху изображения, решаване на предметни задачи, OCR разпознаване на текст, интерпретация на документи и графики, GUI агент, кодиране на уеб страници, Grounding и други. Някои от задачите дори превъзхождат модели с 8 пъти повече параметри като Qwen2.5-VL-72B. Чрез водещи техники за подсилено обучение моделът овладява разсъждения чрез вериги на мисълта, което значително подобрява точността и богатството на отговорите, превъзхождайки традиционните модели без мисловен процес по отношение на крайния резултат и обяснимостта."
|
||||
},
|
||||
"glm-4v": {
|
||||
"description": "GLM-4V предлага мощни способности за разбиране и разсъждение на изображения, поддържаща множество визуални задачи."
|
||||
},
|
||||
@@ -1172,6 +1196,9 @@
|
||||
"glm-z1-flash": {
|
||||
"description": "GLM-Z1 серията притежава силни способности за сложни разсъждения, показвайки отлични резултати в логическите разсъждения, математиката и програмирането. Максималната дължина на контекста е 32K."
|
||||
},
|
||||
"glm-z1-flashx": {
|
||||
"description": "Висока скорост и ниска цена: Flash подобрена версия с изключително бърза скорост на инференция и по-добра гаранция за паралелна обработка."
|
||||
},
|
||||
"glm-zero-preview": {
|
||||
"description": "GLM-Zero-Preview притежава мощни способности за сложни разсъждения, показвайки отлични резултати в логическото разсъждение, математиката и програмирането."
|
||||
},
|
||||
@@ -1223,6 +1250,9 @@
|
||||
"google/gemma-2b-it": {
|
||||
"description": "Gemma Instruct (2B) предлага основни способности за обработка на инструкции, подходящи за леки приложения."
|
||||
},
|
||||
"google/gemma-3-1b-it": {
|
||||
"description": "Gemma 3 1B е отворен езиков модел на Google, който поставя нови стандарти за ефективност и производителност."
|
||||
},
|
||||
"google/gemma-3-27b-it": {
|
||||
"description": "Gemma 3 27B е отворен езиков модел на Google, който поставя нови стандарти за ефективност и производителност."
|
||||
},
|
||||
@@ -1305,7 +1335,7 @@
|
||||
"description": "GPT-4o mini е най-новият модел на OpenAI, след GPT-4 Omni, който поддържа текстово и визуално въвеждане и генерира текст. Като най-напредналият им малък модел, той е значително по-евтин от другите нови модели и е с над 60% по-евтин от GPT-3.5 Turbo. Запазва най-съвременната интелигентност, като същевременно предлага значителна стойност за парите. GPT-4o mini получи 82% на теста MMLU и в момента е с по-висок рейтинг от GPT-4 по предпочитания за чат."
|
||||
},
|
||||
"gpt-4o-mini-audio-preview": {
|
||||
"description": "GPT-4o mini Audio модел, поддържа вход и изход на аудио."
|
||||
"description": "GPT-4o mini аудио модел, поддържа вход и изход на аудио."
|
||||
},
|
||||
"gpt-4o-mini-realtime-preview": {
|
||||
"description": "Реален вариант на GPT-4o-mini, поддържащ вход и изход на аудио и текст в реално време."
|
||||
@@ -1313,6 +1343,9 @@
|
||||
"gpt-4o-mini-search-preview": {
|
||||
"description": "GPT-4o mini предварителна версия за търсене е модел, специално обучен за разбиране и изпълнение на заявки за уеб търсене, използващ Chat Completions API. Освен таксите за токени, заявките за уеб търсене се таксуват и на всяко извикване на инструмента."
|
||||
},
|
||||
"gpt-4o-mini-transcribe": {
|
||||
"description": "GPT-4o Mini Transcribe е модел за преобразуване на реч в текст, използващ GPT-4o за транскрибиране на аудио. В сравнение с оригиналния модел Whisper, той намалява процента на грешки в думите и подобрява разпознаването на езика и точността. Използвайте го за по-точни транскрипции."
|
||||
},
|
||||
"gpt-4o-mini-tts": {
|
||||
"description": "GPT-4o mini TTS е модел за преобразуване на текст в реч, базиран на GPT-4o mini, предлагащ висококачествено генериране на реч при по-ниска цена."
|
||||
},
|
||||
@@ -1322,12 +1355,15 @@
|
||||
"gpt-4o-realtime-preview-2024-10-01": {
|
||||
"description": "Реален вариант на GPT-4o, поддържащ вход и изход на аудио и текст в реално време."
|
||||
},
|
||||
"gpt-4o-realtime-preview-2024-12-17": {
|
||||
"description": "Реален вариант на GPT-4o, поддържащ вход и изход на аудио и текст в реално време."
|
||||
"gpt-4o-realtime-preview-2025-06-03": {
|
||||
"description": "Реално време версия на GPT-4o, поддържаща едновременно аудио и текстов вход и изход."
|
||||
},
|
||||
"gpt-4o-search-preview": {
|
||||
"description": "GPT-4o предварителна версия за търсене е модел, специално обучен за разбиране и изпълнение на заявки за уеб търсене, използващ Chat Completions API. Освен таксите за токени, заявките за уеб търсене се таксуват и на всяко извикване на инструмента."
|
||||
},
|
||||
"gpt-4o-transcribe": {
|
||||
"description": "GPT-4o Transcribe е модел за преобразуване на реч в текст, използващ GPT-4o за транскрибиране на аудио. В сравнение с оригиналния модел Whisper, той намалява процента на грешки в думите и подобрява разпознаването на езика и точността. Използвайте го за по-точни транскрипции."
|
||||
},
|
||||
"grok-2-1212": {
|
||||
"description": "Този модел е подобрен по отношение на точност, спазване на инструкции и многоезични способности."
|
||||
},
|
||||
@@ -1346,9 +1382,15 @@
|
||||
"grok-3-mini-fast": {
|
||||
"description": "Лек модел, който мисли преди разговор. Работи бързо и интелигентно, подходящ за логически задачи без нужда от дълбоки специализирани знания и позволява проследяване на оригиналния мисловен процес."
|
||||
},
|
||||
"grok-4": {
|
||||
"description": "Нашият най-нов и най-мощен флагмански модел, който се отличава с изключителни резултати в обработката на естествен език, математическите изчисления и разсъжденията — перфектен универсален играч."
|
||||
},
|
||||
"gryphe/mythomax-l2-13b": {
|
||||
"description": "MythoMax l2 13B е езиков модел, който комбинира креативност и интелигентност, обединявайки множество водещи модели."
|
||||
},
|
||||
"hunyuan-a13b": {
|
||||
"description": "Hunyuan е първият хибриден разсъждаващ модел, ъпгрейд на hunyuan-standard-256K, с общо 80 милиарда параметри и 13 милиарда активирани. По подразбиране работи в режим на бавно мислене, като поддържа превключване между бърз и бавен режим чрез параметри или инструкции, като превключването се осъществява чрез добавяне на query префикс / no_think. Общите способности са значително подобрени спрямо предишното поколение, особено в областите математика, наука, разбиране на дълги текстове и агентски функции."
|
||||
},
|
||||
"hunyuan-code": {
|
||||
"description": "Най-новият модел за генериране на код на HunYuan, обучен с 200B висококачествени данни за код, с шестмесечно обучение на данни за SFT с високо качество, увеличен контекстен прозорец до 8K, и водещи резултати в автоматичните оценъчни показатели за генериране на код на пет основни езика; в комплексната оценка на кодови задачи на пет основни езика, представянето е в първата група."
|
||||
},
|
||||
@@ -1400,6 +1442,9 @@
|
||||
"hunyuan-t1-vision": {
|
||||
"description": "Модел за дълбоко мултимодално разбиране Hunyuan, поддържащ естествени мултимодални вериги на мислене, експертен в различни сценарии за разсъждение върху изображения, с цялостно подобрение спрямо бързите мисловни модели при научни задачи."
|
||||
},
|
||||
"hunyuan-t1-vision-20250619": {
|
||||
"description": "Най-новият мултимодален дълбок мислещ модел t1-vision на Hunyuan, който поддържа оригинални мултимодални вериги на мисълта и предлага цялостно подобрение спрямо предишната версия по подразбиране."
|
||||
},
|
||||
"hunyuan-turbo": {
|
||||
"description": "Предварителна версия на новото поколение голям езиков модел на HunYuan, използваща нова структура на смесен експертен модел (MoE), с по-бърза скорост на извеждане и по-силни резултати в сравнение с hunyuan-pro."
|
||||
},
|
||||
@@ -1430,6 +1475,12 @@
|
||||
"hunyuan-turbos-role-plus": {
|
||||
"description": "Най-новият модел за ролеви игри на Hunyuan, официално фино настроен и обучен от Hunyuan, базиран на Hunyuan модел с допълнително обучение върху набор от данни за ролеви игри, осигуряващ по-добри основни резултати в ролеви игрови сцени."
|
||||
},
|
||||
"hunyuan-turbos-vision": {
|
||||
"description": "Този модел е предназначен за задачи по разбиране на изображения и текст, базиран на най-новия turbos модел на Hunyuan, ново поколение водещ визуално-езиков модел, фокусиран върху задачи като разпознаване на обекти в изображения, въпроси и отговори, създаване на текстове и решаване на задачи чрез снимки, с цялостно подобрение спрямо предишното поколение."
|
||||
},
|
||||
"hunyuan-turbos-vision-20250619": {
|
||||
"description": "Най-новият водещ визуално-езиков модел turbos-vision на Hunyuan, който предлага цялостно подобрение спрямо предишната версия по подразбиране в задачи, свързани с разбиране на изображения и текст, включително разпознаване на обекти, въпроси и отговори, създаване на текстове и решаване на задачи чрез снимки."
|
||||
},
|
||||
"hunyuan-vision": {
|
||||
"description": "Най-новият мултимодален модел на HunYuan, поддържащ генериране на текстово съдържание от изображения и текстови входове."
|
||||
},
|
||||
@@ -1457,6 +1508,9 @@
|
||||
"jina-deepsearch-v1": {
|
||||
"description": "Дълбокото търсене комбинира интернет търсене, четене и разсъждение, за да извърши обширно разследване. Можете да го разглеждате като агент, който приема вашата изследователска задача - той ще извърши широко търсене и ще премине през множество итерации, преди да предостави отговор. Този процес включва непрекъснато изследване, разсъждение и решаване на проблеми от различни ъгли. Това е коренно различно от стандартните големи модели, които генерират отговори директно от предварително обучени данни, и от традиционните RAG системи, които разчитат на еднократни повърхностни търсения."
|
||||
},
|
||||
"kimi-k2-0711-preview": {
|
||||
"description": "kimi-k2 е базов модел с MoE архитектура с изключителни способности за кодиране и агентски функции, с общо 1 трилион параметри и 32 милиарда активни параметри. В тестове за общо знание, програмиране, математика и агентски задачи, моделът K2 превъзхожда други водещи отворени модели."
|
||||
},
|
||||
"kimi-latest": {
|
||||
"description": "Kimi интелигентен асистент използва най-новия Kimi голям модел, който може да съдържа нестабилни функции. Поддържа разбиране на изображения и автоматично избира 8k/32k/128k модел за таксуване в зависимост от дължината на контекста на заявката."
|
||||
},
|
||||
@@ -2349,7 +2403,7 @@
|
||||
"description": "Моделът v0-1.5-md е подходящ за ежедневни задачи и генериране на потребителски интерфейс (UI)"
|
||||
},
|
||||
"whisper-1": {
|
||||
"description": "Универсален модел за разпознаване на реч, поддържащ многоезично разпознаване на реч, превод на реч и разпознаване на езици."
|
||||
"description": "Универсален модел за разпознаване на реч, поддържащ многоезично разпознаване на реч, превод на реч и разпознаване на език."
|
||||
},
|
||||
"wizardlm2": {
|
||||
"description": "WizardLM 2 е езиков модел, предоставен от Microsoft AI, който се отличава в сложни диалози, многоезичност, разсъждение и интелигентни асистенти."
|
||||
|
||||
@@ -520,6 +520,7 @@
|
||||
"hotkey": "Бързи клавиши",
|
||||
"llm": "Езиков модел",
|
||||
"provider": "AI доставчик",
|
||||
"proxy": "Мрежов прокси",
|
||||
"storage": "Данни за хранилище",
|
||||
"sync": "Синхронизиране в облака",
|
||||
"system-agent": "Системен асистент",
|
||||
|
||||
@@ -46,6 +46,9 @@
|
||||
"reasoningEffort": {
|
||||
"title": "Argumentationsstärke"
|
||||
},
|
||||
"thinking": {
|
||||
"title": "Tiefdenk-Schalter"
|
||||
},
|
||||
"title": "Modell Erweiterungsfunktionen"
|
||||
},
|
||||
"history": {
|
||||
|
||||
@@ -1,4 +1,43 @@
|
||||
{
|
||||
"proxy": {
|
||||
"auth": "Authentifizierung erforderlich",
|
||||
"authDesc": "Wenn der Proxy-Server Benutzername und Passwort benötigt",
|
||||
"authSettings": "Authentifizierungseinstellungen",
|
||||
"basicSettings": "Proxy-Einstellungen",
|
||||
"basicSettingsDesc": "Konfigurieren Sie die Verbindungsparameter des Proxy-Servers",
|
||||
"bypass": "Adressen ohne Proxy",
|
||||
"connectionTest": "Verbindungstest",
|
||||
"enable": "Proxy aktivieren",
|
||||
"enableDesc": "Wenn aktiviert, wird der Netzwerkzugang über den Proxy-Server geleitet",
|
||||
"password": "Passwort",
|
||||
"password_placeholder": "Bitte Passwort eingeben",
|
||||
"port": "Port",
|
||||
"resetButton": "Zurücksetzen",
|
||||
"saveButton": "Speichern",
|
||||
"saveFailed": "Speichern fehlgeschlagen: {{error}}",
|
||||
"saveSuccess": "Proxy-Einstellungen erfolgreich gespeichert",
|
||||
"server": "Serveradresse",
|
||||
"testButton": "Verbindung testen",
|
||||
"testDescription": "Testen Sie die Verbindung mit der aktuellen Proxy-Konfiguration, um die Funktionalität zu überprüfen",
|
||||
"testFailed": "Verbindung fehlgeschlagen",
|
||||
"testSuccessWithTime": "Verbindung erfolgreich getestet, Dauer {{time}} ms",
|
||||
"testUrl": "Test-URL",
|
||||
"testUrlPlaceholder": "Bitte die zu testende URL eingeben",
|
||||
"testing": "Verbindung wird getestet...",
|
||||
"type": "Proxy-Typ",
|
||||
"unsavedChanges": "Sie haben ungespeicherte Änderungen",
|
||||
"username": "Benutzername",
|
||||
"username_placeholder": "Bitte Benutzernamen eingeben",
|
||||
"validation": {
|
||||
"passwordRequired": "Passwort ist erforderlich, wenn die Authentifizierung aktiviert ist",
|
||||
"portInvalid": "Der Port muss eine Zahl zwischen 1 und 65535 sein",
|
||||
"portRequired": "Port ist erforderlich, wenn der Proxy aktiviert ist",
|
||||
"serverInvalid": "Bitte geben Sie eine gültige Serveradresse (IP oder Domain) ein",
|
||||
"serverRequired": "Serveradresse ist erforderlich, wenn der Proxy aktiviert ist",
|
||||
"typeRequired": "Proxy-Typ ist erforderlich, wenn der Proxy aktiviert ist",
|
||||
"usernameRequired": "Benutzername ist erforderlich, wenn die Authentifizierung aktiviert ist"
|
||||
}
|
||||
},
|
||||
"remoteServer": {
|
||||
"authError": "Autorisierung fehlgeschlagen: {{error}}",
|
||||
"authPending": "Bitte schließen Sie die Autorisierung im Browser ab",
|
||||
|
||||
+96
-42
@@ -71,44 +71,23 @@
|
||||
"DeepSeek-V3": {
|
||||
"description": "DeepSeek-V3 ist ein von der DeepSeek Company entwickeltes MoE-Modell. Die Ergebnisse von DeepSeek-V3 übertreffen die anderer Open-Source-Modelle wie Qwen2.5-72B und Llama-3.1-405B und stehen in der Leistung auf Augenhöhe mit den weltweit führenden Closed-Source-Modellen GPT-4o und Claude-3.5-Sonnet."
|
||||
},
|
||||
"Doubao-1.5-thinking-pro-m": {
|
||||
"description": "Doubao-1.5 ist ein neues tiefes Denkmodell (m-Version mit nativer multimodaler tiefen Denkfähigkeit), das in den Fachbereichen Mathematik, Programmierung, wissenschaftlichem Denken und kreativen Schreibaufgaben herausragende Leistungen zeigt und in mehreren renommierten Benchmarks wie AIME 2024, Codeforces und GPQA die branchenführenden Standards erreicht oder nahe kommt. Es unterstützt ein Kontextfenster von 128k und 16k Ausgaben."
|
||||
},
|
||||
"Doubao-1.5-thinking-vision-pro": {
|
||||
"description": "Ein neuartiges visuelles Tiefen-Denkmodell mit stärkeren allgemeinen multimodalen Verständnis- und Schlussfolgerungsfähigkeiten, das in 37 von 59 öffentlichen Bewertungsbenchmarks SOTA-Leistungen erzielt."
|
||||
},
|
||||
"Doubao-1.5-vision-pro": {
|
||||
"description": "Doubao-1.5-vision-pro ist ein neu verbessertes multimodales großes Modell, das beliebige Auflösungen und extreme Seitenverhältnisse bei der Bilderkennung unterstützt und die Fähigkeiten in visueller Schlussfolgerung, Dokumentenerkennung, Detailverständnis und Befolgung von Anweisungen verbessert."
|
||||
},
|
||||
"Doubao-1.5-vision-pro-32k": {
|
||||
"description": "Doubao-1.5-vision-pro ist das neueste Upgrade des multimodalen Großmodells, das die Erkennung von Bildern mit beliebiger Auflösung und extremen Seitenverhältnissen unterstützt und die Fähigkeiten zur visuellen Schlussfolgerung, Dokumentenerkennung, Detailverständnis und Befehlsbefolgung verbessert."
|
||||
},
|
||||
"Doubao-lite-128k": {
|
||||
"description": "Doubao-lite bietet eine extrem hohe Reaktionsgeschwindigkeit und ein hervorragendes Preis-Leistungs-Verhältnis und bietet den Kunden flexiblere Optionen für verschiedene Szenarien. Es unterstützt Schlussfolgerungen und Feinabstimmungen mit einem 128k-Kontextfenster."
|
||||
"description": "Doubao-lite bietet extrem schnelle Reaktionszeiten und ein hervorragendes Preis-Leistungs-Verhältnis, um Kunden in verschiedenen Szenarien flexiblere Optionen zu bieten. Unterstützt Inferenz und Feintuning mit einem Kontextfenster von 128k."
|
||||
},
|
||||
"Doubao-lite-32k": {
|
||||
"description": "Doubao-lite bietet eine extrem hohe Reaktionsgeschwindigkeit und ein hervorragendes Preis-Leistungs-Verhältnis und bietet den Kunden flexiblere Optionen für verschiedene Szenarien. Es unterstützt Schlussfolgerungen und Feinabstimmungen mit einem 32k-Kontextfenster."
|
||||
"description": "Doubao-lite bietet extrem schnelle Reaktionszeiten und ein hervorragendes Preis-Leistungs-Verhältnis, um Kunden in verschiedenen Szenarien flexiblere Optionen zu bieten. Unterstützt Inferenz und Feintuning mit einem Kontextfenster von 32k."
|
||||
},
|
||||
"Doubao-lite-4k": {
|
||||
"description": "Doubao-lite bietet eine extrem hohe Reaktionsgeschwindigkeit und ein hervorragendes Preis-Leistungs-Verhältnis und bietet den Kunden flexiblere Optionen für verschiedene Szenarien. Es unterstützt Schlussfolgerungen und Feinabstimmungen mit einem 4k-Kontextfenster."
|
||||
"description": "Doubao-lite bietet extrem schnelle Reaktionszeiten und ein hervorragendes Preis-Leistungs-Verhältnis, um Kunden in verschiedenen Szenarien flexiblere Optionen zu bieten. Unterstützt Inferenz und Feintuning mit einem Kontextfenster von 4k."
|
||||
},
|
||||
"Doubao-pro-128k": {
|
||||
"description": "Das leistungsstärkste Hauptmodell, das sich zur Verarbeitung komplexer Aufgaben eignet und in Szenarien wie Referenzfragen, Zusammenfassungen, Kreativität, Textklassifizierung und Rollenspiel sehr gute Ergebnisse erzielt. Es unterstützt Schlussfolgerungen und Feinabstimmungen mit einem 128k-Kontextfenster."
|
||||
},
|
||||
"Doubao-pro-256k": {
|
||||
"description": "Das leistungsstärkste Hauptmodell, das sich gut für komplexe Aufgaben eignet und in Szenarien wie Referenzfragen, Zusammenfassungen, kreatives Schreiben, Textklassifizierung und Rollenspiel hervorragende Ergebnisse erzielt. Es unterstützt Schlussfolgerungen und Feinabstimmungen mit einem Kontextfenster von 256k."
|
||||
"description": "Das leistungsstärkste Hauptmodell, geeignet für komplexe Aufgaben. Es erzielt hervorragende Ergebnisse in Szenarien wie Referenzfragen, Zusammenfassungen, kreatives Schreiben, Textklassifikation und Rollenspielen. Unterstützt Inferenz und Feintuning mit einem Kontextfenster von 128k."
|
||||
},
|
||||
"Doubao-pro-32k": {
|
||||
"description": "Das leistungsstärkste Hauptmodell, das sich zur Verarbeitung komplexer Aufgaben eignet und in Szenarien wie Referenzfragen, Zusammenfassungen, Kreativität, Textklassifizierung und Rollenspiel sehr gute Ergebnisse erzielt. Es unterstützt Schlussfolgerungen und Feinabstimmungen mit einem 32k-Kontextfenster."
|
||||
"description": "Das leistungsstärkste Hauptmodell, geeignet für komplexe Aufgaben. Es erzielt hervorragende Ergebnisse in Szenarien wie Referenzfragen, Zusammenfassungen, kreatives Schreiben, Textklassifikation und Rollenspielen. Unterstützt Inferenz und Feintuning mit einem Kontextfenster von 32k."
|
||||
},
|
||||
"Doubao-pro-4k": {
|
||||
"description": "Das leistungsstärkste Hauptmodell, das sich zur Verarbeitung komplexer Aufgaben eignet und in Szenarien wie Referenzfragen, Zusammenfassungen, Kreativität, Textklassifizierung und Rollenspiel sehr gute Ergebnisse erzielt. Es unterstützt Schlussfolgerungen und Feinabstimmungen mit einem 4k-Kontextfenster."
|
||||
},
|
||||
"Doubao-vision-lite-32k": {
|
||||
"description": "Das Doubao-vision-Modell ist ein multimodales Großmodell, das von Doubao eingeführt wurde und über starke Fähigkeiten zur Bildverständnis und Schlussfolgerung sowie präzise Befehlsverständnisfähigkeiten verfügt. Das Modell zeigt starke Leistungen bei der Extraktion von Bildtextinformationen und bildbasierten Schlussfolgerungsaufgaben und kann in komplexeren und breiteren visuellen Frage-Antwort-Aufgaben eingesetzt werden."
|
||||
},
|
||||
"Doubao-vision-pro-32k": {
|
||||
"description": "Das Doubao-vision-Modell ist ein multimodales Großmodell, das von Doubao eingeführt wurde und über starke Fähigkeiten zur Bildverständnis und Schlussfolgerung sowie präzise Befehlsverständnisfähigkeiten verfügt. Das Modell zeigt starke Leistungen bei der Extraktion von Bildtextinformationen und bildbasierten Schlussfolgerungsaufgaben und kann in komplexeren und breiteren visuellen Frage-Antwort-Aufgaben eingesetzt werden."
|
||||
"description": "Das leistungsstärkste Hauptmodell, geeignet für komplexe Aufgaben. Es erzielt hervorragende Ergebnisse in Szenarien wie Referenzfragen, Zusammenfassungen, kreatives Schreiben, Textklassifikation und Rollenspielen. Unterstützt Inferenz und Feintuning mit einem Kontextfenster von 4k."
|
||||
},
|
||||
"ERNIE-3.5-128K": {
|
||||
"description": "Das von Baidu entwickelte Flaggschiff-Modell für großangelegte Sprachverarbeitung, das eine riesige Menge an chinesischen und englischen Texten abdeckt. Es verfügt über starke allgemeine Fähigkeiten und kann die meisten Anforderungen an Dialogfragen, kreative Generierung und Anwendungsfälle von Plugins erfüllen. Es unterstützt die automatische Anbindung an das Baidu-Such-Plugin, um die Aktualität der Antwortinformationen zu gewährleisten."
|
||||
@@ -224,24 +203,21 @@
|
||||
"Pro/Qwen/Qwen2.5-VL-7B-Instruct": {
|
||||
"description": "Qwen2.5-VL ist ein neues Mitglied der Qwen-Serie und verfügt über leistungsstarke visuelle Wahrnehmungsfähigkeiten. Es kann Text, Diagramme und Layouts in Bildern analysieren, längere Videos verstehen und Ereignisse erfassen. Zudem kann es Schlussfolgerungen ziehen, Werkzeuge bedienen, mehrere Formate für Objektlokalisation unterstützen und strukturierte Ausgaben generieren. Die Videoverarbeitung wurde durch dynamische Auflösungs- und Frameratetraining optimiert, und die Effizienz des visuellen Encoders wurde verbessert."
|
||||
},
|
||||
"Pro/THUDM/GLM-4.1V-9B-Thinking": {
|
||||
"description": "GLM-4.1V-9B-Thinking ist ein von Zhipu AI und dem KEG-Labor der Tsinghua-Universität gemeinsam veröffentlichtes Open-Source-Visuell-Sprachmodell (VLM), das speziell für die Bewältigung komplexer multimodaler kognitiver Aufgaben entwickelt wurde. Das Modell basiert auf dem GLM-4-9B-0414-Grundmodell und verbessert durch die Einführung des „Chain-of-Thought“-Schlussmechanismus und den Einsatz von Verstärkungslernstrategien seine multimodale Schlussfolgerungsfähigkeit und Stabilität erheblich."
|
||||
},
|
||||
"Pro/THUDM/glm-4-9b-chat": {
|
||||
"description": "GLM-4-9B-Chat ist die Open-Source-Version des GLM-4-Modells, das von Zhizhu AI eingeführt wurde. Dieses Modell zeigt hervorragende Leistungen in den Bereichen Semantik, Mathematik, Inferenz, Code und Wissen. Neben der Unterstützung für mehrstufige Dialoge bietet GLM-4-9B-Chat auch fortgeschrittene Funktionen wie Web-Browsing, Code-Ausführung, benutzerdefinierte Tool-Aufrufe (Function Call) und langes Textverständnis. Das Modell unterstützt 26 Sprachen, darunter Chinesisch, Englisch, Japanisch, Koreanisch und Deutsch. In mehreren Benchmark-Tests zeigt GLM-4-9B-Chat hervorragende Leistungen, wie AlignBench-v2, MT-Bench, MMLU und C-Eval. Das Modell unterstützt eine maximale Kontextlänge von 128K und ist für akademische Forschung und kommerzielle Anwendungen geeignet."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1": {
|
||||
"description": "DeepSeek-R1 ist ein durch verstärkendes Lernen (RL) gesteuertes Inferenzmodell, das Probleme mit Wiederholungen und Lesbarkeit im Modell löst. Vor dem RL führte DeepSeek-R1 Kaltstartdaten ein, um die Inferenzleistung weiter zu optimieren. Es zeigt in mathematischen, programmierbezogenen und Inferenzaufgaben eine vergleichbare Leistung zu OpenAI-o1 und verbessert die Gesamtleistung durch sorgfältig gestaltete Trainingsmethoden."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1-0120": {
|
||||
"description": "DeepSeek-R1 ist ein durch verstärkendes Lernen (RL) gesteuertes Inferenzmodell, das Probleme der Wiederholungen und Lesbarkeit im Modell löst. Vor RL wurde ein Cold-Start-Datensatz eingeführt, um die Inferenzleistung weiter zu optimieren. Es zeigt vergleichbare Leistungen zu OpenAI-o1 in Mathematik, Programmierung und Inferenzaufgaben und verbessert die Gesamtleistung durch sorgfältig gestaltete Trainingsmethoden."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B": {
|
||||
"description": "DeepSeek-R1-Distill-Qwen-7B ist ein Modell, das durch Wissensdistillierung auf Basis von Qwen2.5-Math-7B erstellt wurde. Dieses Modell wurde mit 800.000 sorgfältig ausgewählten Beispielen, die von DeepSeek-R1 generiert wurden, feinjustiert und zeigt ausgezeichnete Inferenzfähigkeiten. Es erzielte in mehreren Benchmarks hervorragende Ergebnisse, darunter eine Genauigkeit von 92,8 % im MATH-500, einen Durchgangsrate von 55,5 % im AIME 2024 und eine Bewertung von 1189 auf CodeForces, was seine starken mathematischen und programmierischen Fähigkeiten als Modell mit 7B Parametern unterstreicht."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-V3": {
|
||||
"description": "DeepSeek-V3 ist ein hybrides Experten (MoE) Sprachmodell mit 6710 Milliarden Parametern, das eine Multi-Head-Latente-Attention (MLA) und DeepSeekMoE-Architektur verwendet, kombiniert mit einer Lastenausgleichsstrategie ohne Hilfskosten, um die Inferenz- und Trainingseffizienz zu optimieren. Durch das Pre-Training auf 14,8 Billionen hochwertigen Tokens und anschließende überwachte Feinabstimmung und verstärktes Lernen übertrifft DeepSeek-V3 in der Leistung andere Open-Source-Modelle und nähert sich führenden geschlossenen Modellen."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-V3-1226": {
|
||||
"description": "DeepSeek-V3 ist ein hybrides Expertenmodell (MoE) mit 6710 Milliarden Parametern, das eine Multi-Head-Latente-Attention (MLA) und die DeepSeekMoE-Architektur verwendet, kombiniert mit einer Lastenausgleichsstrategie ohne Hilfskosten, um die Effizienz von Inferenz und Training zu optimieren. Durch das Pre-Training auf 14,8 Billionen hochwertigen Tokens und anschließendes überwachten Feintuning und verstärkendes Lernen übertrifft DeepSeek-V3 in der Leistung andere Open-Source-Modelle und nähert sich führenden Closed-Source-Modellen."
|
||||
},
|
||||
"QwQ-32B-Preview": {
|
||||
"description": "QwQ-32B-Preview ist ein innovatives Modell für die Verarbeitung natürlicher Sprache, das komplexe Aufgaben der Dialoggenerierung und des Kontextverständnisses effizient bewältigen kann."
|
||||
},
|
||||
@@ -404,6 +380,9 @@
|
||||
"THUDM/GLM-4-9B-0414": {
|
||||
"description": "GLM-4-9B-0414 ist ein kleines Modell der GLM-Serie mit 9 Milliarden Parametern. Dieses Modell übernimmt die technischen Merkmale der GLM-4-32B-Serie, bietet jedoch eine leichtere Bereitstellungsoption. Trotz seiner kleineren Größe zeigt GLM-4-9B-0414 hervorragende Fähigkeiten in Aufgaben wie Codegenerierung, Webdesign, SVG-Grafikgenerierung und suchbasiertem Schreiben."
|
||||
},
|
||||
"THUDM/GLM-4.1V-9B-Thinking": {
|
||||
"description": "GLM-4.1V-9B-Thinking ist ein von Zhipu AI und dem KEG-Labor der Tsinghua-Universität gemeinsam veröffentlichtes Open-Source-Visuell-Sprachmodell (VLM), das speziell für die Bewältigung komplexer multimodaler kognitiver Aufgaben entwickelt wurde. Das Modell basiert auf dem GLM-4-9B-0414-Grundmodell und verbessert durch die Einführung des „Chain-of-Thought“-Schlussmechanismus und den Einsatz von Verstärkungslernstrategien seine multimodale Schlussfolgerungsfähigkeit und Stabilität erheblich."
|
||||
},
|
||||
"THUDM/GLM-Z1-32B-0414": {
|
||||
"description": "GLM-Z1-32B-0414 ist ein Schlussfolgerungsmodell mit tiefen Denkfähigkeiten. Dieses Modell wurde auf der Grundlage von GLM-4-32B-0414 durch Kaltstart und verstärktes Lernen entwickelt und wurde weiter in Mathematik, Programmierung und logischen Aufgaben trainiert. Im Vergleich zum Basismodell hat GLM-Z1-32B-0414 die mathematischen Fähigkeiten und die Fähigkeit zur Lösung komplexer Aufgaben erheblich verbessert."
|
||||
},
|
||||
@@ -560,6 +539,9 @@
|
||||
"anthropic/claude-sonnet-4": {
|
||||
"description": "Claude Sonnet 4 kann nahezu sofortige Antworten oder verlängerte schrittweise Überlegungen erzeugen, die für den Nutzer klar nachvollziehbar sind. API-Nutzer können zudem die Denkzeit des Modells präzise steuern."
|
||||
},
|
||||
"ascend-tribe/pangu-pro-moe": {
|
||||
"description": "Pangu-Pro-MoE 72B-A16B ist ein spärlich besetztes großes Sprachmodell mit 72 Milliarden Parametern und 16 Milliarden aktivierten Parametern. Es basiert auf der gruppierten Mixture-of-Experts-Architektur (MoGE), bei der Experten in Gruppen eingeteilt werden und Tokens innerhalb jeder Gruppe eine gleiche Anzahl von Experten aktivieren, um eine ausgewogene Expertenauslastung zu gewährleisten. Dies verbessert die Effizienz der Modellausführung auf der Ascend-Plattform erheblich."
|
||||
},
|
||||
"aya": {
|
||||
"description": "Aya 23 ist ein mehrsprachiges Modell von Cohere, das 23 Sprachen unterstützt und die Anwendung in einer Vielzahl von Sprachen erleichtert."
|
||||
},
|
||||
@@ -569,6 +551,9 @@
|
||||
"baichuan/baichuan2-13b-chat": {
|
||||
"description": "Baichuan-13B ist ein Open-Source-Sprachmodell mit 13 Milliarden Parametern, das von Baichuan Intelligence entwickelt wurde und in autorisierten chinesischen und englischen Benchmarks die besten Ergebnisse in seiner Größenordnung erzielt hat."
|
||||
},
|
||||
"baidu/ERNIE-4.5-300B-A47B": {
|
||||
"description": "ERNIE-4.5-300B-A47B ist ein von Baidu entwickeltes großes Sprachmodell, das auf einer Mixture-of-Experts (MoE)-Architektur basiert. Das Modell verfügt über insgesamt 300 Milliarden Parameter, aktiviert jedoch bei der Inferenz nur 47 Milliarden Parameter pro Token, was eine starke Leistung bei gleichzeitig hoher Rechen-effizienz gewährleistet. Als eines der Kernmodelle der ERNIE 4.5-Serie zeigt es herausragende Fähigkeiten in Textverständnis, -generierung, Schlussfolgerung und Programmierung. Das Modell verwendet eine innovative multimodale heterogene MoE-Vortrainingsmethode, die durch gemeinsames Training von Text- und visuellen Modalitäten die Gesamtleistung verbessert, insbesondere bei der Befolgung von Anweisungen und dem Erinnern von Weltwissen."
|
||||
},
|
||||
"c4ai-aya-expanse-32b": {
|
||||
"description": "Aya Expanse ist ein leistungsstarkes 32B mehrsprachiges Modell, das darauf abzielt, die Leistung von einsprachigen Modellen durch innovative Ansätze wie Anweisungsoptimierung, Datenarbitrage, Präferenztraining und Modellfusion herauszufordern. Es unterstützt 23 Sprachen."
|
||||
},
|
||||
@@ -914,18 +899,54 @@
|
||||
"doubao-1.5-thinking-pro": {
|
||||
"description": "Das Doubao-1.5 Modell für tiefes Denken ist neu und zeichnet sich in Fachbereichen wie Mathematik, Programmierung und wissenschaftlichem Denken sowie in allgemeinen Aufgaben wie kreativem Schreiben aus. Es erreicht oder nähert sich in mehreren renommierten Benchmarks wie AIME 2024, Codeforces und GPQA dem Spitzenlevel der Branche. Es unterstützt ein Kontextfenster von 128k und eine Ausgabe von 16k."
|
||||
},
|
||||
"doubao-1.5-thinking-pro-m": {
|
||||
"description": "Doubao-1.5 ist ein neues tiefgründiges Denkmodell (m-Version mit nativer multimodaler Tiefeninferenzfähigkeit), das in Fachgebieten wie Mathematik, Programmierung, wissenschaftlichem Denken sowie bei allgemeinen Aufgaben wie kreativem Schreiben herausragende Leistungen zeigt. Erreicht oder nähert sich in renommierten Benchmarks wie AIME 2024, Codeforces und GPQA der Spitzenklasse der Branche. Unterstützt ein Kontextfenster von 128k und eine Ausgabe von 16k."
|
||||
},
|
||||
"doubao-1.5-thinking-vision-pro": {
|
||||
"description": "Neues visuelles Tiefendenkmodell mit stärkerer allgemeiner multimodaler Verständnis- und Inferenzfähigkeit, das in 37 von 59 öffentlichen Benchmark-Tests SOTA-Leistungen erzielt."
|
||||
},
|
||||
"doubao-1.5-ui-tars": {
|
||||
"description": "Doubao-1.5-UI-TARS ist ein nativer Agentenmodell für grafische Benutzeroberflächen (GUI). Es interagiert nahtlos mit GUIs durch menschenähnliche Fähigkeiten wie Wahrnehmung, Inferenz und Handlung."
|
||||
},
|
||||
"doubao-1.5-vision-lite": {
|
||||
"description": "Doubao-1.5-vision-lite ist ein neu verbessertes multimodales großes Modell, das beliebige Auflösungen und extreme Seitenverhältnisse bei der Bilderkennung unterstützt und die Fähigkeiten in visueller Schlussfolgerung, Dokumentenerkennung, Detailverständnis und Befolgung von Anweisungen verbessert. Es unterstützt ein Kontextfenster von 128k und eine maximale Ausgabelänge von 16k Tokens."
|
||||
},
|
||||
"doubao-1.5-vision-pro": {
|
||||
"description": "Doubao-1.5-vision-pro ist ein neu aufgerüstetes multimodales Großmodell, das Bilderkennung in beliebiger Auflösung und extremen Seitenverhältnissen unterstützt und die Fähigkeiten in visueller Inferenz, Dokumentenerkennung, Detailverständnis und Befolgung von Anweisungen verbessert."
|
||||
},
|
||||
"doubao-1.5-vision-pro-32k": {
|
||||
"description": "Doubao-1.5-vision-pro ist ein neu aufgerüstetes multimodales Großmodell, das Bilderkennung in beliebiger Auflösung und extremen Seitenverhältnissen unterstützt und die Fähigkeiten in visueller Inferenz, Dokumentenerkennung, Detailverständnis und Befolgung von Anweisungen verbessert."
|
||||
},
|
||||
"doubao-lite-128k": {
|
||||
"description": "Bietet extrem schnelle Reaktionszeiten und ein hervorragendes Preis-Leistungs-Verhältnis, um Kunden in verschiedenen Szenarien flexiblere Optionen zu bieten. Unterstützt Inferenz und Feintuning mit einem Kontextfenster von 128k."
|
||||
},
|
||||
"doubao-lite-32k": {
|
||||
"description": "Bietet extrem schnelle Reaktionszeiten und ein hervorragendes Preis-Leistungs-Verhältnis, um Kunden in verschiedenen Szenarien flexiblere Optionen zu bieten. Unterstützt Inferenz und Feintuning mit einem Kontextfenster von 32k."
|
||||
},
|
||||
"doubao-lite-4k": {
|
||||
"description": "Bietet extrem schnelle Reaktionszeiten und ein hervorragendes Preis-Leistungs-Verhältnis, um Kunden in verschiedenen Szenarien flexiblere Optionen zu bieten. Unterstützt Inferenz und Feintuning mit einem Kontextfenster von 4k."
|
||||
},
|
||||
"doubao-pro-256k": {
|
||||
"description": "Das leistungsstärkste Hauptmodell, geeignet für komplexe Aufgaben. Es erzielt hervorragende Ergebnisse in Szenarien wie Referenzfragen, Zusammenfassungen, kreatives Schreiben, Textklassifikation und Rollenspielen. Unterstützt Inferenz und Feintuning mit einem Kontextfenster von 256k."
|
||||
},
|
||||
"doubao-pro-32k": {
|
||||
"description": "Das leistungsstärkste Hauptmodell, geeignet für komplexe Aufgaben. Es erzielt hervorragende Ergebnisse in Szenarien wie Referenzfragen, Zusammenfassungen, kreatives Schreiben, Textklassifikation und Rollenspielen. Unterstützt Inferenz und Feintuning mit einem Kontextfenster von 32k."
|
||||
},
|
||||
"doubao-seed-1.6": {
|
||||
"description": "Doubao-Seed-1.6 ist ein neues multimodales Modell für tiefgehendes Denken, das drei Denkmodi unterstützt: auto, thinking und non-thinking. Im non-thinking-Modus ist die Leistung im Vergleich zu Doubao-1.5-pro/250115 deutlich verbessert. Unterstützt ein Kontextfenster von 256k und eine maximale Ausgabelänge von 16k Tokens."
|
||||
"description": "Doubao-Seed-1.6 ist ein neues multimodales Modell für tiefgehendes Denken, das drei Denkmodi unterstützt: auto, thinking und non-thinking. Im non-thinking-Modus ist die Modellleistung im Vergleich zu Doubao-1.5-pro/250115 deutlich verbessert. Unterstützt ein Kontextfenster von 256k und eine maximale Ausgabelänge von 16k Tokens."
|
||||
},
|
||||
"doubao-seed-1.6-flash": {
|
||||
"description": "Doubao-Seed-1.6-flash ist ein multimodales Modell für tiefgehendes Denken mit extrem schneller Inferenzgeschwindigkeit, TPOT benötigt nur 10 ms; unterstützt sowohl Text- als auch visuelle Verarbeitung, die Textverständnisfähigkeit übertrifft die vorherige Lite-Generation, das visuelle Verständnis ist vergleichbar mit den Pro-Modellen der Konkurrenz. Unterstützt ein Kontextfenster von 256k und eine maximale Ausgabelänge von 16k Tokens."
|
||||
"description": "Doubao-Seed-1.6-flash ist ein multimodales Modell für tiefgehendes Denken mit extrem schneller Inferenzgeschwindigkeit, TPOT benötigt nur 10 ms; unterstützt sowohl Text- als auch visuelles Verständnis, die Textverständnisfähigkeit übertrifft die vorherige Lite-Generation, das visuelle Verständnis ist vergleichbar mit den Pro-Modellen der Konkurrenz. Unterstützt ein Kontextfenster von 256k und eine maximale Ausgabelänge von 16k Tokens."
|
||||
},
|
||||
"doubao-seed-1.6-thinking": {
|
||||
"description": "Das Doubao-Seed-1.6-thinking Modell verfügt über stark verbesserte Denkfähigkeiten. Im Vergleich zu Doubao-1.5-thinking-pro wurden die Grundfähigkeiten in Coding, Mathematik und logischem Denken weiter verbessert und unterstützt visuelles Verständnis. Unterstützt ein Kontextfenster von 256k und eine maximale Ausgabelänge von 16k Tokens."
|
||||
},
|
||||
"doubao-vision-lite-32k": {
|
||||
"description": "Das Doubao-vision-Modell ist ein multimodales Großmodell von Doubao mit starker Bildverständnis- und Inferenzfähigkeit sowie präziser Befehlsinterpretation. Es zeigt starke Leistung bei der Extraktion von Bild- und Textinformationen sowie bei bildbasierten Inferenzaufgaben und eignet sich für komplexere und umfassendere visuelle Frage-Antwort-Aufgaben."
|
||||
},
|
||||
"doubao-vision-pro-32k": {
|
||||
"description": "Das Doubao-vision-Modell ist ein multimodales Großmodell von Doubao mit starker Bildverständnis- und Inferenzfähigkeit sowie präziser Befehlsinterpretation. Es zeigt starke Leistung bei der Extraktion von Bild- und Textinformationen sowie bei bildbasierten Inferenzaufgaben und eignet sich für komplexere und umfassendere visuelle Frage-Antwort-Aufgaben."
|
||||
},
|
||||
"emohaa": {
|
||||
"description": "Emohaa ist ein psychologisches Modell mit professionellen Beratungsfähigkeiten, das den Nutzern hilft, emotionale Probleme zu verstehen."
|
||||
},
|
||||
@@ -1082,9 +1103,6 @@
|
||||
"gemini-2.5-pro": {
|
||||
"description": "Gemini 2.5 Pro ist Googles fortschrittlichstes Denkmodell, das komplexe Probleme in den Bereichen Code, Mathematik und MINT-Fächer lösen kann und große Datensätze, Codebasen und Dokumente mit langem Kontext analysiert."
|
||||
},
|
||||
"gemini-2.5-pro-exp-03-25": {
|
||||
"description": "Gemini 2.5 Pro Experimental ist Googles fortschrittlichstes Denkmodell, das in der Lage ist, komplexe Probleme in den Bereichen Code, Mathematik und STEM zu analysieren. Es kann auch lange Kontexte nutzen, um große Datensätze, Codebasen und Dokumente zu analysieren."
|
||||
},
|
||||
"gemini-2.5-pro-preview-03-25": {
|
||||
"description": "Gemini 2.5 Pro Preview ist Googles fortschrittlichstes Denkmodell, das in der Lage ist, komplexe Probleme in den Bereichen Code, Mathematik und STEM zu analysieren sowie große Datensätze, Codebasen und Dokumente mithilfe von langen Kontextanalysen zu verarbeiten."
|
||||
},
|
||||
@@ -1151,6 +1169,12 @@
|
||||
"glm-4-plus": {
|
||||
"description": "GLM-4-Plus ist das hochintelligente Flaggschiffmodell mit starken Fähigkeiten zur Verarbeitung langer Texte und komplexer Aufgaben, mit umfassenden Leistungsverbesserungen."
|
||||
},
|
||||
"glm-4.1v-thinking-flash": {
|
||||
"description": "Die GLM-4.1V-Thinking-Serie ist das leistungsstärkste visuelle Modell unter den bekannten 10-Milliarden-Parameter-VLMs und integriert SOTA-Leistungen auf diesem Niveau in verschiedenen visuellen Sprachaufgaben, darunter Videoverstehen, Bildfragen, Fachaufgaben, OCR-Texterkennung, Dokumenten- und Diagramminterpretation, GUI-Agenten, Frontend-Web-Coding und Grounding. In vielen Aufgaben übertrifft es sogar das Qwen2.5-VL-72B mit achtmal so vielen Parametern. Durch fortschrittliche Verstärkungslernverfahren beherrscht das Modell die Chain-of-Thought-Schlussfolgerung, was die Genauigkeit und Detailtiefe der Antworten deutlich verbessert und in Bezug auf Endergebnis und Erklärbarkeit traditionelle Nicht-Thinking-Modelle übertrifft."
|
||||
},
|
||||
"glm-4.1v-thinking-flashx": {
|
||||
"description": "Die GLM-4.1V-Thinking-Serie ist das leistungsstärkste visuelle Modell unter den bekannten 10-Milliarden-Parameter-VLMs und integriert SOTA-Leistungen auf diesem Niveau in verschiedenen visuellen Sprachaufgaben, darunter Videoverstehen, Bildfragen, Fachaufgaben, OCR-Texterkennung, Dokumenten- und Diagramminterpretation, GUI-Agenten, Frontend-Web-Coding und Grounding. In vielen Aufgaben übertrifft es sogar das Qwen2.5-VL-72B mit achtmal so vielen Parametern. Durch fortschrittliche Verstärkungslernverfahren beherrscht das Modell die Chain-of-Thought-Schlussfolgerung, was die Genauigkeit und Detailtiefe der Antworten deutlich verbessert und in Bezug auf Endergebnis und Erklärbarkeit traditionelle Nicht-Thinking-Modelle übertrifft."
|
||||
},
|
||||
"glm-4v": {
|
||||
"description": "GLM-4V bietet starke Fähigkeiten zur Bildverständnis und -schlussfolgerung und unterstützt eine Vielzahl visueller Aufgaben."
|
||||
},
|
||||
@@ -1172,6 +1196,9 @@
|
||||
"glm-z1-flash": {
|
||||
"description": "Die GLM-Z1-Serie verfügt über starke Fähigkeiten zur komplexen Schlussfolgerung und zeigt in den Bereichen logische Schlussfolgerung, Mathematik und Programmierung hervorragende Leistungen. Die maximale Kontextlänge beträgt 32K."
|
||||
},
|
||||
"glm-z1-flashx": {
|
||||
"description": "Hohe Geschwindigkeit zu niedrigem Preis: Flash-verbesserte Version mit ultraschneller Inferenzgeschwindigkeit und schnellerer gleichzeitiger Verarbeitung."
|
||||
},
|
||||
"glm-zero-preview": {
|
||||
"description": "GLM-Zero-Preview verfügt über starke Fähigkeiten zur komplexen Schlussfolgerung und zeigt hervorragende Leistungen in den Bereichen logisches Denken, Mathematik und Programmierung."
|
||||
},
|
||||
@@ -1223,6 +1250,9 @@
|
||||
"google/gemma-2b-it": {
|
||||
"description": "Gemma Instruct (2B) bietet grundlegende Anweisungsverarbeitungsfähigkeiten und eignet sich für leichte Anwendungen."
|
||||
},
|
||||
"google/gemma-3-1b-it": {
|
||||
"description": "Gemma 3 1B ist ein Open-Source-Sprachmodell von Google, das neue Maßstäbe in Effizienz und Leistung setzt."
|
||||
},
|
||||
"google/gemma-3-27b-it": {
|
||||
"description": "Gemma 3 27B ist ein Open-Source-Sprachmodell von Google, das neue Maßstäbe in Bezug auf Effizienz und Leistung setzt."
|
||||
},
|
||||
@@ -1313,6 +1343,9 @@
|
||||
"gpt-4o-mini-search-preview": {
|
||||
"description": "Die GPT-4o mini Suchvorschau ist ein speziell trainiertes Modell zur Interpretation und Ausführung von Websuchanfragen, das die Chat Completions API verwendet. Neben den Token-Gebühren fallen für Websuchanfragen zusätzliche Gebühren pro Tool-Aufruf an."
|
||||
},
|
||||
"gpt-4o-mini-transcribe": {
|
||||
"description": "GPT-4o Mini Transcribe ist ein Sprach-zu-Text-Modell, das GPT-4o zur Transkription von Audio verwendet. Im Vergleich zum ursprünglichen Whisper-Modell verbessert es die Wortfehlerrate sowie die Spracherkennung und Genauigkeit. Verwenden Sie es für genauere Transkriptionen."
|
||||
},
|
||||
"gpt-4o-mini-tts": {
|
||||
"description": "GPT-4o mini TTS ist ein Text-to-Speech-Modell, das auf GPT-4o mini basiert und hochwertige Sprachgenerierung bei niedrigeren Kosten bietet."
|
||||
},
|
||||
@@ -1322,12 +1355,15 @@
|
||||
"gpt-4o-realtime-preview-2024-10-01": {
|
||||
"description": "Echtzeitversion von GPT-4o, unterstützt Audio- und Texteingabe sowie -ausgabe in Echtzeit."
|
||||
},
|
||||
"gpt-4o-realtime-preview-2024-12-17": {
|
||||
"description": "Echtzeitversion von GPT-4o, unterstützt Audio- und Texteingabe sowie -ausgabe in Echtzeit."
|
||||
"gpt-4o-realtime-preview-2025-06-03": {
|
||||
"description": "Echtzeitversion von GPT-4o, unterstützt Echtzeit-Ein- und Ausgabe von Audio und Text."
|
||||
},
|
||||
"gpt-4o-search-preview": {
|
||||
"description": "Die GPT-4o Suchvorschau ist ein speziell trainiertes Modell zur Interpretation und Ausführung von Websuchanfragen, das die Chat Completions API verwendet. Neben den Token-Gebühren fallen für Websuchanfragen zusätzliche Gebühren pro Tool-Aufruf an."
|
||||
},
|
||||
"gpt-4o-transcribe": {
|
||||
"description": "GPT-4o Transcribe ist ein Sprach-zu-Text-Modell, das GPT-4o zur Transkription von Audio verwendet. Im Vergleich zum ursprünglichen Whisper-Modell verbessert es die Wortfehlerrate sowie die Spracherkennung und Genauigkeit. Verwenden Sie es für genauere Transkriptionen."
|
||||
},
|
||||
"grok-2-1212": {
|
||||
"description": "Dieses Modell hat Verbesserungen in Bezug auf Genauigkeit, Befolgung von Anweisungen und Mehrsprachigkeit erfahren."
|
||||
},
|
||||
@@ -1346,9 +1382,15 @@
|
||||
"grok-3-mini-fast": {
|
||||
"description": "Ein leichtgewichtiges Modell, das vor der Antwort nachdenkt. Es arbeitet schnell und intelligent, eignet sich für logische Aufgaben ohne tiefgehendes Fachwissen und ermöglicht die Nachverfolgung des ursprünglichen Denkprozesses."
|
||||
},
|
||||
"grok-4": {
|
||||
"description": "Unser neuestes und leistungsstärkstes Flaggschiffmodell, das in der Verarbeitung natürlicher Sprache, mathematischen Berechnungen und logischem Denken herausragende Leistungen erbringt – ein perfekter Allrounder."
|
||||
},
|
||||
"gryphe/mythomax-l2-13b": {
|
||||
"description": "MythoMax l2 13B ist ein Sprachmodell, das Kreativität und Intelligenz kombiniert und mehrere führende Modelle integriert."
|
||||
},
|
||||
"hunyuan-a13b": {
|
||||
"description": "Hunyuan ist das erste hybride Schlussfolgerungsmodell, eine Weiterentwicklung von hunyuan-standard-256K mit insgesamt 80 Milliarden Parametern und 13 Milliarden aktivierten Parametern. Standardmäßig im langsamen Denkmodus, unterstützt es den Wechsel zwischen schnellem und langsamem Denkmodus über Parameter oder Anweisungen, wobei der Wechsel durch Voranstellen von query mit / no_think erfolgt. Die Gesamtleistung wurde gegenüber der Vorgängergeneration deutlich verbessert, insbesondere in Mathematik, Naturwissenschaften, Langtextverständnis und Agentenfähigkeiten."
|
||||
},
|
||||
"hunyuan-code": {
|
||||
"description": "Das neueste Code-Generierungsmodell von Hunyuan, das auf einem Basismodell mit 200B hochwertigen Code-Daten trainiert wurde, hat ein halbes Jahr lang mit hochwertigen SFT-Daten trainiert, das Kontextfenster auf 8K erhöht und belegt in den automatischen Bewertungsmetriken für die fünf großen Programmiersprachen Spitzenplätze; in den zehn Aspekten der umfassenden Codeaufgabenbewertung für die fünf großen Sprachen liegt die Leistung in der ersten Reihe."
|
||||
},
|
||||
@@ -1400,6 +1442,9 @@
|
||||
"hunyuan-t1-vision": {
|
||||
"description": "Hunyuan ist ein multimodales Verständnis- und Tiefdenkmodell, das native multimodale lange Denkprozesse unterstützt. Es ist spezialisiert auf verschiedene Bildinferenzszenarien und zeigt im Vergleich zu Schnelldenkmodellen umfassende Verbesserungen bei naturwissenschaftlichen Problemen."
|
||||
},
|
||||
"hunyuan-t1-vision-20250619": {
|
||||
"description": "Die neueste Version des hunyuan t1-vision multimodalen tiefen Denkmodells unterstützt native multimodale Chain-of-Thought-Mechanismen und bietet im Vergleich zur vorherigen Standardversion umfassende Verbesserungen."
|
||||
},
|
||||
"hunyuan-turbo": {
|
||||
"description": "Die Vorschauversion des neuen großen Sprachmodells von Hunyuan verwendet eine neuartige hybride Expertenmodellstruktur (MoE) und bietet im Vergleich zu Hunyuan-Pro eine schnellere Inferenz und bessere Leistung."
|
||||
},
|
||||
@@ -1430,6 +1475,12 @@
|
||||
"hunyuan-turbos-role-plus": {
|
||||
"description": "Die neueste Version des Hunyuan-Rollenspielsmodells, feinabgestimmt und trainiert von Hunyuan, basiert auf dem Hunyuan-Modell und wurde mit Datensätzen für Rollenspielszenarien weiter trainiert, um in Rollenspielszenarien bessere Grundleistungen zu erzielen."
|
||||
},
|
||||
"hunyuan-turbos-vision": {
|
||||
"description": "Dieses Modell eignet sich für Szenarien mit Bild- und Textverständnis und basiert auf dem neuesten hunyuan turbos. Es ist ein neues Flaggschiff-Visuell-Sprachmodell, das sich auf Aufgaben des Bild-Text-Verstehens konzentriert, einschließlich bildbasierter Entitätenerkennung, Wissensfragen, Textkreation und fotografiebasierter Problemlösung, mit umfassenden Verbesserungen gegenüber der Vorgängerversion."
|
||||
},
|
||||
"hunyuan-turbos-vision-20250619": {
|
||||
"description": "Die neueste Version des hunyuan turbos-vision Flaggschiff-Visuell-Sprachmodells bietet umfassende Verbesserungen bei Aufgaben des Bild-Text-Verstehens, einschließlich bildbasierter Entitätenerkennung, Wissensfragen, Textkreation und fotografiebasierter Problemlösung, im Vergleich zur vorherigen Standardversion."
|
||||
},
|
||||
"hunyuan-vision": {
|
||||
"description": "Das neueste multimodale Modell von Hunyuan unterstützt die Eingabe von Bildern und Text zur Generierung von Textinhalten."
|
||||
},
|
||||
@@ -1457,6 +1508,9 @@
|
||||
"jina-deepsearch-v1": {
|
||||
"description": "Die Tiefensuche kombiniert Websuche, Lesen und Schlussfolgern und ermöglicht umfassende Untersuchungen. Sie können es als einen Agenten betrachten, der Ihre Forschungsaufgaben übernimmt – er führt eine umfassende Suche durch und iteriert mehrfach, bevor er eine Antwort gibt. Dieser Prozess umfasst kontinuierliche Forschung, Schlussfolgerungen und die Lösung von Problemen aus verschiedenen Perspektiven. Dies unterscheidet sich grundlegend von den Standard-Großmodellen, die Antworten direkt aus vortrainierten Daten generieren, sowie von traditionellen RAG-Systemen, die auf einmaligen Oberflächensuchen basieren."
|
||||
},
|
||||
"kimi-k2-0711-preview": {
|
||||
"description": "kimi-k2 ist ein MoE-Architektur-Basis-Modell mit außergewöhnlichen Fähigkeiten in Code und Agentenfunktionen, mit insgesamt 1 Billion Parametern und 32 Milliarden aktiven Parametern. In Benchmark-Tests zu allgemeinem Wissen, Programmierung, Mathematik und Agenten übertrifft das K2-Modell andere führende Open-Source-Modelle."
|
||||
},
|
||||
"kimi-latest": {
|
||||
"description": "Das Kimi intelligente Assistenzprodukt verwendet das neueste Kimi Großmodell, das möglicherweise noch instabile Funktionen enthält. Es unterstützt die Bildverarbeitung und wählt automatisch das Abrechnungsmodell 8k/32k/128k basierend auf der Länge des angeforderten Kontexts aus."
|
||||
},
|
||||
@@ -1869,7 +1923,7 @@
|
||||
"description": "o1 ist OpenAIs neues Inferenzmodell, das für komplexe Aufgaben geeignet ist, die umfangreiches Allgemeinwissen erfordern. Das Modell hat einen Kontext von 128K und einen Wissensstand bis Oktober 2023."
|
||||
},
|
||||
"o1-pro": {
|
||||
"description": "Die o1-Modellreihe wurde durch verstärkendes Lernen trainiert, um vor der Antwort nachzudenken und komplexe logische Aufgaben auszuführen. Das o1-pro Modell nutzt mehr Rechenressourcen für tiefere Überlegungen und liefert dadurch kontinuierlich qualitativ hochwertigere Antworten."
|
||||
"description": "Die o1-Serie wurde durch verstärkendes Lernen trainiert, um vor der Antwort nachzudenken und komplexe Schlussfolgerungen zu ziehen. Das o1-pro Modell nutzt mehr Rechenressourcen für tiefere Überlegungen und liefert dadurch kontinuierlich qualitativ hochwertigere Antworten."
|
||||
},
|
||||
"o3": {
|
||||
"description": "o3 ist ein vielseitiges und leistungsstarkes Modell, das in mehreren Bereichen hervorragende Leistungen zeigt. Es setzt neue Maßstäbe für mathematische, wissenschaftliche, programmiertechnische und visuelle Schlussfolgerungsaufgaben. Es ist auch versiert in technischer Schreibweise und der Befolgung von Anweisungen. Benutzer können es nutzen, um Texte, Code und Bilder zu analysieren und komplexe Probleme mit mehreren Schritten zu lösen."
|
||||
@@ -2349,7 +2403,7 @@
|
||||
"description": "Das Modell v0-1.5-md ist für alltägliche Aufgaben und die Generierung von Benutzeroberflächen (UI) geeignet"
|
||||
},
|
||||
"whisper-1": {
|
||||
"description": "Allgemeines Spracherkennungsmodell, unterstützt mehrsprachige Spracherkennung, Sprachübersetzung und Spracherkennung."
|
||||
"description": "Universelles Spracherkennungsmodell, unterstützt mehrsprachige Spracherkennung, Sprachübersetzung und Spracherkennung."
|
||||
},
|
||||
"wizardlm2": {
|
||||
"description": "WizardLM 2 ist ein Sprachmodell von Microsoft AI, das in komplexen Dialogen, mehrsprachigen Anwendungen, Schlussfolgerungen und intelligenten Assistenten besonders gut abschneidet."
|
||||
|
||||
@@ -520,6 +520,7 @@
|
||||
"hotkey": "Tastenkombinationen",
|
||||
"llm": "Sprachmodell",
|
||||
"provider": "KI-Dienstanbieter",
|
||||
"proxy": "Netzwerkproxy",
|
||||
"storage": "Datenspeicher",
|
||||
"sync": "Cloud-Synchronisierung",
|
||||
"system-agent": "Systemassistent",
|
||||
|
||||
@@ -46,6 +46,9 @@
|
||||
"reasoningEffort": {
|
||||
"title": "Reasoning Intensity"
|
||||
},
|
||||
"thinking": {
|
||||
"title": "Deep Thinking Switch"
|
||||
},
|
||||
"title": "Model Extension Features"
|
||||
},
|
||||
"history": {
|
||||
|
||||
@@ -1,4 +1,43 @@
|
||||
{
|
||||
"proxy": {
|
||||
"auth": "Authentication Required",
|
||||
"authDesc": "If the proxy server requires a username and password",
|
||||
"authSettings": "Authentication Settings",
|
||||
"basicSettings": "Proxy Settings",
|
||||
"basicSettingsDesc": "Configure the connection parameters for the proxy server",
|
||||
"bypass": "Addresses not using the proxy",
|
||||
"connectionTest": "Connection Test",
|
||||
"enable": "Enable Proxy",
|
||||
"enableDesc": "When enabled, network access will be routed through the proxy server",
|
||||
"password": "Password",
|
||||
"password_placeholder": "Please enter your password",
|
||||
"port": "Port",
|
||||
"resetButton": "Reset",
|
||||
"saveButton": "Save",
|
||||
"saveFailed": "Save failed: {{error}}",
|
||||
"saveSuccess": "Proxy settings saved successfully",
|
||||
"server": "Server Address",
|
||||
"testButton": "Test Connection",
|
||||
"testDescription": "Test the connection using the current proxy configuration to verify if it works properly",
|
||||
"testFailed": "Connection failed",
|
||||
"testSuccessWithTime": "Connection test succeeded, took {{time}} ms",
|
||||
"testUrl": "Test URL",
|
||||
"testUrlPlaceholder": "Please enter the URL to test",
|
||||
"testing": "Testing Connection...",
|
||||
"type": "Proxy Type",
|
||||
"unsavedChanges": "You have unsaved changes",
|
||||
"username": "Username",
|
||||
"username_placeholder": "Please enter your username",
|
||||
"validation": {
|
||||
"passwordRequired": "Password is required when authentication is enabled",
|
||||
"portInvalid": "Port must be a number between 1 and 65535",
|
||||
"portRequired": "Port is required when proxy is enabled",
|
||||
"serverInvalid": "Please enter a valid server address (IP or domain name)",
|
||||
"serverRequired": "Server address is required when proxy is enabled",
|
||||
"typeRequired": "Proxy type is required when proxy is enabled",
|
||||
"usernameRequired": "Username is required when authentication is enabled"
|
||||
}
|
||||
},
|
||||
"remoteServer": {
|
||||
"authError": "Authorization failed: {{error}}",
|
||||
"authPending": "Please complete the authorization in your browser",
|
||||
|
||||
+96
-42
@@ -71,44 +71,23 @@
|
||||
"DeepSeek-V3": {
|
||||
"description": "DeepSeek-V3 is a MoE model developed in-house by Deep Seek Company. Its performance surpasses that of other open-source models such as Qwen2.5-72B and Llama-3.1-405B in multiple assessments, and it stands on par with the world's top proprietary models like GPT-4o and Claude-3.5-Sonnet."
|
||||
},
|
||||
"Doubao-1.5-thinking-pro-m": {
|
||||
"description": "Doubao-1.5 is a new deep thinking model (the m version comes with native multimodal deep reasoning capabilities) that excels in specialized fields such as mathematics, programming, scientific reasoning, and general tasks like creative writing, achieving or nearing top-tier performance in authoritative benchmarks such as AIME 2024, Codeforces, and GPQA. It supports a 128k context window and 16k output."
|
||||
},
|
||||
"Doubao-1.5-thinking-vision-pro": {
|
||||
"description": "A brand new visual deep thinking model, equipped with stronger general multimodal understanding and reasoning capabilities, achieving SOTA performance in 37 out of 59 public evaluation benchmarks."
|
||||
},
|
||||
"Doubao-1.5-vision-pro": {
|
||||
"description": "Doubao-1.5-vision-pro is a newly upgraded multimodal large model that supports image recognition at any resolution and extreme aspect ratios, enhancing visual reasoning, document recognition, detail comprehension, and instruction following capabilities."
|
||||
},
|
||||
"Doubao-1.5-vision-pro-32k": {
|
||||
"description": "Doubao-1.5-vision-pro is a newly upgraded multimodal large model that supports image recognition at any resolution and extreme aspect ratios, enhancing visual reasoning, document recognition, detail understanding, and instruction-following capabilities."
|
||||
},
|
||||
"Doubao-lite-128k": {
|
||||
"description": "Doubao-lite provides extreme response speed and better cost-effectiveness, offering flexible options for various customer scenarios. It supports inference and fine-tuning with a 128k context window."
|
||||
"description": "Doubao-lite offers ultra-fast response times and better cost-effectiveness, providing customers with more flexible options for different scenarios. Supports inference and fine-tuning with a 128k context window."
|
||||
},
|
||||
"Doubao-lite-32k": {
|
||||
"description": "Doubao-lite offers extreme response speed and better cost-effectiveness, providing flexible options for various customer scenarios. It supports inference and fine-tuning with a 32k context window."
|
||||
"description": "Doubao-lite offers ultra-fast response times and better cost-effectiveness, providing customers with more flexible options for different scenarios. Supports inference and fine-tuning with a 32k context window."
|
||||
},
|
||||
"Doubao-lite-4k": {
|
||||
"description": "Doubao-lite boasts extreme response speed and better cost-effectiveness, providing flexible options for various customer scenarios. It supports inference and fine-tuning with a 4k context window."
|
||||
"description": "Doubao-lite offers ultra-fast response times and better cost-effectiveness, providing customers with more flexible options for different scenarios. Supports inference and fine-tuning with a 4k context window."
|
||||
},
|
||||
"Doubao-pro-128k": {
|
||||
"description": "The best-performing primary model designed to handle complex tasks, achieving strong performance in scenarios such as reference Q&A, summarization, creative writing, text classification, and role-playing. It supports inference and fine-tuning with a 128k context window."
|
||||
},
|
||||
"Doubao-pro-256k": {
|
||||
"description": "The best-performing flagship model, suitable for handling complex tasks, with excellent results in reference Q&A, summarization, creative writing, text classification, role-playing, and more. It supports reasoning and fine-tuning with a 256k context window."
|
||||
"description": "The best-performing flagship model, suitable for handling complex tasks. It excels in scenarios such as reference Q&A, summarization, creative writing, text classification, and role-playing. Supports inference and fine-tuning with a 128k context window."
|
||||
},
|
||||
"Doubao-pro-32k": {
|
||||
"description": "The best-performing primary model suited for complex tasks, showing great results in reference Q&A, summarization, creative writing, text classification, and role-playing. It supports inference and fine-tuning with a 32k context window."
|
||||
"description": "The best-performing flagship model, suitable for handling complex tasks. It excels in scenarios such as reference Q&A, summarization, creative writing, text classification, and role-playing. Supports inference and fine-tuning with a 32k context window."
|
||||
},
|
||||
"Doubao-pro-4k": {
|
||||
"description": "The best-performing primary model suitable for handling complex tasks, demonstrating excellent performance in scenarios such as reference Q&A, summarization, creative writing, text classification, and role-playing. It supports inference and fine-tuning with a 4k context window."
|
||||
},
|
||||
"Doubao-vision-lite-32k": {
|
||||
"description": "The Doubao-vision model is a multimodal large model launched by Doubao, featuring powerful image understanding and reasoning capabilities, as well as precise instruction comprehension. The model has demonstrated strong performance in image-text information extraction and image-based reasoning tasks, making it applicable to more complex and broader visual question-answering tasks."
|
||||
},
|
||||
"Doubao-vision-pro-32k": {
|
||||
"description": "The Doubao-vision model is a multimodal large model launched by Doubao, featuring powerful image understanding and reasoning capabilities, as well as precise instruction comprehension. The model has demonstrated strong performance in image-text information extraction and image-based reasoning tasks, making it applicable to more complex and broader visual question-answering tasks."
|
||||
"description": "The best-performing flagship model, suitable for handling complex tasks. It excels in scenarios such as reference Q&A, summarization, creative writing, text classification, and role-playing. Supports inference and fine-tuning with a 4k context window."
|
||||
},
|
||||
"ERNIE-3.5-128K": {
|
||||
"description": "Baidu's self-developed flagship large-scale language model, covering a vast amount of Chinese and English corpus. It possesses strong general capabilities, meeting the requirements for most dialogue Q&A, creative generation, and plugin application scenarios; it supports automatic integration with Baidu's search plugin to ensure the timeliness of Q&A information."
|
||||
@@ -224,24 +203,21 @@
|
||||
"Pro/Qwen/Qwen2.5-VL-7B-Instruct": {
|
||||
"description": "Qwen2.5-VL is the newest addition to the Qwen series, featuring enhanced visual comprehension capabilities. It can analyze text, charts, and layouts within images, comprehend long videos while capturing events. The model supports reasoning, tool manipulation, multi-format object localization, and structured output generation. It incorporates optimized dynamic resolution and frame rate training for video understanding, along with improved efficiency in its visual encoder."
|
||||
},
|
||||
"Pro/THUDM/GLM-4.1V-9B-Thinking": {
|
||||
"description": "GLM-4.1V-9B-Thinking is an open-source vision-language model (VLM) jointly released by Zhipu AI and Tsinghua University's KEG Lab, designed specifically for handling complex multimodal cognitive tasks. Based on the GLM-4-9B-0414 foundation model, it significantly enhances cross-modal reasoning ability and stability by introducing the Chain-of-Thought reasoning mechanism and employing reinforcement learning strategies."
|
||||
},
|
||||
"Pro/THUDM/glm-4-9b-chat": {
|
||||
"description": "GLM-4-9B-Chat is the open-source version of the GLM-4 series pre-trained models launched by Zhipu AI. This model excels in semantics, mathematics, reasoning, code, and knowledge. In addition to supporting multi-turn dialogues, GLM-4-9B-Chat also features advanced capabilities such as web browsing, code execution, custom tool invocation (Function Call), and long-text reasoning. The model supports 26 languages, including Chinese, English, Japanese, Korean, and German. In multiple benchmark tests, GLM-4-9B-Chat has demonstrated excellent performance, such as in AlignBench-v2, MT-Bench, MMLU, and C-Eval. The model supports a maximum context length of 128K, making it suitable for academic research and commercial applications."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1": {
|
||||
"description": "DeepSeek-R1 is a reinforcement learning (RL) driven inference model that addresses issues of repetitiveness and readability in models. Prior to RL, DeepSeek-R1 introduced cold start data to further optimize inference performance. It performs comparably to OpenAI-o1 in mathematical, coding, and reasoning tasks, and enhances overall effectiveness through carefully designed training methods."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1-0120": {
|
||||
"description": "DeepSeek-R1 is a reinforcement learning (RL) driven reasoning model that addresses issues of repetition and readability. Before RL, it introduced cold-start data to further optimize reasoning performance. It performs comparably to OpenAI-o1 in mathematics, coding, and reasoning tasks and improves overall effectiveness through carefully designed training methods."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B": {
|
||||
"description": "DeepSeek-R1-Distill-Qwen-7B is a model derived from Qwen2.5-Math-7B through knowledge distillation. It was fine-tuned using 800,000 carefully selected samples generated by DeepSeek-R1, demonstrating exceptional reasoning capabilities. The model achieves outstanding performance across multiple benchmarks, including 92.8% accuracy on MATH-500, a 55.5% pass rate on AIME 2024, and a score of 1189 on CodeForces, showcasing strong mathematical and programming abilities for a 7B-scale model."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-V3": {
|
||||
"description": "DeepSeek-V3 is a mixed expert (MoE) language model with 671 billion parameters, utilizing multi-head latent attention (MLA) and the DeepSeekMoE architecture, combined with a load balancing strategy without auxiliary loss to optimize inference and training efficiency. Pre-trained on 14.8 trillion high-quality tokens and fine-tuned with supervision and reinforcement learning, DeepSeek-V3 outperforms other open-source models and approaches leading closed-source models."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-V3-1226": {
|
||||
"description": "DeepSeek-V3 is a mixture of experts (MoE) language model with 671 billion parameters, utilizing multi-head latent attention (MLA) and the DeepSeekMoE architecture, combined with a load balancing strategy without auxiliary loss to optimize inference and training efficiency. Pre-trained on 14.8 trillion high-quality tokens and fine-tuned with supervised learning and reinforcement learning, DeepSeek-V3 outperforms other open-source models and approaches leading closed-source models in performance."
|
||||
},
|
||||
"QwQ-32B-Preview": {
|
||||
"description": "QwQ-32B-Preview is an innovative natural language processing model capable of efficiently handling complex dialogue generation and context understanding tasks."
|
||||
},
|
||||
@@ -404,6 +380,9 @@
|
||||
"THUDM/GLM-4-9B-0414": {
|
||||
"description": "GLM-4-9B-0414 is a small model in the GLM series, with 9 billion parameters. This model inherits the technical characteristics of the GLM-4-32B series while providing a more lightweight deployment option. Despite its smaller size, GLM-4-9B-0414 still demonstrates excellent capabilities in tasks such as code generation, web design, SVG graphics generation, and search-based writing."
|
||||
},
|
||||
"THUDM/GLM-4.1V-9B-Thinking": {
|
||||
"description": "GLM-4.1V-9B-Thinking is an open-source vision-language model (VLM) jointly released by Zhipu AI and Tsinghua University's KEG Lab, designed specifically for handling complex multimodal cognitive tasks. Based on the GLM-4-9B-0414 foundation model, it significantly enhances cross-modal reasoning ability and stability by introducing the Chain-of-Thought reasoning mechanism and employing reinforcement learning strategies."
|
||||
},
|
||||
"THUDM/GLM-Z1-32B-0414": {
|
||||
"description": "GLM-Z1-32B-0414 is a reasoning model with deep thinking capabilities. This model is developed based on GLM-4-32B-0414 through cold start and extended reinforcement learning, with further training in mathematics, coding, and logic tasks. Compared to the base model, GLM-Z1-32B-0414 significantly enhances mathematical abilities and the capacity to solve complex tasks."
|
||||
},
|
||||
@@ -560,6 +539,9 @@
|
||||
"anthropic/claude-sonnet-4": {
|
||||
"description": "Claude Sonnet 4 can generate near-instant responses or extended step-by-step reasoning, allowing users to clearly observe these processes. API users also have fine-grained control over the model's thinking time."
|
||||
},
|
||||
"ascend-tribe/pangu-pro-moe": {
|
||||
"description": "Pangu-Pro-MoE 72B-A16B is a sparse large language model with 72 billion parameters and 16 billion activated parameters. It is based on the Group Mixture of Experts (MoGE) architecture, which groups experts during the expert selection phase and constrains tokens to activate an equal number of experts within each group, achieving expert load balancing and significantly improving deployment efficiency on the Ascend platform."
|
||||
},
|
||||
"aya": {
|
||||
"description": "Aya 23 is a multilingual model launched by Cohere, supporting 23 languages, facilitating diverse language applications."
|
||||
},
|
||||
@@ -569,6 +551,9 @@
|
||||
"baichuan/baichuan2-13b-chat": {
|
||||
"description": "Baichuan-13B is an open-source, commercially usable large language model developed by Baichuan Intelligence, containing 13 billion parameters, achieving the best results in its size on authoritative Chinese and English benchmarks."
|
||||
},
|
||||
"baidu/ERNIE-4.5-300B-A47B": {
|
||||
"description": "ERNIE-4.5-300B-A47B is a large language model developed by Baidu based on a Mixture of Experts (MoE) architecture. The model has a total of 300 billion parameters, but only activates 47 billion parameters per token during inference, balancing powerful performance with computational efficiency. As a core model in the ERNIE 4.5 series, it demonstrates outstanding capabilities in text understanding, generation, reasoning, and programming tasks. The model employs an innovative multimodal heterogeneous MoE pretraining method, jointly training text and visual modalities to effectively enhance overall capabilities, especially excelling in instruction following and world knowledge retention."
|
||||
},
|
||||
"c4ai-aya-expanse-32b": {
|
||||
"description": "Aya Expanse is a high-performance 32B multilingual model designed to challenge the performance of single-language models through innovations in instruction tuning, data arbitrage, preference training, and model merging. It supports 23 languages."
|
||||
},
|
||||
@@ -914,17 +899,53 @@
|
||||
"doubao-1.5-thinking-pro": {
|
||||
"description": "Doubao-1.5 is a brand new deep thinking model that excels in specialized fields such as mathematics, programming, and scientific reasoning, as well as in general tasks like creative writing. It has achieved or is close to the top tier of industry standards in several authoritative benchmarks, including AIME 2024, Codeforces, and GPQA. It supports a 128k context window and 16k output."
|
||||
},
|
||||
"doubao-1.5-thinking-pro-m": {
|
||||
"description": "Doubao-1.5 is a brand-new deep thinking model (the m version comes with native multimodal deep reasoning capabilities). It performs outstandingly in specialized fields such as mathematics, programming, scientific reasoning, as well as general tasks like creative writing. It achieves or approaches top-tier industry benchmarks on AIME 2024, Codeforces, GPQA, and more. Supports a 128k context window and 16k output."
|
||||
},
|
||||
"doubao-1.5-thinking-vision-pro": {
|
||||
"description": "A new visual deep thinking model with enhanced general multimodal understanding and reasoning capabilities, achieving state-of-the-art (SOTA) results on 37 out of 59 public evaluation benchmarks."
|
||||
},
|
||||
"doubao-1.5-ui-tars": {
|
||||
"description": "Doubao-1.5-UI-TARS is a native agent model designed for graphical user interface (GUI) interaction. It seamlessly interacts with GUIs through human-like abilities such as perception, reasoning, and action."
|
||||
},
|
||||
"doubao-1.5-vision-lite": {
|
||||
"description": "Doubao-1.5-vision-lite is a newly upgraded multimodal large model that supports image recognition at any resolution and extreme aspect ratios, enhancing visual reasoning, document recognition, detail comprehension, and instruction following capabilities. It supports a context window of 128k and an output length of up to 16k tokens."
|
||||
},
|
||||
"doubao-1.5-vision-pro": {
|
||||
"description": "Doubao-1.5-vision-pro is a newly upgraded multimodal large model supporting image recognition at any resolution and extreme aspect ratios. It enhances visual reasoning, document recognition, detailed information understanding, and instruction compliance."
|
||||
},
|
||||
"doubao-1.5-vision-pro-32k": {
|
||||
"description": "Doubao-1.5-vision-pro is a newly upgraded multimodal large model supporting image recognition at any resolution and extreme aspect ratios. It enhances visual reasoning, document recognition, detailed information understanding, and instruction compliance."
|
||||
},
|
||||
"doubao-lite-128k": {
|
||||
"description": "Offers ultra-fast response times and better cost-effectiveness, providing customers with more flexible options for different scenarios. Supports inference and fine-tuning with a 128k context window."
|
||||
},
|
||||
"doubao-lite-32k": {
|
||||
"description": "Offers ultra-fast response times and better cost-effectiveness, providing customers with more flexible options for different scenarios. Supports inference and fine-tuning with a 32k context window."
|
||||
},
|
||||
"doubao-lite-4k": {
|
||||
"description": "Offers ultra-fast response times and better cost-effectiveness, providing customers with more flexible options for different scenarios. Supports inference and fine-tuning with a 4k context window."
|
||||
},
|
||||
"doubao-pro-256k": {
|
||||
"description": "The best-performing flagship model, suitable for handling complex tasks. It excels in scenarios such as reference Q&A, summarization, creative writing, text classification, and role-playing. Supports inference and fine-tuning with a 256k context window."
|
||||
},
|
||||
"doubao-pro-32k": {
|
||||
"description": "The best-performing flagship model, suitable for handling complex tasks. It excels in scenarios such as reference Q&A, summarization, creative writing, text classification, and role-playing. Supports inference and fine-tuning with a 32k context window."
|
||||
},
|
||||
"doubao-seed-1.6": {
|
||||
"description": "Doubao-Seed-1.6 is a brand-new multimodal deep thinking model supporting auto, thinking, and non-thinking modes. In non-thinking mode, its performance significantly surpasses Doubao-1.5-pro/250115. It supports a 256k context window and output lengths up to 16k tokens."
|
||||
},
|
||||
"doubao-seed-1.6-flash": {
|
||||
"description": "Doubao-Seed-1.6-flash is an ultra-fast multimodal deep thinking model with inference speed as low as 10ms on TPOT; it supports both text and visual understanding. Its text comprehension exceeds the previous lite generation, and its visual understanding rivals competitor pro series models. It supports a 256k context window and output lengths up to 16k tokens."
|
||||
"description": "Doubao-Seed-1.6-flash is an ultra-fast multimodal deep thinking model with TPOT inference speed as low as 10ms; it supports both text and visual understanding. Its text comprehension exceeds the previous lite generation, and its visual understanding rivals competitor pro series models. It supports a 256k context window and output lengths up to 16k tokens."
|
||||
},
|
||||
"doubao-seed-1.6-thinking": {
|
||||
"description": "Doubao-Seed-1.6-thinking significantly enhances thinking capabilities compared to Doubao-1.5-thinking-pro, with further improvements in coding, math, and logical reasoning skills. It supports visual understanding and a 256k context window, with output lengths up to 16k tokens."
|
||||
"description": "Doubao-Seed-1.6-thinking features greatly enhanced thinking capabilities. Compared to Doubao-1.5-thinking-pro, it further improves foundational skills such as coding, math, and logical reasoning, and supports visual understanding. It supports a 256k context window and output lengths up to 16k tokens."
|
||||
},
|
||||
"doubao-vision-lite-32k": {
|
||||
"description": "The Doubao-vision model is a multimodal large model launched by Doubao, featuring powerful image understanding and reasoning capabilities along with precise instruction comprehension. It demonstrates strong performance in image-text information extraction and image-based reasoning tasks, applicable to more complex and diverse visual question answering scenarios."
|
||||
},
|
||||
"doubao-vision-pro-32k": {
|
||||
"description": "The Doubao-vision model is a multimodal large model launched by Doubao, featuring powerful image understanding and reasoning capabilities along with precise instruction comprehension. It demonstrates strong performance in image-text information extraction and image-based reasoning tasks, applicable to more complex and diverse visual question answering scenarios."
|
||||
},
|
||||
"emohaa": {
|
||||
"description": "Emohaa is a psychological model with professional counseling capabilities, helping users understand emotional issues."
|
||||
@@ -1082,9 +1103,6 @@
|
||||
"gemini-2.5-pro": {
|
||||
"description": "Gemini 2.5 Pro is Google's most advanced reasoning model, capable of tackling complex problems in coding, mathematics, and STEM fields, as well as analyzing large datasets, codebases, and documents using long-context processing."
|
||||
},
|
||||
"gemini-2.5-pro-exp-03-25": {
|
||||
"description": "Gemini 2.5 Pro Experimental is Google's most advanced thinking model, capable of reasoning about complex problems in code, mathematics, and STEM fields, as well as analyzing large datasets, codebases, and documents using long context."
|
||||
},
|
||||
"gemini-2.5-pro-preview-03-25": {
|
||||
"description": "Gemini 2.5 Pro Preview is Google's most advanced thinking model, capable of reasoning about complex problems in code, mathematics, and STEM fields, as well as analyzing large datasets, codebases, and documents using long-context analysis."
|
||||
},
|
||||
@@ -1151,6 +1169,12 @@
|
||||
"glm-4-plus": {
|
||||
"description": "GLM-4-Plus, as a high-intelligence flagship, possesses strong capabilities for processing long texts and complex tasks, with overall performance improvements."
|
||||
},
|
||||
"glm-4.1v-thinking-flash": {
|
||||
"description": "The GLM-4.1V-Thinking series represents the most powerful vision-language models known at the 10B parameter scale, integrating state-of-the-art capabilities across various vision-language tasks such as video understanding, image question answering, academic problem solving, OCR text recognition, document and chart interpretation, GUI agents, front-end web coding, and grounding. Its performance in many tasks even surpasses that of Qwen2.5-VL-72B, which has over eight times the parameters. Leveraging advanced reinforcement learning techniques, the model masters Chain-of-Thought reasoning to improve answer accuracy and richness, significantly outperforming traditional non-thinking models in final results and interpretability."
|
||||
},
|
||||
"glm-4.1v-thinking-flashx": {
|
||||
"description": "The GLM-4.1V-Thinking series represents the most powerful vision-language models known at the 10B parameter scale, integrating state-of-the-art capabilities across various vision-language tasks such as video understanding, image question answering, academic problem solving, OCR text recognition, document and chart interpretation, GUI agents, front-end web coding, and grounding. Its performance in many tasks even surpasses that of Qwen2.5-VL-72B, which has over eight times the parameters. Leveraging advanced reinforcement learning techniques, the model masters Chain-of-Thought reasoning to improve answer accuracy and richness, significantly outperforming traditional non-thinking models in final results and interpretability."
|
||||
},
|
||||
"glm-4v": {
|
||||
"description": "GLM-4V provides strong image understanding and reasoning capabilities, supporting various visual tasks."
|
||||
},
|
||||
@@ -1172,6 +1196,9 @@
|
||||
"glm-z1-flash": {
|
||||
"description": "The GLM-Z1 series possesses strong complex reasoning capabilities, excelling in logical reasoning, mathematics, programming, and more. The maximum context length is 32K."
|
||||
},
|
||||
"glm-z1-flashx": {
|
||||
"description": "High speed and low cost: Flash enhanced version with ultra-fast inference speed and improved concurrency support."
|
||||
},
|
||||
"glm-zero-preview": {
|
||||
"description": "GLM-Zero-Preview possesses strong complex reasoning abilities, excelling in logical reasoning, mathematics, programming, and other fields."
|
||||
},
|
||||
@@ -1223,6 +1250,9 @@
|
||||
"google/gemma-2b-it": {
|
||||
"description": "Gemma Instruct (2B) provides basic instruction processing capabilities, suitable for lightweight applications."
|
||||
},
|
||||
"google/gemma-3-1b-it": {
|
||||
"description": "Gemma 3 1B is an open-source language model from Google that sets new standards in efficiency and performance."
|
||||
},
|
||||
"google/gemma-3-27b-it": {
|
||||
"description": "Gemma 3 27B is an open-source language model from Google that sets new standards in efficiency and performance."
|
||||
},
|
||||
@@ -1313,6 +1343,9 @@
|
||||
"gpt-4o-mini-search-preview": {
|
||||
"description": "GPT-4o mini Search Preview is a model specifically trained to understand and execute web search queries, using the Chat Completions API. In addition to token fees, web search queries incur charges per tool invocation."
|
||||
},
|
||||
"gpt-4o-mini-transcribe": {
|
||||
"description": "GPT-4o Mini Transcribe is a speech-to-text model that uses GPT-4o to transcribe audio. Compared to the original Whisper model, it improves word error rate, language recognition, and accuracy. Use it for more precise transcriptions."
|
||||
},
|
||||
"gpt-4o-mini-tts": {
|
||||
"description": "GPT-4o mini TTS is a text-to-speech model based on GPT-4o mini, providing high-quality speech generation at a lower cost."
|
||||
},
|
||||
@@ -1322,12 +1355,15 @@
|
||||
"gpt-4o-realtime-preview-2024-10-01": {
|
||||
"description": "GPT-4o real-time version, supporting real-time audio and text input and output."
|
||||
},
|
||||
"gpt-4o-realtime-preview-2024-12-17": {
|
||||
"description": "GPT-4o real-time version, supporting real-time audio and text input and output."
|
||||
"gpt-4o-realtime-preview-2025-06-03": {
|
||||
"description": "GPT-4o real-time version supporting real-time audio and text input and output."
|
||||
},
|
||||
"gpt-4o-search-preview": {
|
||||
"description": "GPT-4o Search Preview is a model specifically trained to understand and execute web search queries, using the Chat Completions API. In addition to token fees, web search queries incur charges per tool invocation."
|
||||
},
|
||||
"gpt-4o-transcribe": {
|
||||
"description": "GPT-4o Transcribe is a speech-to-text model that uses GPT-4o to transcribe audio. Compared to the original Whisper model, it improves word error rate, language recognition, and accuracy. Use it for more precise transcriptions."
|
||||
},
|
||||
"grok-2-1212": {
|
||||
"description": "This model has improved in accuracy, instruction adherence, and multilingual capabilities."
|
||||
},
|
||||
@@ -1346,9 +1382,15 @@
|
||||
"grok-3-mini-fast": {
|
||||
"description": "A lightweight model that thinks before responding. It runs fast and intelligently, suitable for logical tasks that do not require deep domain knowledge, and can provide raw thought trajectories."
|
||||
},
|
||||
"grok-4": {
|
||||
"description": "Our latest and most powerful flagship model, excelling in natural language processing, mathematical computation, and reasoning — a perfect all-rounder."
|
||||
},
|
||||
"gryphe/mythomax-l2-13b": {
|
||||
"description": "MythoMax l2 13B is a language model that combines creativity and intelligence by merging multiple top models."
|
||||
},
|
||||
"hunyuan-a13b": {
|
||||
"description": "Hunyuan's first hybrid reasoning model, an upgraded version of hunyuan-standard-256K, with a total of 80 billion parameters and 13 billion activated parameters. The default mode is slow thinking, supporting fast and slow thinking mode switching via parameters or instructions, with the switch implemented by adding 'query' prefix or 'no_think'. Overall capabilities are comprehensively improved compared to the previous generation, especially in mathematics, science, long text comprehension, and agent abilities."
|
||||
},
|
||||
"hunyuan-code": {
|
||||
"description": "The latest code generation model from Hunyuan, trained on a base model with 200B high-quality code data, iteratively trained for six months with high-quality SFT data, increasing the context window length to 8K. It ranks among the top in automatic evaluation metrics for code generation across five major programming languages, and performs in the first tier for comprehensive human quality assessments across ten aspects of coding tasks."
|
||||
},
|
||||
@@ -1400,6 +1442,9 @@
|
||||
"hunyuan-t1-vision": {
|
||||
"description": "Hunyuan is a multimodal deep thinking model supporting native multimodal chain-of-thought reasoning, excelling in various image reasoning scenarios and significantly outperforming fast-thinking models on science problems."
|
||||
},
|
||||
"hunyuan-t1-vision-20250619": {
|
||||
"description": "The latest Hunyuan t1-vision multimodal deep thinking model supports native long Chain-of-Thought reasoning across modalities, comprehensively improving over the previous default version."
|
||||
},
|
||||
"hunyuan-turbo": {
|
||||
"description": "The preview version of the next-generation Hunyuan large language model, featuring a brand-new mixed expert model (MoE) structure, which offers faster inference efficiency and stronger performance compared to Hunyuan Pro."
|
||||
},
|
||||
@@ -1430,6 +1475,12 @@
|
||||
"hunyuan-turbos-role-plus": {
|
||||
"description": "The latest Hunyuan role-playing model, officially fine-tuned and trained by Hunyuan. It is further trained on role-playing scenario datasets based on the Hunyuan model, delivering better foundational performance in role-playing contexts."
|
||||
},
|
||||
"hunyuan-turbos-vision": {
|
||||
"description": "This model is designed for image-text understanding scenarios and is based on Hunyuan's latest turbos architecture. It is a next-generation flagship vision-language model focusing on image-text understanding tasks, including image-based entity recognition, knowledge Q&A, copywriting, and photo-based problem solving, with comprehensive improvements over the previous generation."
|
||||
},
|
||||
"hunyuan-turbos-vision-20250619": {
|
||||
"description": "The latest Hunyuan turbos-vision flagship vision-language model offers comprehensive improvements over the previous default version in image-text understanding tasks, including image-based entity recognition, knowledge Q&A, copywriting, and photo-based problem solving."
|
||||
},
|
||||
"hunyuan-vision": {
|
||||
"description": "The latest multimodal model from Hunyuan, supporting image + text input to generate textual content."
|
||||
},
|
||||
@@ -1457,6 +1508,9 @@
|
||||
"jina-deepsearch-v1": {
|
||||
"description": "DeepSearch combines web search, reading, and reasoning for comprehensive investigations. You can think of it as an agent that takes on your research tasks—it conducts extensive searches and iterates multiple times before providing answers. This process involves ongoing research, reasoning, and problem-solving from various angles. This fundamentally differs from standard large models that generate answers directly from pre-trained data and traditional RAG systems that rely on one-time surface searches."
|
||||
},
|
||||
"kimi-k2-0711-preview": {
|
||||
"description": "kimi-k2 is a MoE architecture base model with powerful coding and agent capabilities, totaling 1 trillion parameters with 32 billion active parameters. In benchmark tests across general knowledge reasoning, programming, mathematics, and agent tasks, the K2 model outperforms other mainstream open-source models."
|
||||
},
|
||||
"kimi-latest": {
|
||||
"description": "The Kimi Smart Assistant product uses the latest Kimi large model, which may include features that are not yet stable. It supports image understanding and will automatically select the 8k/32k/128k model as the billing model based on the length of the request context."
|
||||
},
|
||||
@@ -1881,7 +1935,7 @@
|
||||
"description": "o3-mini is our latest small inference model that delivers high intelligence while maintaining the same cost and latency targets as o1-mini."
|
||||
},
|
||||
"o3-pro": {
|
||||
"description": "The o3-pro model employs increased computation for deeper thinking and consistently better answers. It is only available for use under the Responses API."
|
||||
"description": "The o3-pro model employs greater computational power for deeper thinking and consistently provides better answers. It is only supported under the Responses API."
|
||||
},
|
||||
"o4-mini": {
|
||||
"description": "o4-mini is our latest small model in the o series. It is optimized for fast and efficient inference, demonstrating high efficiency and performance in coding and visual tasks."
|
||||
@@ -2349,7 +2403,7 @@
|
||||
"description": "The v0-1.5-md model is suitable for everyday tasks and user interface (UI) generation."
|
||||
},
|
||||
"whisper-1": {
|
||||
"description": "A universal speech recognition model that supports multilingual speech recognition, speech translation, and language identification."
|
||||
"description": "A general-purpose speech recognition model supporting multilingual speech recognition, speech translation, and language identification."
|
||||
},
|
||||
"wizardlm2": {
|
||||
"description": "WizardLM 2 is a language model provided by Microsoft AI, excelling in complex dialogues, multilingual capabilities, reasoning, and intelligent assistant applications."
|
||||
|
||||
@@ -520,6 +520,7 @@
|
||||
"hotkey": "Hotkeys",
|
||||
"llm": "Language Model",
|
||||
"provider": "AI Service Provider",
|
||||
"proxy": "Network Proxy",
|
||||
"storage": "Data Storage",
|
||||
"sync": "Cloud Sync",
|
||||
"system-agent": "System Assistant",
|
||||
|
||||
@@ -46,6 +46,9 @@
|
||||
"reasoningEffort": {
|
||||
"title": "Intensidad de razonamiento"
|
||||
},
|
||||
"thinking": {
|
||||
"title": "Interruptor de pensamiento profundo"
|
||||
},
|
||||
"title": "Funcionalidad de extensión del modelo"
|
||||
},
|
||||
"history": {
|
||||
|
||||
@@ -1,4 +1,43 @@
|
||||
{
|
||||
"proxy": {
|
||||
"auth": "Se requiere autenticación",
|
||||
"authDesc": "Si el servidor proxy requiere nombre de usuario y contraseña",
|
||||
"authSettings": "Configuración de autenticación",
|
||||
"basicSettings": "Configuración del proxy",
|
||||
"basicSettingsDesc": "Configura los parámetros de conexión del servidor proxy",
|
||||
"bypass": "Direcciones sin proxy",
|
||||
"connectionTest": "Prueba de conexión",
|
||||
"enable": "Habilitar proxy",
|
||||
"enableDesc": "Al activarlo, el acceso a la red se realizará a través del servidor proxy",
|
||||
"password": "Contraseña",
|
||||
"password_placeholder": "Por favor, introduce la contraseña",
|
||||
"port": "Puerto",
|
||||
"resetButton": "Restablecer",
|
||||
"saveButton": "Guardar",
|
||||
"saveFailed": "Error al guardar: {{error}}",
|
||||
"saveSuccess": "Configuración del proxy guardada correctamente",
|
||||
"server": "Dirección del servidor",
|
||||
"testButton": "Probar conexión",
|
||||
"testDescription": "Prueba la conexión usando la configuración actual del proxy para verificar que funcione correctamente",
|
||||
"testFailed": "Conexión fallida",
|
||||
"testSuccessWithTime": "Conexión exitosa, tiempo empleado {{time}} ms",
|
||||
"testUrl": "URL de prueba",
|
||||
"testUrlPlaceholder": "Por favor, introduce la URL a probar",
|
||||
"testing": "Probando conexión...",
|
||||
"type": "Tipo de proxy",
|
||||
"unsavedChanges": "Tiene cambios sin guardar",
|
||||
"username": "Nombre de usuario",
|
||||
"username_placeholder": "Por favor, introduce el nombre de usuario",
|
||||
"validation": {
|
||||
"passwordRequired": "La contraseña es obligatoria cuando la autenticación está habilitada",
|
||||
"portInvalid": "El puerto debe ser un número entre 1 y 65535",
|
||||
"portRequired": "El puerto es obligatorio cuando el proxy está habilitado",
|
||||
"serverInvalid": "Por favor, introduzca una dirección de servidor válida (IP o nombre de dominio)",
|
||||
"serverRequired": "La dirección del servidor es obligatoria cuando el proxy está habilitado",
|
||||
"typeRequired": "El tipo de proxy es obligatorio cuando el proxy está habilitado",
|
||||
"usernameRequired": "El nombre de usuario es obligatorio cuando la autenticación está habilitada"
|
||||
}
|
||||
},
|
||||
"remoteServer": {
|
||||
"authError": "Error de autorización: {{error}}",
|
||||
"authPending": "Complete la autorización en el navegador",
|
||||
|
||||
+97
-43
@@ -71,44 +71,23 @@
|
||||
"DeepSeek-V3": {
|
||||
"description": "DeepSeek-V3 es un modelo MoE desarrollado internamente por la empresa DeepSeek. Los resultados de DeepSeek-V3 en múltiples evaluaciones superan a otros modelos de código abierto como Qwen2.5-72B y Llama-3.1-405B, y su rendimiento es comparable al de los modelos cerrados de primer nivel mundial como GPT-4o y Claude-3.5-Sonnet."
|
||||
},
|
||||
"Doubao-1.5-thinking-pro-m": {
|
||||
"description": "Doubao-1.5 es un nuevo modelo de pensamiento profundo (la versión m incluye capacidades de razonamiento multimodal nativas), destacándose en campos profesionales como matemáticas, programación, razonamiento científico y tareas generales como la escritura creativa, alcanzando o acercándose a los niveles de élite en múltiples pruebas de referencia como AIME 2024, Codeforces y GPQA. Soporta una ventana de contexto de 128k y una salida de 16k."
|
||||
},
|
||||
"Doubao-1.5-thinking-vision-pro": {
|
||||
"description": "Modelo de pensamiento profundo visual completamente nuevo, que posee una mayor capacidad de comprensión y razonamiento multimodal general, logrando un rendimiento SOTA en 37 de los 59 estándares de evaluación pública."
|
||||
},
|
||||
"Doubao-1.5-vision-pro": {
|
||||
"description": "Doubao-1.5-vision-pro es un modelo multimodal de gran escala actualizado, que soporta el reconocimiento de imágenes de cualquier resolución y proporciones extremas, mejorando la capacidad de razonamiento visual, reconocimiento de documentos, comprensión de información detallada y seguimiento de instrucciones."
|
||||
},
|
||||
"Doubao-1.5-vision-pro-32k": {
|
||||
"description": "Doubao-1.5-vision-pro es un modelo multimodal de gran tamaño, actualizado, que soporta el reconocimiento de imágenes de cualquier resolución y proporciones extremas, mejorando la capacidad de razonamiento visual, reconocimiento de documentos, comprensión de información detallada y cumplimiento de instrucciones."
|
||||
},
|
||||
"Doubao-lite-128k": {
|
||||
"description": "Doubao-lite presenta una velocidad de respuesta extrema y una mejor relación calidad-precio, ofreciendo opciones más flexibles para diferentes escenarios de clientes. Admite inferencia y ajuste fino con ventanas de contexto de 128k."
|
||||
"description": "Doubao-lite ofrece una velocidad de respuesta excepcional y una mejor relación calidad-precio, proporcionando opciones más flexibles para diferentes escenarios de los clientes. Soporta inferencia y ajuste fino con una ventana de contexto de 128k."
|
||||
},
|
||||
"Doubao-lite-32k": {
|
||||
"description": "Doubao-lite presenta una velocidad de respuesta extrema y una mejor relación calidad-precio, ofreciendo opciones más flexibles para diferentes escenarios de clientes. Admite inferencia y ajuste fino con ventanas de contexto de 32k."
|
||||
"description": "Doubao-lite ofrece una velocidad de respuesta excepcional y una mejor relación calidad-precio, proporcionando opciones más flexibles para diferentes escenarios de los clientes. Soporta inferencia y ajuste fino con una ventana de contexto de 32k."
|
||||
},
|
||||
"Doubao-lite-4k": {
|
||||
"description": "Doubao-lite presenta una velocidad de respuesta extrema y una mejor relación calidad-precio, ofreciendo opciones más flexibles para diferentes escenarios de clientes. Admite inferencia y ajuste fino con ventanas de contexto de 4k."
|
||||
"description": "Doubao-lite ofrece una velocidad de respuesta excepcional y una mejor relación calidad-precio, proporcionando opciones más flexibles para diferentes escenarios de los clientes. Soporta inferencia y ajuste fino con una ventana de contexto de 4k."
|
||||
},
|
||||
"Doubao-pro-128k": {
|
||||
"description": "El modelo principal más eficaz, adecuado para manejar tareas complejas, con un excelente rendimiento en escenarios como preguntas y respuestas de referencia, resúmenes, creación de contenido, clasificación de textos y juegos de roles. Admite inferencia y ajuste fino con ventanas de contexto de 128k."
|
||||
},
|
||||
"Doubao-pro-256k": {
|
||||
"description": "El modelo principal con el mejor rendimiento, adecuado para manejar tareas complejas, mostrando buenos resultados en escenarios como preguntas y respuestas de referencia, resúmenes, creación, clasificación de textos y juegos de roles. Soporta razonamiento y ajuste fino con una ventana de contexto de 256k."
|
||||
"description": "El modelo principal con mejor rendimiento, adecuado para tareas complejas, con excelentes resultados en preguntas de referencia, resúmenes, creación, clasificación de texto, juegos de rol y otros escenarios. Soporta inferencia y ajuste fino con una ventana de contexto de 128k."
|
||||
},
|
||||
"Doubao-pro-32k": {
|
||||
"description": "El modelo principal más eficaz, adecuado para manejar tareas complejas, con un excelente rendimiento en escenarios como preguntas y respuestas de referencia, resúmenes, creación de contenido, clasificación de textos y juegos de roles. Admite inferencia y ajuste fino con ventanas de contexto de 32k."
|
||||
"description": "El modelo principal con mejor rendimiento, adecuado para tareas complejas, con excelentes resultados en preguntas de referencia, resúmenes, creación, clasificación de texto, juegos de rol y otros escenarios. Soporta inferencia y ajuste fino con una ventana de contexto de 32k."
|
||||
},
|
||||
"Doubao-pro-4k": {
|
||||
"description": "El modelo principal más eficaz, adecuado para manejar tareas complejas, con un excelente rendimiento en escenarios como preguntas y respuestas de referencia, resúmenes, creación de contenido, clasificación de textos y juegos de roles. Admite inferencia y ajuste fino con ventanas de contexto de 4k."
|
||||
},
|
||||
"Doubao-vision-lite-32k": {
|
||||
"description": "El modelo Doubao-vision es un modelo multimodal lanzado por Doubao, que cuenta con potentes capacidades de comprensión e inferencia de imágenes, así como una precisa capacidad de comprensión de instrucciones. El modelo ha demostrado un rendimiento excepcional en la extracción de información textual de imágenes y en tareas de razonamiento basadas en imágenes, siendo aplicable a tareas de preguntas y respuestas visuales más complejas y amplias."
|
||||
},
|
||||
"Doubao-vision-pro-32k": {
|
||||
"description": "El modelo Doubao-vision es un modelo multimodal lanzado por Doubao, que cuenta con potentes capacidades de comprensión e inferencia de imágenes, así como una precisa capacidad de comprensión de instrucciones. El modelo ha demostrado un rendimiento excepcional en la extracción de información textual de imágenes y en tareas de razonamiento basadas en imágenes, siendo aplicable a tareas de preguntas y respuestas visuales más complejas y amplias."
|
||||
"description": "El modelo principal con mejor rendimiento, adecuado para tareas complejas, con excelentes resultados en preguntas de referencia, resúmenes, creación, clasificación de texto, juegos de rol y otros escenarios. Soporta inferencia y ajuste fino con una ventana de contexto de 4k."
|
||||
},
|
||||
"ERNIE-3.5-128K": {
|
||||
"description": "Modelo de lenguaje a gran escala de primera línea desarrollado por Baidu, que abarca una vasta cantidad de corpus en chino y en inglés, con potentes capacidades generales que pueden satisfacer la mayoría de los requisitos de preguntas y respuestas en diálogos, generación de contenido y aplicaciones de plugins; soporta la integración automática con el plugin de búsqueda de Baidu, garantizando la actualidad de la información en las respuestas."
|
||||
@@ -224,24 +203,21 @@
|
||||
"Pro/Qwen/Qwen2.5-VL-7B-Instruct": {
|
||||
"description": "Qwen2.5-VL es el nuevo miembro de la serie Qwen, con potentes capacidades de comprensión visual. Puede analizar texto, gráficos y diseños en imágenes, comprender videos largos y capturar eventos. Es capaz de razonar, manipular herramientas, admitir el posicionamiento de objetos en múltiples formatos y generar salidas estructuradas. Optimiza la resolución dinámica y la tasa de cuadros para la comprensión de videos, además de mejorar la eficiencia del codificador visual."
|
||||
},
|
||||
"Pro/THUDM/GLM-4.1V-9B-Thinking": {
|
||||
"description": "GLM-4.1V-9B-Thinking es un modelo de lenguaje visual (VLM) de código abierto lanzado conjuntamente por Zhipu AI y el laboratorio KEG de la Universidad de Tsinghua, diseñado específicamente para manejar tareas cognitivas multimodales complejas. Este modelo se basa en el modelo base GLM-4-9B-0414 y mejora significativamente su capacidad y estabilidad de razonamiento multimodal mediante la introducción del mecanismo de razonamiento \"Cadena de Pensamiento\" (Chain-of-Thought) y la adopción de estrategias de aprendizaje reforzado."
|
||||
},
|
||||
"Pro/THUDM/glm-4-9b-chat": {
|
||||
"description": "GLM-4-9B-Chat es la versión de código abierto de la serie de modelos preentrenados GLM-4 lanzada por Zhipu AI. Este modelo destaca en semántica, matemáticas, razonamiento, código y conocimiento. Además de soportar diálogos de múltiples turnos, GLM-4-9B-Chat también cuenta con funciones avanzadas como navegación web, ejecución de código, llamadas a herramientas personalizadas (Function Call) y razonamiento de textos largos. El modelo admite 26 idiomas, incluidos chino, inglés, japonés, coreano y alemán. En múltiples pruebas de referencia, GLM-4-9B-Chat ha demostrado un rendimiento excepcional, como AlignBench-v2, MT-Bench, MMLU y C-Eval. Este modelo admite una longitud de contexto máxima de 128K, adecuado para investigación académica y aplicaciones comerciales."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1": {
|
||||
"description": "DeepSeek-R1 es un modelo de inferencia impulsado por aprendizaje por refuerzo (RL) que aborda problemas de repetitividad y legibilidad en el modelo. Antes del RL, DeepSeek-R1 introdujo datos de arranque en frío, optimizando aún más el rendimiento de inferencia. Se desempeña de manera comparable a OpenAI-o1 en tareas matemáticas, de código e inferencia, y mejora el rendimiento general a través de métodos de entrenamiento cuidadosamente diseñados."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1-0120": {
|
||||
"description": "DeepSeek-R1 es un modelo de razonamiento impulsado por aprendizaje reforzado (RL) que aborda problemas de repetición y legibilidad en modelos. Antes del RL, DeepSeek-R1 introdujo datos de arranque en frío para optimizar aún más el rendimiento del razonamiento. Su desempeño en matemáticas, código y tareas de razonamiento es comparable a OpenAI-o1, y mejora el rendimiento general mediante métodos de entrenamiento cuidadosamente diseñados."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B": {
|
||||
"description": "DeepSeek-R1-Distill-Qwen-7B es un modelo obtenido mediante destilación de conocimiento basado en Qwen2.5-Math-7B. Este modelo se ha ajustado utilizando 800.000 muestras seleccionadas generadas por DeepSeek-R1, demostrando una excelente capacidad de razonamiento. Ha mostrado un rendimiento sobresaliente en múltiples pruebas de referencia, alcanzando un 92,8% de precisión en MATH-500, un 55,5% de tasa de aprobación en AIME 2024 y una puntuación de 1189 en CodeForces, lo que demuestra una fuerte capacidad matemática y de programación para un modelo de escala 7B."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-V3": {
|
||||
"description": "DeepSeek-V3 es un modelo de lenguaje de expertos mixtos (MoE) con 671 mil millones de parámetros, que utiliza atención potencial de múltiples cabezas (MLA) y la arquitectura DeepSeekMoE, combinando estrategias de balanceo de carga sin pérdidas auxiliares para optimizar la eficiencia de inferencia y entrenamiento. Preentrenado en 14.8 billones de tokens de alta calidad, y ajustado mediante supervisión y aprendizaje por refuerzo, DeepSeek-V3 supera a otros modelos de código abierto y se acerca a los modelos cerrados líderes."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-V3-1226": {
|
||||
"description": "DeepSeek-V3 es un modelo de lenguaje de expertos mixtos (MoE) con 671 mil millones de parámetros, que utiliza atención latente de múltiples cabezas (MLA) y la arquitectura DeepSeekMoE, combinando una estrategia de balanceo de carga sin pérdidas auxiliares para optimizar la eficiencia de inferencia y entrenamiento. Preentrenado en 14.8 billones de tokens de alta calidad y ajustado mediante supervisión y aprendizaje por refuerzo, DeepSeek-V3 supera en rendimiento a otros modelos de código abierto, acercándose a los modelos cerrados líderes."
|
||||
},
|
||||
"QwQ-32B-Preview": {
|
||||
"description": "QwQ-32B-Preview es un modelo de procesamiento de lenguaje natural innovador, capaz de manejar de manera eficiente tareas complejas de generación de diálogos y comprensión del contexto."
|
||||
},
|
||||
@@ -404,6 +380,9 @@
|
||||
"THUDM/GLM-4-9B-0414": {
|
||||
"description": "GLM-4-9B-0414 es un modelo pequeño de la serie GLM, con 9 mil millones de parámetros. Este modelo hereda las características técnicas de la serie GLM-4-32B, pero ofrece opciones de implementación más ligeras. A pesar de su menor tamaño, GLM-4-9B-0414 sigue mostrando habilidades sobresalientes en tareas de generación de código, diseño web, generación de gráficos SVG y redacción basada en búsqueda."
|
||||
},
|
||||
"THUDM/GLM-4.1V-9B-Thinking": {
|
||||
"description": "GLM-4.1V-9B-Thinking es un modelo de lenguaje visual (VLM) de código abierto lanzado conjuntamente por Zhipu AI y el laboratorio KEG de la Universidad de Tsinghua, diseñado específicamente para manejar tareas cognitivas multimodales complejas. Este modelo se basa en el modelo base GLM-4-9B-0414 y mejora significativamente su capacidad y estabilidad de razonamiento multimodal mediante la introducción del mecanismo de razonamiento \"Cadena de Pensamiento\" (Chain-of-Thought) y la adopción de estrategias de aprendizaje reforzado."
|
||||
},
|
||||
"THUDM/GLM-Z1-32B-0414": {
|
||||
"description": "GLM-Z1-32B-0414 es un modelo de inferencia con capacidad de pensamiento profundo. Este modelo se desarrolló a partir de GLM-4-32B-0414 mediante un arranque en frío y aprendizaje por refuerzo ampliado, y se entrenó adicionalmente en tareas de matemáticas, código y lógica. En comparación con el modelo base, GLM-Z1-32B-0414 mejora significativamente la capacidad matemática y la habilidad para resolver tareas complejas."
|
||||
},
|
||||
@@ -560,6 +539,9 @@
|
||||
"anthropic/claude-sonnet-4": {
|
||||
"description": "Claude Sonnet 4 puede generar respuestas casi instantáneas o razonamientos prolongados paso a paso, que los usuarios pueden seguir claramente. Los usuarios de la API también pueden controlar con precisión el tiempo de reflexión del modelo."
|
||||
},
|
||||
"ascend-tribe/pangu-pro-moe": {
|
||||
"description": "Pangu-Pro-MoE 72B-A16B es un modelo de lenguaje grande disperso con 72 mil millones de parámetros y 16 mil millones de parámetros activados. Está basado en la arquitectura de expertos mixtos agrupados (MoGE), que agrupa expertos durante la selección y restringe la activación de un número igual de expertos por grupo para cada token, logrando un balance de carga entre expertos y mejorando significativamente la eficiencia de despliegue en la plataforma Ascend."
|
||||
},
|
||||
"aya": {
|
||||
"description": "Aya 23 es un modelo multilingüe lanzado por Cohere, que admite 23 idiomas, facilitando aplicaciones de lenguaje diversas."
|
||||
},
|
||||
@@ -569,6 +551,9 @@
|
||||
"baichuan/baichuan2-13b-chat": {
|
||||
"description": "Baichuan-13B es un modelo de lenguaje de gran escala de código abierto y comercializable desarrollado por Baichuan Intelligence, que cuenta con 13 mil millones de parámetros y ha logrado los mejores resultados en benchmarks autorizados en chino e inglés."
|
||||
},
|
||||
"baidu/ERNIE-4.5-300B-A47B": {
|
||||
"description": "ERNIE-4.5-300B-A47B es un modelo de lenguaje grande desarrollado por Baidu basado en la arquitectura de expertos mixtos (MoE). Cuenta con un total de 300 mil millones de parámetros, pero durante la inferencia solo activa 47 mil millones por token, equilibrando un rendimiento potente con eficiencia computacional. Como uno de los modelos centrales de la serie ERNIE 4.5, destaca en tareas de comprensión, generación, razonamiento y programación de texto. Emplea un innovador método de preentrenamiento multimodal heterogéneo MoE, que combina entrenamiento conjunto de texto y visión, mejorando la capacidad integral del modelo, especialmente en el seguimiento de instrucciones y la memoria de conocimientos del mundo."
|
||||
},
|
||||
"c4ai-aya-expanse-32b": {
|
||||
"description": "Aya Expanse es un modelo multilingüe de alto rendimiento de 32B, diseñado para desafiar el rendimiento de los modelos monolingües a través de innovaciones en ajuste por instrucciones, arbitraje de datos, entrenamiento de preferencias y fusión de modelos. Soporta 23 idiomas."
|
||||
},
|
||||
@@ -914,17 +899,53 @@
|
||||
"doubao-1.5-thinking-pro": {
|
||||
"description": "El modelo de pensamiento profundo Doubao-1.5, completamente nuevo, destaca en campos especializados como matemáticas, programación y razonamiento científico, así como en tareas generales como la escritura creativa, alcanzando o acercándose al nivel de élite de la industria en múltiples estándares de referencia, como AIME 2024, Codeforces y GPQA. Soporta una ventana de contexto de 128k y una salida de 16k."
|
||||
},
|
||||
"doubao-1.5-thinking-pro-m": {
|
||||
"description": "Doubao-1.5 es un nuevo modelo de pensamiento profundo (la versión m incluye capacidades nativas de inferencia multimodal profunda), que destaca en matemáticas, programación, razonamiento científico y tareas generales como escritura creativa. Alcanza o se acerca al nivel de élite en benchmarks reconocidos como AIME 2024, Codeforces y GPQA. Soporta ventana de contexto de 128k y salida de 16k."
|
||||
},
|
||||
"doubao-1.5-thinking-vision-pro": {
|
||||
"description": "Nuevo modelo de pensamiento profundo visual con capacidades avanzadas de comprensión e inferencia multimodal general, logrando resultados SOTA en 37 de 59 benchmarks públicos."
|
||||
},
|
||||
"doubao-1.5-ui-tars": {
|
||||
"description": "Doubao-1.5-UI-TARS es un modelo agente nativo orientado a la interacción con interfaces gráficas (GUI). Mediante capacidades humanas de percepción, razonamiento y acción, interactúa de forma fluida con la GUI."
|
||||
},
|
||||
"doubao-1.5-vision-lite": {
|
||||
"description": "Doubao-1.5-vision-lite es un modelo multimodal de gran escala actualizado, que soporta el reconocimiento de imágenes de cualquier resolución y proporciones extremas, mejorando la capacidad de razonamiento visual, reconocimiento de documentos, comprensión de información detallada y seguimiento de instrucciones. Soporta una ventana de contexto de 128k, con una longitud de salida que admite hasta 16k tokens."
|
||||
},
|
||||
"doubao-1.5-vision-pro": {
|
||||
"description": "Doubao-1.5-vision-pro es un modelo multimodal avanzado que soporta reconocimiento de imágenes con cualquier resolución y proporciones extremas, mejorando el razonamiento visual, reconocimiento de documentos, comprensión de detalles y seguimiento de instrucciones."
|
||||
},
|
||||
"doubao-1.5-vision-pro-32k": {
|
||||
"description": "Doubao-1.5-vision-pro es un modelo multimodal avanzado que soporta reconocimiento de imágenes con cualquier resolución y proporciones extremas, mejorando el razonamiento visual, reconocimiento de documentos, comprensión de detalles y seguimiento de instrucciones."
|
||||
},
|
||||
"doubao-lite-128k": {
|
||||
"description": "Ofrece una velocidad de respuesta excepcional y una mejor relación calidad-precio, proporcionando opciones más flexibles para diferentes escenarios de los clientes. Soporta inferencia y ajuste fino con una ventana de contexto de 128k."
|
||||
},
|
||||
"doubao-lite-32k": {
|
||||
"description": "Ofrece una velocidad de respuesta excepcional y una mejor relación calidad-precio, proporcionando opciones más flexibles para diferentes escenarios de los clientes. Soporta inferencia y ajuste fino con una ventana de contexto de 32k."
|
||||
},
|
||||
"doubao-lite-4k": {
|
||||
"description": "Ofrece una velocidad de respuesta excepcional y una mejor relación calidad-precio, proporcionando opciones más flexibles para diferentes escenarios de los clientes. Soporta inferencia y ajuste fino con una ventana de contexto de 4k."
|
||||
},
|
||||
"doubao-pro-256k": {
|
||||
"description": "El modelo principal con mejor rendimiento, adecuado para tareas complejas, con excelentes resultados en preguntas de referencia, resúmenes, creación, clasificación de texto, juegos de rol y otros escenarios. Soporta inferencia y ajuste fino con una ventana de contexto de 256k."
|
||||
},
|
||||
"doubao-pro-32k": {
|
||||
"description": "El modelo principal con mejor rendimiento, adecuado para tareas complejas, con excelentes resultados en preguntas de referencia, resúmenes, creación, clasificación de texto, juegos de rol y otros escenarios. Soporta inferencia y ajuste fino con una ventana de contexto de 32k."
|
||||
},
|
||||
"doubao-seed-1.6": {
|
||||
"description": "Doubao-Seed-1.6 es un nuevo modelo multimodal de pensamiento profundo que soporta tres modos de pensamiento: automático, reflexivo y no reflexivo. En modo no reflexivo, el rendimiento del modelo mejora significativamente en comparación con Doubao-1.5-pro/250115. Soporta una ventana de contexto de 256k y una longitud máxima de salida de 16k tokens."
|
||||
},
|
||||
"doubao-seed-1.6-flash": {
|
||||
"description": "Doubao-Seed-1.6-flash es un modelo multimodal de pensamiento profundo con velocidad de inferencia extrema, TPOT de solo 10 ms; soporta comprensión tanto textual como visual, con capacidad de comprensión textual superior a la generación lite anterior y comprensión visual comparable a la serie pro de competidores. Soporta una ventana de contexto de 256k y una longitud máxima de salida de 16k tokens."
|
||||
"description": "Doubao-Seed-1.6-flash es un modelo multimodal de pensamiento profundo con velocidad de inferencia extrema, TPOT de solo 10 ms; soporta comprensión tanto textual como visual, con capacidad de comprensión textual superior a la generación lite anterior y comprensión visual comparable a los modelos pro de la competencia. Soporta una ventana de contexto de 256k y una longitud máxima de salida de 16k tokens."
|
||||
},
|
||||
"doubao-seed-1.6-thinking": {
|
||||
"description": "El modelo Doubao-Seed-1.6-thinking tiene una capacidad de pensamiento significativamente mejorada. En comparación con Doubao-1.5-thinking-pro, mejora aún más en habilidades básicas como programación, matemáticas y razonamiento lógico, además de soportar comprensión visual. Soporta una ventana de contexto de 256k y una longitud máxima de salida de 16k tokens."
|
||||
"description": "El modelo Doubao-Seed-1.6-thinking tiene una capacidad de pensamiento significativamente mejorada. En comparación con Doubao-1.5-thinking-pro, mejora aún más en habilidades básicas como programación, matemáticas y razonamiento lógico, y soporta comprensión visual. Soporta una ventana de contexto de 256k y una longitud máxima de salida de 16k tokens."
|
||||
},
|
||||
"doubao-vision-lite-32k": {
|
||||
"description": "El modelo Doubao-vision es un modelo multimodal desarrollado por Doubao, con potentes capacidades de comprensión e inferencia de imágenes, así como una precisa comprensión de instrucciones. El modelo muestra un rendimiento destacado en extracción de información texto-imagen y tareas de inferencia basadas en imágenes, aplicable a tareas de preguntas visuales más complejas y amplias."
|
||||
},
|
||||
"doubao-vision-pro-32k": {
|
||||
"description": "El modelo Doubao-vision es un modelo multimodal desarrollado por Doubao, con potentes capacidades de comprensión e inferencia de imágenes, así como una precisa comprensión de instrucciones. El modelo muestra un rendimiento destacado en extracción de información texto-imagen y tareas de inferencia basadas en imágenes, aplicable a tareas de preguntas visuales más complejas y amplias."
|
||||
},
|
||||
"emohaa": {
|
||||
"description": "Emohaa es un modelo psicológico con capacidades de consulta profesional, ayudando a los usuarios a comprender problemas emocionales."
|
||||
@@ -1082,9 +1103,6 @@
|
||||
"gemini-2.5-pro": {
|
||||
"description": "Gemini 2.5 Pro es el modelo de pensamiento más avanzado de Google, capaz de razonar sobre problemas complejos en código, matemáticas y áreas STEM, así como de analizar grandes conjuntos de datos, bases de código y documentos utilizando contextos largos."
|
||||
},
|
||||
"gemini-2.5-pro-exp-03-25": {
|
||||
"description": "Gemini 2.5 Pro Experimental es el modelo de pensamiento más avanzado de Google, capaz de razonar sobre problemas complejos en código, matemáticas y campos STEM, además de utilizar contextos largos para analizar grandes conjuntos de datos, bibliotecas de código y documentos."
|
||||
},
|
||||
"gemini-2.5-pro-preview-03-25": {
|
||||
"description": "Gemini 2.5 Pro Preview es el modelo de pensamiento más avanzado de Google, capaz de razonar sobre problemas complejos en código, matemáticas y campos STEM, así como de analizar grandes conjuntos de datos, bibliotecas de código y documentos utilizando un contexto largo."
|
||||
},
|
||||
@@ -1151,6 +1169,12 @@
|
||||
"glm-4-plus": {
|
||||
"description": "GLM-4-Plus, como buque insignia de alta inteligencia, tiene una poderosa capacidad para manejar textos largos y tareas complejas, con un rendimiento mejorado en general."
|
||||
},
|
||||
"glm-4.1v-thinking-flash": {
|
||||
"description": "La serie GLM-4.1V-Thinking es el modelo visual más potente conocido en la categoría de VLMs de 10 mil millones de parámetros, integrando tareas de lenguaje visual de última generación (SOTA) en su nivel, incluyendo comprensión de video, preguntas sobre imágenes, resolución de problemas académicos, reconocimiento OCR, interpretación de documentos y gráficos, agentes GUI, codificación web frontend, grounding, entre otros. En muchas tareas, supera incluso a modelos con 8 veces más parámetros como Qwen2.5-VL-72B. Gracias a técnicas avanzadas de aprendizaje reforzado, el modelo domina el razonamiento mediante cadenas de pensamiento para mejorar la precisión y riqueza de las respuestas, superando significativamente a los modelos tradicionales sin pensamiento en términos de resultados y explicabilidad."
|
||||
},
|
||||
"glm-4.1v-thinking-flashx": {
|
||||
"description": "La serie GLM-4.1V-Thinking es el modelo visual más potente conocido en la categoría de VLMs de 10 mil millones de parámetros, integrando tareas de lenguaje visual de última generación (SOTA) en su nivel, incluyendo comprensión de video, preguntas sobre imágenes, resolución de problemas académicos, reconocimiento OCR, interpretación de documentos y gráficos, agentes GUI, codificación web frontend, grounding, entre otros. En muchas tareas, supera incluso a modelos con 8 veces más parámetros como Qwen2.5-VL-72B. Gracias a técnicas avanzadas de aprendizaje reforzado, el modelo domina el razonamiento mediante cadenas de pensamiento para mejorar la precisión y riqueza de las respuestas, superando significativamente a los modelos tradicionales sin pensamiento en términos de resultados y explicabilidad."
|
||||
},
|
||||
"glm-4v": {
|
||||
"description": "GLM-4V proporciona una poderosa capacidad de comprensión e inferencia de imágenes, soportando diversas tareas visuales."
|
||||
},
|
||||
@@ -1172,6 +1196,9 @@
|
||||
"glm-z1-flash": {
|
||||
"description": "La serie GLM-Z1 posee una poderosa capacidad de razonamiento complejo, destacando en áreas como razonamiento lógico, matemáticas y programación. La longitud máxima del contexto es de 32K."
|
||||
},
|
||||
"glm-z1-flashx": {
|
||||
"description": "Alta velocidad y bajo costo: versión mejorada Flash, con velocidad de inferencia ultrarrápida y mejor garantía de concurrencia."
|
||||
},
|
||||
"glm-zero-preview": {
|
||||
"description": "GLM-Zero-Preview posee una poderosa capacidad de razonamiento complejo, destacándose en áreas como razonamiento lógico, matemáticas y programación."
|
||||
},
|
||||
@@ -1223,6 +1250,9 @@
|
||||
"google/gemma-2b-it": {
|
||||
"description": "Gemma Instruct (2B) ofrece capacidades básicas de procesamiento de instrucciones, adecuado para aplicaciones ligeras."
|
||||
},
|
||||
"google/gemma-3-1b-it": {
|
||||
"description": "Gemma 3 1B es un modelo de lenguaje de código abierto de Google que establece nuevos estándares en eficiencia y rendimiento."
|
||||
},
|
||||
"google/gemma-3-27b-it": {
|
||||
"description": "Gemma 3 27B es un modelo de lenguaje de código abierto de Google, que establece nuevos estándares en eficiencia y rendimiento."
|
||||
},
|
||||
@@ -1313,6 +1343,9 @@
|
||||
"gpt-4o-mini-search-preview": {
|
||||
"description": "GPT-4o mini versión preliminar de búsqueda es un modelo entrenado específicamente para comprender y ejecutar consultas de búsqueda web, utilizando la API de Chat Completions. Además de los costos por tokens, las consultas de búsqueda web incurren en cargos por cada llamada a la herramienta."
|
||||
},
|
||||
"gpt-4o-mini-transcribe": {
|
||||
"description": "GPT-4o Mini Transcribe es un modelo de conversión de voz a texto que utiliza GPT-4o para transcribir audio. En comparación con el modelo Whisper original, mejora la tasa de error de palabras y aumenta la precisión y el reconocimiento del idioma. Úselo para obtener transcripciones más precisas."
|
||||
},
|
||||
"gpt-4o-mini-tts": {
|
||||
"description": "GPT-4o mini TTS es un modelo de texto a voz basado en GPT-4o mini, que ofrece generación de voz de alta calidad a un costo más bajo."
|
||||
},
|
||||
@@ -1322,12 +1355,15 @@
|
||||
"gpt-4o-realtime-preview-2024-10-01": {
|
||||
"description": "Versión en tiempo real de GPT-4o, que admite entrada y salida de audio y texto en tiempo real."
|
||||
},
|
||||
"gpt-4o-realtime-preview-2024-12-17": {
|
||||
"description": "Versión en tiempo real de GPT-4o, que admite entrada y salida de audio y texto en tiempo real."
|
||||
"gpt-4o-realtime-preview-2025-06-03": {
|
||||
"description": "Versión en tiempo real de GPT-4o, que soporta entrada y salida de audio y texto en tiempo real."
|
||||
},
|
||||
"gpt-4o-search-preview": {
|
||||
"description": "GPT-4o versión preliminar de búsqueda es un modelo entrenado específicamente para comprender y ejecutar consultas de búsqueda web, utilizando la API de Chat Completions. Además de los costos por tokens, las consultas de búsqueda web incurren en cargos por cada llamada a la herramienta."
|
||||
},
|
||||
"gpt-4o-transcribe": {
|
||||
"description": "GPT-4o Transcribe es un modelo de conversión de voz a texto que utiliza GPT-4o para transcribir audio. En comparación con el modelo Whisper original, mejora la tasa de error de palabras y aumenta la precisión y el reconocimiento del idioma. Úselo para obtener transcripciones más precisas."
|
||||
},
|
||||
"grok-2-1212": {
|
||||
"description": "Este modelo ha mejorado en precisión, cumplimiento de instrucciones y capacidades multilingües."
|
||||
},
|
||||
@@ -1346,9 +1382,15 @@
|
||||
"grok-3-mini-fast": {
|
||||
"description": "Modelo ligero que piensa antes de responder. Rápido e inteligente, adecuado para tareas lógicas que no requieren conocimientos profundos de dominio y capaz de proporcionar la trayectoria original del pensamiento."
|
||||
},
|
||||
"grok-4": {
|
||||
"description": "Nuestro modelo insignia más reciente y potente, que destaca en procesamiento de lenguaje natural, cálculo matemático y razonamiento — un competidor versátil y perfecto."
|
||||
},
|
||||
"gryphe/mythomax-l2-13b": {
|
||||
"description": "MythoMax l2 13B es un modelo de lenguaje que combina creatividad e inteligencia, fusionando múltiples modelos de vanguardia."
|
||||
},
|
||||
"hunyuan-a13b": {
|
||||
"description": "El primer modelo de razonamiento híbrido de Hunyuan, una versión mejorada de hunyuan-standard-256K, con un total de 80 mil millones de parámetros y 13 mil millones activados. Por defecto opera en modo de pensamiento lento, pero soporta cambio entre modos rápido y lento mediante parámetros o instrucciones, añadiendo / no_think antes de la consulta para alternar. Su capacidad general mejora integralmente respecto a la generación anterior, con avances notables en matemáticas, ciencias, comprensión de textos largos y habilidades de agente."
|
||||
},
|
||||
"hunyuan-code": {
|
||||
"description": "El último modelo de generación de código de Hunyuan, entrenado con 200B de datos de código de alta calidad, con medio año de entrenamiento de datos SFT de alta calidad, aumentando la longitud de la ventana de contexto a 8K, destacándose en métricas automáticas de generación de código en cinco lenguajes; en evaluaciones de calidad humana de tareas de código en diez aspectos en cinco lenguajes, su rendimiento se encuentra en la primera categoría."
|
||||
},
|
||||
@@ -1400,6 +1442,9 @@
|
||||
"hunyuan-t1-vision": {
|
||||
"description": "Modelo de pensamiento profundo multimodal Hunyuan, que soporta cadenas de pensamiento nativas multimodales, sobresale en diversos escenarios de razonamiento con imágenes y mejora significativamente en problemas científicos en comparación con modelos de pensamiento rápido."
|
||||
},
|
||||
"hunyuan-t1-vision-20250619": {
|
||||
"description": "La última versión del modelo de pensamiento profundo multimodal t1-vision de Hunyuan, que soporta cadenas de pensamiento nativas multimodales, con mejoras integrales respecto a la versión predeterminada anterior."
|
||||
},
|
||||
"hunyuan-turbo": {
|
||||
"description": "Versión preliminar de la nueva generación del modelo de lenguaje de Hunyuan, que utiliza una nueva estructura de modelo de expertos mixtos (MoE), con una eficiencia de inferencia más rápida y un rendimiento más fuerte en comparación con Hunyuan-Pro."
|
||||
},
|
||||
@@ -1430,6 +1475,12 @@
|
||||
"hunyuan-turbos-role-plus": {
|
||||
"description": "Modelo de rol más reciente de Hunyuan, afinado oficialmente por Hunyuan, entrenado adicionalmente con conjuntos de datos de escenarios de juego de roles, ofreciendo mejores resultados básicos en dichos escenarios."
|
||||
},
|
||||
"hunyuan-turbos-vision": {
|
||||
"description": "Este modelo está diseñado para escenarios de comprensión de imágenes y texto, basado en la última generación de modelos insignia visual-lingüísticos turbos de Hunyuan. Se enfoca en tareas relacionadas con la comprensión de imágenes, incluyendo reconocimiento de entidades basado en imágenes, preguntas de conocimiento, creación de textos y resolución de problemas mediante fotos, con mejoras integrales respecto a la generación anterior."
|
||||
},
|
||||
"hunyuan-turbos-vision-20250619": {
|
||||
"description": "La última versión del modelo insignia visual-lingüístico turbos-vision de Hunyuan, que mejora integralmente la comprensión de imágenes y texto, incluyendo reconocimiento de entidades basado en imágenes, preguntas de conocimiento, creación de textos y resolución de problemas mediante fotos, respecto a la versión predeterminada anterior."
|
||||
},
|
||||
"hunyuan-vision": {
|
||||
"description": "El último modelo multimodal de Hunyuan, que admite la entrada de imágenes y texto para generar contenido textual."
|
||||
},
|
||||
@@ -1457,6 +1508,9 @@
|
||||
"jina-deepsearch-v1": {
|
||||
"description": "La búsqueda profunda combina la búsqueda en la web, la lectura y el razonamiento para realizar investigaciones exhaustivas. Puedes considerarlo como un agente que acepta tus tareas de investigación: realiza una búsqueda amplia y pasa por múltiples iteraciones antes de proporcionar una respuesta. Este proceso implica una investigación continua, razonamiento y resolución de problemas desde diferentes ángulos. Esto es fundamentalmente diferente de los grandes modelos estándar que generan respuestas directamente a partir de datos preentrenados y de los sistemas RAG tradicionales que dependen de búsquedas superficiales únicas."
|
||||
},
|
||||
"kimi-k2-0711-preview": {
|
||||
"description": "kimi-k2 es un modelo base con arquitectura MoE que posee capacidades excepcionales en código y agentes, con un total de 1T parámetros y 32B parámetros activados. En pruebas de rendimiento en categorías principales como razonamiento general, programación, matemáticas y agentes, el modelo K2 supera a otros modelos de código abierto populares."
|
||||
},
|
||||
"kimi-latest": {
|
||||
"description": "El producto asistente inteligente Kimi utiliza el último modelo grande de Kimi, que puede incluir características que aún no están estables. Soporta la comprensión de imágenes y seleccionará automáticamente el modelo de facturación de 8k/32k/128k según la longitud del contexto de la solicitud."
|
||||
},
|
||||
@@ -1869,7 +1923,7 @@
|
||||
"description": "o1 es el nuevo modelo de inferencia de OpenAI, adecuado para tareas complejas que requieren un amplio conocimiento general. Este modelo tiene un contexto de 128K y una fecha de corte de conocimiento en octubre de 2023."
|
||||
},
|
||||
"o1-pro": {
|
||||
"description": "La serie o1 ha sido entrenada mediante aprendizaje reforzado para pensar antes de responder y ejecutar tareas de razonamiento complejas. El modelo o1-pro utiliza más recursos computacionales para un pensamiento más profundo, proporcionando respuestas de calidad superior de manera continua."
|
||||
"description": "La serie o1 ha sido entrenada mediante aprendizaje reforzado para pensar antes de responder y ejecutar tareas de razonamiento complejas. El modelo o1-pro utiliza más recursos computacionales para un pensamiento más profundo, proporcionando respuestas de calidad superior de manera constante."
|
||||
},
|
||||
"o3": {
|
||||
"description": "o3 es un modelo versátil y potente, que destaca en múltiples campos. Establece un nuevo estándar para tareas de matemáticas, ciencia, programación y razonamiento visual. También es hábil en redacción técnica y seguimiento de instrucciones. Los usuarios pueden utilizarlo para analizar texto, código e imágenes, resolviendo problemas complejos de múltiples pasos."
|
||||
@@ -1881,7 +1935,7 @@
|
||||
"description": "o3-mini es nuestro último modelo de inferencia de tamaño pequeño, que ofrece alta inteligencia con los mismos objetivos de costo y latencia que o1-mini."
|
||||
},
|
||||
"o3-pro": {
|
||||
"description": "El modelo o3-pro utiliza más capacidad computacional para pensar más profundamente y siempre ofrecer mejores respuestas, soportado únicamente bajo la API de Responses."
|
||||
"description": "El modelo o3-pro utiliza más capacidad computacional para pensar más profundamente y siempre ofrecer mejores respuestas, y solo está disponible para uso bajo la API de Responses."
|
||||
},
|
||||
"o4-mini": {
|
||||
"description": "o4-mini es nuestro último modelo de la serie o en formato pequeño. Está optimizado para una inferencia rápida y efectiva, mostrando una alta eficiencia y rendimiento en tareas de codificación y visuales."
|
||||
@@ -2349,7 +2403,7 @@
|
||||
"description": "El modelo v0-1.5-md es adecuado para tareas cotidianas y generación de interfaces de usuario (UI)"
|
||||
},
|
||||
"whisper-1": {
|
||||
"description": "Modelo de reconocimiento de voz general, que admite reconocimiento de voz multilingüe, traducción de voz y reconocimiento de idiomas."
|
||||
"description": "Modelo universal de reconocimiento de voz que soporta reconocimiento de voz multilingüe, traducción de voz y detección de idioma."
|
||||
},
|
||||
"wizardlm2": {
|
||||
"description": "WizardLM 2 es un modelo de lenguaje proporcionado por Microsoft AI, que destaca en diálogos complejos, multilingües, razonamiento y asistentes inteligentes."
|
||||
|
||||
@@ -520,6 +520,7 @@
|
||||
"hotkey": "Atajos de teclado",
|
||||
"llm": "Modelo de lenguaje",
|
||||
"provider": "Proveedor de servicios de IA",
|
||||
"proxy": "Proxy de red",
|
||||
"storage": "Almacenamiento de datos",
|
||||
"sync": "Sincronización en la nube",
|
||||
"system-agent": "Asistente del sistema",
|
||||
|
||||
@@ -46,6 +46,9 @@
|
||||
"reasoningEffort": {
|
||||
"title": "شدت استدلال"
|
||||
},
|
||||
"thinking": {
|
||||
"title": "کلید تفکر عمیق"
|
||||
},
|
||||
"title": "ویژگیهای گسترش مدل"
|
||||
},
|
||||
"history": {
|
||||
|
||||
@@ -1,4 +1,43 @@
|
||||
{
|
||||
"proxy": {
|
||||
"auth": "نیاز به تأیید هویت",
|
||||
"authDesc": "اگر سرور پروکسی به نام کاربری و رمز عبور نیاز دارد",
|
||||
"authSettings": "تنظیمات احراز هویت",
|
||||
"basicSettings": "تنظیمات پروکسی",
|
||||
"basicSettingsDesc": "پیکربندی پارامترهای اتصال به سرور پروکسی",
|
||||
"bypass": "آدرسهایی که از پروکسی استفاده نمیکنند",
|
||||
"connectionTest": "آزمایش اتصال",
|
||||
"enable": "فعالسازی پروکسی",
|
||||
"enableDesc": "با فعالسازی، دسترسی به شبکه از طریق سرور پروکسی انجام میشود",
|
||||
"password": "رمز عبور",
|
||||
"password_placeholder": "لطفاً رمز عبور را وارد کنید",
|
||||
"port": "پورت",
|
||||
"resetButton": "بازنشانی",
|
||||
"saveButton": "ذخیره",
|
||||
"saveFailed": "ذخیرهسازی ناموفق: {{error}}",
|
||||
"saveSuccess": "تنظیمات پروکسی با موفقیت ذخیره شد",
|
||||
"server": "آدرس سرور",
|
||||
"testButton": "آزمایش اتصال",
|
||||
"testDescription": "اتصال را با استفاده از پیکربندی پروکسی فعلی آزمایش کنید تا صحت تنظیمات بررسی شود",
|
||||
"testFailed": "اتصال ناموفق بود",
|
||||
"testSuccessWithTime": "اتصال با موفقیت آزمایش شد، زمان صرف شده {{time}} میلیثانیه",
|
||||
"testUrl": "آدرس آزمایش",
|
||||
"testUrlPlaceholder": "لطفاً آدرس URL مورد نظر برای آزمایش را وارد کنید",
|
||||
"testing": "در حال آزمایش اتصال...",
|
||||
"type": "نوع پروکسی",
|
||||
"unsavedChanges": "شما تغییرات ذخیره نشدهای دارید",
|
||||
"username": "نام کاربری",
|
||||
"username_placeholder": "لطفاً نام کاربری را وارد کنید",
|
||||
"validation": {
|
||||
"passwordRequired": "رمز عبور هنگام فعالسازی احراز هویت الزامی است",
|
||||
"portInvalid": "پورت باید عددی بین ۱ تا ۶۵۵۳۵ باشد",
|
||||
"portRequired": "پورت هنگام فعالسازی پروکسی الزامی است",
|
||||
"serverInvalid": "لطفاً یک آدرس سرور معتبر (IP یا دامنه) وارد کنید",
|
||||
"serverRequired": "آدرس سرور هنگام فعالسازی پروکسی الزامی است",
|
||||
"typeRequired": "نوع پروکسی هنگام فعالسازی الزامی است",
|
||||
"usernameRequired": "نام کاربری هنگام فعالسازی احراز هویت الزامی است"
|
||||
}
|
||||
},
|
||||
"remoteServer": {
|
||||
"authError": "خطای مجوز: {{error}}",
|
||||
"authPending": "لطفاً مجوز را در مرورگر کامل کنید",
|
||||
|
||||
+97
-43
@@ -71,44 +71,23 @@
|
||||
"DeepSeek-V3": {
|
||||
"description": "DeepSeek-V3 یک مدل MoE است که توسط شرکت DeepSeek توسعه یافته است. نتایج ارزیابیهای متعدد DeepSeek-V3 از مدلهای متن باز دیگر مانند Qwen2.5-72B و Llama-3.1-405B فراتر رفته و از نظر عملکرد با مدلهای بسته جهانی برتر مانند GPT-4o و Claude-3.5-Sonnet برابری میکند."
|
||||
},
|
||||
"Doubao-1.5-thinking-pro-m": {
|
||||
"description": "Doubao-1.5 مدل جدید تفکر عمیق (نسخه m دارای قابلیت استدلال عمیق چندرسانهای بومی است) است که در زمینههای تخصصی مانند ریاضیات، برنامهنویسی، استدلال علمی و همچنین وظایف عمومی مانند نوشتن خلاقانه عملکرد برجستهای دارد و در چندین معیار معتبر مانند AIME 2024، Codeforces، GPQA به سطح اول صنعت دست یافته یا نزدیک شده است. این مدل از پنجره زمینه 128k و خروجی 16k پشتیبانی میکند."
|
||||
},
|
||||
"Doubao-1.5-thinking-vision-pro": {
|
||||
"description": "مدل جدید تفکر عمیق بصری که دارای تواناییهای قویتر در درک و استدلال چندرسانهای عمومی است و در 37 مورد از 59 معیار ارزیابی عمومی عملکرد SOTA را به دست آورده است."
|
||||
},
|
||||
"Doubao-1.5-vision-pro": {
|
||||
"description": "Doubao-1.5-vision-pro مدل بزرگ چندرسانهای بهروز شده است که از شناسایی تصاویر با هر وضوح و نسبت ابعاد بسیار طولانی پشتیبانی میکند و تواناییهای استدلال بصری، شناسایی مستندات، درک اطلاعات جزئی و پیروی از دستورات را تقویت میکند."
|
||||
},
|
||||
"Doubao-1.5-vision-pro-32k": {
|
||||
"description": "مدل بزرگ چندرسانهای ارتقاء یافته Doubao-1.5-vision-pro، از شناسایی تصاویر با هر وضوح و نسبت ابعاد بسیار طولانی پشتیبانی میکند و تواناییهای استدلال بصری، شناسایی اسناد، درک اطلاعات جزئی و پیروی از دستورات را تقویت میکند."
|
||||
},
|
||||
"Doubao-lite-128k": {
|
||||
"description": "Doubao-lite دارای سرعت پاسخدهی بسیار بالا و قیمت مناسبتر است و برای سناریوهای مختلف مشتریان گزینههای منعطفتری ارائه میدهد. این مدل از استنتاج و تنظیم 128k پنجره متنی پشتیبانی میکند."
|
||||
"description": "Doubao-lite دارای سرعت پاسخگویی بینظیر و نسبت قیمت به کارایی بهتر است و گزینههای انعطافپذیرتری را برای سناریوهای مختلف مشتریان ارائه میدهد. از پنجره متنی 128k برای استدلال و تنظیم دقیق پشتیبانی میکند."
|
||||
},
|
||||
"Doubao-lite-32k": {
|
||||
"description": "Doubao-lite دارای سرعت پاسخدهی بسیار بالا و قیمت مناسبتر است و برای سناریوهای مختلف مشتریان گزینههای منعطفتری ارائه میدهد. این مدل از استنتاج و تنظیم 32k پنجره متنی پشتیبانی میکند."
|
||||
"description": "Doubao-lite دارای سرعت پاسخگویی بینظیر و نسبت قیمت به کارایی بهتر است و گزینههای انعطافپذیرتری را برای سناریوهای مختلف مشتریان ارائه میدهد. از پنجره متنی 32k برای استدلال و تنظیم دقیق پشتیبانی میکند."
|
||||
},
|
||||
"Doubao-lite-4k": {
|
||||
"description": "Doubao-lite دارای سرعت پاسخدهی بسیار بالا و قیمت مناسبتر است و برای سناریوهای مختلف مشتریان گزینههای منعطفتری ارائه میدهد. این مدل از استنتاج و تنظیم 4k پنجره متنی پشتیبانی میکند."
|
||||
"description": "Doubao-lite دارای سرعت پاسخگویی بینظیر و نسبت قیمت به کارایی بهتر است و گزینههای انعطافپذیرتری را برای سناریوهای مختلف مشتریان ارائه میدهد. از پنجره متنی 4k برای استدلال و تنظیم دقیق پشتیبانی میکند."
|
||||
},
|
||||
"Doubao-pro-128k": {
|
||||
"description": "بهترین مدل اصلی با عملکرد بسیار خوب برای پردازش وظایف پیچیده است و در سناریوهایی مانند پرسش و پاسخ مدل مرجع، خلاصهنویسی، خلاقیت، طبقهبندی متن و بازی نقش عملکرد خوبی دارد. این مدل از استنتاج و تنظیم 128k پنجره متنی پشتیبانی میکند."
|
||||
},
|
||||
"Doubao-pro-256k": {
|
||||
"description": "بهترین مدل اصلی از نظر عملکرد، مناسب برای پردازش وظایف پیچیده، در زمینههای پرسش و پاسخ مرجع، خلاصهسازی، خلاقیت، طبقهبندی متن و نقشآفرینی عملکرد خوبی دارد. از استدلال و تنظیم دقیق با پنجره زمینه 256k پشتیبانی میکند."
|
||||
"description": "مدل اصلی با بهترین عملکرد، مناسب برای انجام وظایف پیچیده است و در زمینههایی مانند پاسخ به سوالات مرجع، خلاصهسازی، خلق محتوا، دستهبندی متن و نقشآفرینی عملکرد بسیار خوبی دارد. از پنجره متنی 128k برای استدلال و تنظیم دقیق پشتیبانی میکند."
|
||||
},
|
||||
"Doubao-pro-32k": {
|
||||
"description": "بهترین مدل اصلی با عملکرد بسیار خوب برای پردازش وظایف پیچیده است و در سناریوهایی مانند پرسش و پاسخ مدل مرجع، خلاصهنویسی، خلاقیت، طبقهبندی متن و بازی نقش عملکرد خوبی دارد. این مدل از استنتاج و تنظیم 32k پنجره متنی پشتیبانی میکند."
|
||||
"description": "مدل اصلی با بهترین عملکرد، مناسب برای انجام وظایف پیچیده است و در زمینههایی مانند پاسخ به سوالات مرجع، خلاصهسازی، خلق محتوا، دستهبندی متن و نقشآفرینی عملکرد بسیار خوبی دارد. از پنجره متنی 32k برای استدلال و تنظیم دقیق پشتیبانی میکند."
|
||||
},
|
||||
"Doubao-pro-4k": {
|
||||
"description": "بهترین مدل اصلی با عملکرد بسیار خوب برای پردازش وظایف پیچیده است و در سناریوهایی مانند پرسش و پاسخ مدل مرجع، خلاصهنویسی، خلاقیت، طبقهبندی متن و بازی نقش عملکرد خوبی دارد. این مدل از استنتاج و تنظیم 4k پنجره متنی پشتیبانی میکند."
|
||||
},
|
||||
"Doubao-vision-lite-32k": {
|
||||
"description": "مدل Doubao-vision یک مدل بزرگ چندرسانهای است که توسط Doubao ارائه شده و دارای تواناییهای قوی در درک و استدلال تصاویر و همچنین درک دقیق دستورات است. این مدل در استخراج اطلاعات متنی از تصاویر و وظایف استدلال مبتنی بر تصویر عملکرد قوی از خود نشان داده و میتواند در وظایف پیچیدهتر و گستردهتر پرسش و پاسخ بصری به کار رود."
|
||||
},
|
||||
"Doubao-vision-pro-32k": {
|
||||
"description": "مدل Doubao-vision یک مدل بزرگ چندرسانهای است که توسط Doubao ارائه شده و دارای تواناییهای قوی در درک و استدلال تصاویر و همچنین درک دقیق دستورات است. این مدل در استخراج اطلاعات متنی از تصاویر و وظایف استدلال مبتنی بر تصویر عملکرد قوی از خود نشان داده و میتواند در وظایف پیچیدهتر و گستردهتر پرسش و پاسخ بصری به کار رود."
|
||||
"description": "مدل اصلی با بهترین عملکرد، مناسب برای انجام وظایف پیچیده است و در زمینههایی مانند پاسخ به سوالات مرجع، خلاصهسازی، خلق محتوا، دستهبندی متن و نقشآفرینی عملکرد بسیار خوبی دارد. از پنجره متنی 4k برای استدلال و تنظیم دقیق پشتیبانی میکند."
|
||||
},
|
||||
"ERNIE-3.5-128K": {
|
||||
"description": "مدل زبان بزرگ پرچمدار توسعهیافته توسط بایدو، که حجم عظیمی از متون چینی و انگلیسی را پوشش میدهد و دارای تواناییهای عمومی قدرتمندی است. این مدل میتواند نیازهای اکثر سناریوهای پرسش و پاسخ، تولید محتوا و استفاده از افزونهها را برآورده کند؛ همچنین از اتصال خودکار به افزونه جستجوی بایدو پشتیبانی میکند تا بهروز بودن اطلاعات پرسش و پاسخ را تضمین کند."
|
||||
@@ -224,24 +203,21 @@
|
||||
"Pro/Qwen/Qwen2.5-VL-7B-Instruct": {
|
||||
"description": "Qwen2.5-VL عضو جدید سری Qwen است که توانایی قدرتمند درک بصری دارد. این مدل میتواند متن، نمودارها و طرحبندیهای درون تصاویر را تحلیل کند و همچنین قادر به درک ویدیوهای بلند و گرفتن رویدادهاست. این مدل میتواند استدلال کند، ابزارها را عملیاتی کند، و از چندین فرمت برای تعیین موقعیت اشیا و تولید خروجی ساختاری پشتیبانی میکند. همچنین، آن از رزولوشن و نرخ فریم پویا برای درک ویدیو بهینهسازی شده است و کارایی کدگذار بصری آن نیز افزایش یافته است."
|
||||
},
|
||||
"Pro/THUDM/GLM-4.1V-9B-Thinking": {
|
||||
"description": "GLM-4.1V-9B-Thinking یک مدل زبان تصویری متنباز (VLM) است که بهطور مشترک توسط Zhizhu AI و آزمایشگاه KEG دانشگاه تسینگهوا منتشر شده است و بهطور خاص برای پردازش وظایف شناختی چندرسانهای پیچیده طراحی شده است. این مدل بر اساس مدل پایه GLM-4-9B-0414 ساخته شده و با معرفی مکانیزم استدلال «زنجیره تفکر» (Chain-of-Thought) و استفاده از استراتژی یادگیری تقویتی، بهطور قابل توجهی توانایی استدلال چندرسانهای و پایداری آن را بهبود بخشیده است."
|
||||
},
|
||||
"Pro/THUDM/glm-4-9b-chat": {
|
||||
"description": "GLM-4-9B-Chat نسخه متن باز از مدلهای پیشآموزش شده سری GLM-4 است که توسط AI Zhizhu ارائه شده است. این مدل در زمینههای معنایی، ریاضی، استدلال، کد و دانش عملکرد عالی دارد. علاوه بر پشتیبانی از گفتگوی چند دور، GLM-4-9B-Chat همچنین دارای قابلیتهای پیشرفتهای مانند مرور وب، اجرای کد، فراخوانی ابزارهای سفارشی (Function Call) و استدلال متن طولانی است. این مدل از 26 زبان پشتیبانی میکند، از جمله چینی، انگلیسی، ژاپنی، کرهای و آلمانی. در چندین آزمون معیار، GLM-4-9B-Chat عملکرد عالی نشان داده است، مانند AlignBench-v2، MT-Bench، MMLU و C-Eval. این مدل از حداکثر طول زمینه 128K پشتیبانی میکند و برای تحقیقات علمی و کاربردهای تجاری مناسب است."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1": {
|
||||
"description": "DeepSeek-R1 یک مدل استنتاجی مبتنی بر یادگیری تقویتی (RL) است که مشکلات تکرار و خوانایی را در مدل حل میکند. قبل از RL، DeepSeek-R1 دادههای شروع سرد را معرفی کرده و عملکرد استنتاج را بهینهسازی کرده است. این مدل در وظایف ریاضی، کد و استنتاج با OpenAI-o1 عملکرد مشابهی دارد و از طریق روشهای آموزشی به دقت طراحی شده، عملکرد کلی را بهبود میبخشد."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1-0120": {
|
||||
"description": "DeepSeek-R1 مدلی استدلالی مبتنی بر یادگیری تقویتی (RL) که مشکلات تکراری بودن و خوانایی مدل را حل کرده است. پیش از RL، DeepSeek-R1 دادههای شروع سرد را معرفی کرد تا عملکرد استدلال را بهبود بخشد. این مدل در ریاضیات، کد نویسی و وظایف استدلال عملکردی مشابه OpenAI-o1 دارد و با روشهای آموزشی دقیق، اثر کلی را ارتقاء داده است."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B": {
|
||||
"description": "DeepSeek-R1-Distill-Qwen-7B مدلی است که بر اساس Qwen2.5-Math-7B از طریق دستیابی به دانش (Knowledge Distillation) ساخته شده است. این مدل با استفاده از 800,000 نمونه انتخابی تولید شده توسط DeepSeek-R1 آموزش داده شده و توانایی استنتاج ممتازی نشان میدهد. این مدل در چندین تست استاندارد عملکرد خوبی داشته است، از جمله دقت 92.8٪ در MATH-500، نرخ موفقیت 55.5٪ در AIME 2024 و نمره 1189 در CodeForces، که نشاندهنده تواناییهای قوی ریاضی و برنامهنویسی برای یک مدل با حجم 7B است."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-V3": {
|
||||
"description": "DeepSeek-V3 یک مدل زبان با 671 میلیارد پارامتر است که از معماری متخصصان ترکیبی (MoE) و توجه چندسر (MLA) استفاده میکند و با استراتژی تعادل بار بدون ضرر کمکی بهینهسازی کارایی استنتاج و آموزش را انجام میدهد. این مدل با پیشآموزش بر روی 14.8 تریلیون توکن با کیفیت بالا و انجام تنظیم دقیق نظارتی و یادگیری تقویتی، در عملکرد از سایر مدلهای متنباز پیشی میگیرد و به مدلهای بسته پیشرو نزدیک میشود."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-V3-1226": {
|
||||
"description": "DeepSeek-V3 یک مدل زبانی با ۶۷۱۰ میلیارد پارامتر و از نوع متخصص مختلط (MoE) است که از توجه چندسر (MLA) و معماری DeepSeekMoE استفاده میکند و با ترکیب استراتژی تعادل بار بدون ضرر کمکی، کارایی استنتاج و آموزش را بهینه میسازد. با پیشآموزش بر روی ۱۴.۸ تریلیون توکن با کیفیت بالا و انجام تنظیم دقیق نظارتی و یادگیری تقویتی، DeepSeek-V3 در عملکرد از سایر مدلهای متنباز پیشی میگیرد و به مدلهای بسته پیشرو نزدیک میشود."
|
||||
},
|
||||
"QwQ-32B-Preview": {
|
||||
"description": "QwQ-32B-Preview یک مدل پردازش زبان طبیعی نوآورانه است که قادر به پردازش کارآمد مکالمات پیچیده و درک زمینه است."
|
||||
},
|
||||
@@ -404,6 +380,9 @@
|
||||
"THUDM/GLM-4-9B-0414": {
|
||||
"description": "GLM-4-9B-0414 یک مدل کوچک از سری GLM است که دارای 90 میلیارد پارامتر است. این مدل ویژگیهای فنی سری GLM-4-32B را به ارث میبرد، اما گزینههای استقرار سبکتری را ارائه میدهد. با وجود اندازه کوچک، GLM-4-9B-0414 در تولید کد، طراحی وب، تولید گرافیک SVG و نوشتن مبتنی بر جستجو عملکرد فوقالعادهای دارد."
|
||||
},
|
||||
"THUDM/GLM-4.1V-9B-Thinking": {
|
||||
"description": "GLM-4.1V-9B-Thinking یک مدل زبان تصویری متنباز (VLM) است که بهطور مشترک توسط Zhizhu AI و آزمایشگاه KEG دانشگاه تسینگهوا منتشر شده است و بهطور خاص برای پردازش وظایف شناختی چندرسانهای پیچیده طراحی شده است. این مدل بر اساس مدل پایه GLM-4-9B-0414 ساخته شده و با معرفی مکانیزم استدلال «زنجیره تفکر» (Chain-of-Thought) و استفاده از استراتژی یادگیری تقویتی، بهطور قابل توجهی توانایی استدلال چندرسانهای و پایداری آن را بهبود بخشیده است."
|
||||
},
|
||||
"THUDM/GLM-Z1-32B-0414": {
|
||||
"description": "GLM-Z1-32B-0414 یک مدل استدلال با توانایی تفکر عمیق است. این مدل بر اساس GLM-4-32B-0414 از طریق راهاندازی سرد و یادگیری تقویتی توسعه یافته و در وظایف ریاضی، کدنویسی و منطقی آموزش بیشتری دیده است. نسبت به مدل پایه، GLM-Z1-32B-0414 تواناییهای ریاضی و حل مسائل پیچیده را بهطور قابل توجهی افزایش داده است."
|
||||
},
|
||||
@@ -560,6 +539,9 @@
|
||||
"anthropic/claude-sonnet-4": {
|
||||
"description": "Claude Sonnet 4 میتواند پاسخهای تقریباً فوری یا تفکر گام به گام طولانیمدت تولید کند که کاربران میتوانند این فرآیندها را به وضوح مشاهده کنند. کاربران API همچنین میتوانند زمان تفکر مدل را به دقت کنترل کنند."
|
||||
},
|
||||
"ascend-tribe/pangu-pro-moe": {
|
||||
"description": "Pangu-Pro-MoE 72B-A16B یک مدل زبان بزرگ پراکنده با 72 میلیارد پارامتر و 16 میلیارد پارامتر فعال است که بر اساس معماری متخصصان ترکیبی گروهبندی شده (MoGE) ساخته شده است. در مرحله انتخاب متخصص، متخصصان به گروههایی تقسیم میشوند و توکنها در هر گروه به تعداد مساوی متخصصان فعال میشوند تا تعادل بار متخصصان حفظ شود، که به طور قابل توجهی کارایی استقرار مدل را در پلتفرم Ascend افزایش میدهد."
|
||||
},
|
||||
"aya": {
|
||||
"description": "Aya 23 یک مدل چندزبانه است که توسط Cohere ارائه شده و از 23 زبان پشتیبانی میکند و برای برنامههای چندزبانه تسهیلات فراهم میآورد."
|
||||
},
|
||||
@@ -569,6 +551,9 @@
|
||||
"baichuan/baichuan2-13b-chat": {
|
||||
"description": "Baichuan-13B یک مدل زبان بزرگ متن باز و قابل تجاری با 130 میلیارد پارامتر است که در آزمونهای معتبر چینی و انگلیسی بهترین عملکرد را در اندازه مشابه به دست آورده است."
|
||||
},
|
||||
"baidu/ERNIE-4.5-300B-A47B": {
|
||||
"description": "ERNIE-4.5-300B-A47B یک مدل زبان بزرگ مبتنی بر معماری متخصصان ترکیبی (MoE) است که توسط شرکت بایدو توسعه یافته است. این مدل دارای 300 میلیارد پارامتر کل است، اما در زمان استنتاج تنها 47 میلیارد پارامتر برای هر توکن فعال میشود، که ضمن حفظ عملکرد قدرتمند، کارایی محاسباتی را نیز تضمین میکند. به عنوان یکی از مدلهای اصلی سری ERNIE 4.5، این مدل در وظایف درک متن، تولید، استدلال و برنامهنویسی عملکرد برجستهای دارد. این مدل از یک روش پیشآموزش نوآورانه چندرسانهای ناهمگن MoE استفاده میکند که با آموزش مشترک متن و مدیا تصویری، توانایی کلی مدل را بهبود میبخشد، بهویژه در زمینه پیروی از دستورالعملها و حافظه دانش جهانی."
|
||||
},
|
||||
"c4ai-aya-expanse-32b": {
|
||||
"description": "Aya Expanse یک مدل چندزبانه با عملکرد بالا و 32B است که با هدف به چالش کشیدن عملکرد مدلهای تکزبانه از طریق بهینهسازی دستور، آربیتراژ دادهها، آموزش ترجیحات و نوآوری در ادغام مدلها طراحی شده است. این مدل از 23 زبان پشتیبانی میکند."
|
||||
},
|
||||
@@ -914,17 +899,53 @@
|
||||
"doubao-1.5-thinking-pro": {
|
||||
"description": "مدل تفکر عمیق جدید Doubao-1.5، در زمینههای تخصصی مانند ریاضیات، برنامهنویسی، استدلال علمی و همچنین در وظایف عمومی مانند نوشتن خلاقانه عملکرد برجستهای دارد و در معیارهای معتبر مانند AIME 2024، Codeforces و GPQA به سطح اول صنعت نزدیک یا در آن قرار دارد. از پنجره زمینه 128k و خروجی 16k پشتیبانی میکند."
|
||||
},
|
||||
"doubao-1.5-thinking-pro-m": {
|
||||
"description": "مدل تفکر عمیق جدید Doubao-1.5 (نسخه m دارای قابلیت استدلال چندرسانهای بومی) است که در حوزههای تخصصی مانند ریاضیات، برنامهنویسی، استدلال علمی و همچنین وظایف عمومی مانند نوشتن خلاقانه عملکرد برجستهای دارد و در معیارهای معتبر AIME 2024، Codeforces، GPQA و غیره به سطح اول صنعت نزدیک یا در آن قرار دارد. از پنجره متنی 128k و خروجی 16k پشتیبانی میکند."
|
||||
},
|
||||
"doubao-1.5-thinking-vision-pro": {
|
||||
"description": "مدل جدید تفکر عمیق بصری با تواناییهای قویتر در درک و استدلال چندرسانهای عمومی، که در 37 مورد از 59 معیار ارزیابی عمومی به عملکرد برتر (SOTA) دست یافته است."
|
||||
},
|
||||
"doubao-1.5-ui-tars": {
|
||||
"description": "Doubao-1.5-UI-TARS یک مدل عامل بومی برای تعامل با رابطهای گرافیکی کاربری (GUI) است. با تواناییهای انسانی مانند ادراک، استدلال و اقدام، تعامل بیوقفه با GUI را فراهم میکند."
|
||||
},
|
||||
"doubao-1.5-vision-lite": {
|
||||
"description": "Doubao-1.5-vision-lite مدل بزرگ چندرسانهای بهروز شده است که از شناسایی تصاویر با هر وضوح و نسبت ابعاد بسیار طولانی پشتیبانی میکند و تواناییهای استدلال بصری، شناسایی مستندات، درک اطلاعات جزئی و پیروی از دستورات را تقویت میکند. از پنجره متن 128k و حداکثر طول خروجی 16k توکن پشتیبانی میکند."
|
||||
},
|
||||
"doubao-1.5-vision-pro": {
|
||||
"description": "مدل چندرسانهای بزرگ Doubao-1.5-vision-pro بهروزرسانی شده که از شناسایی تصاویر با هر وضوح و نسبت ابعاد بسیار طولانی پشتیبانی میکند و تواناییهای استدلال بصری، شناسایی اسناد، درک جزئیات و پیروی از دستورات را تقویت میکند."
|
||||
},
|
||||
"doubao-1.5-vision-pro-32k": {
|
||||
"description": "مدل چندرسانهای بزرگ Doubao-1.5-vision-pro بهروزرسانی شده که از شناسایی تصاویر با هر وضوح و نسبت ابعاد بسیار طولانی پشتیبانی میکند و تواناییهای استدلال بصری، شناسایی اسناد، درک جزئیات و پیروی از دستورات را تقویت میکند."
|
||||
},
|
||||
"doubao-lite-128k": {
|
||||
"description": "دارای سرعت پاسخگویی بینظیر و نسبت قیمت به کارایی بهتر است و گزینههای انعطافپذیرتری را برای سناریوهای مختلف مشتریان ارائه میدهد. از پنجره متنی 128k برای استدلال و تنظیم دقیق پشتیبانی میکند."
|
||||
},
|
||||
"doubao-lite-32k": {
|
||||
"description": "دارای سرعت پاسخگویی بینظیر و نسبت قیمت به کارایی بهتر است و گزینههای انعطافپذیرتری را برای سناریوهای مختلف مشتریان ارائه میدهد. از پنجره متنی 32k برای استدلال و تنظیم دقیق پشتیبانی میکند."
|
||||
},
|
||||
"doubao-lite-4k": {
|
||||
"description": "دارای سرعت پاسخگویی بینظیر و نسبت قیمت به کارایی بهتر است و گزینههای انعطافپذیرتری را برای سناریوهای مختلف مشتریان ارائه میدهد. از پنجره متنی 4k برای استدلال و تنظیم دقیق پشتیبانی میکند."
|
||||
},
|
||||
"doubao-pro-256k": {
|
||||
"description": "مدل اصلی با بهترین عملکرد، مناسب برای انجام وظایف پیچیده است و در زمینههایی مانند پاسخ به سوالات مرجع، خلاصهسازی، خلق محتوا، دستهبندی متن و نقشآفرینی عملکرد بسیار خوبی دارد. از پنجره متنی 256k برای استدلال و تنظیم دقیق پشتیبانی میکند."
|
||||
},
|
||||
"doubao-pro-32k": {
|
||||
"description": "مدل اصلی با بهترین عملکرد، مناسب برای انجام وظایف پیچیده است و در زمینههایی مانند پاسخ به سوالات مرجع، خلاصهسازی، خلق محتوا، دستهبندی متن و نقشآفرینی عملکرد بسیار خوبی دارد. از پنجره متنی 32k برای استدلال و تنظیم دقیق پشتیبانی میکند."
|
||||
},
|
||||
"doubao-seed-1.6": {
|
||||
"description": "مدل تفکر عمیق چندرسانهای جدید Doubao-Seed-1.6 که از سه حالت تفکر auto/thinking/non-thinking پشتیبانی میکند. در حالت non-thinking، عملکرد مدل نسبت به Doubao-1.5-pro/250115 بهطور قابل توجهی بهبود یافته است. از پنجره متنی ۲۵۶ هزار توکنی پشتیبانی میکند و طول خروجی تا ۱۶ هزار توکن قابل افزایش است."
|
||||
"description": "مدل تفکر عمیق چندرسانهای جدید Doubao-Seed-1.6 که از سه حالت تفکر auto/thinking/non-thinking پشتیبانی میکند. در حالت non-thinking، عملکرد مدل نسبت به Doubao-1.5-pro/250115 بهطور قابل توجهی بهبود یافته است. از پنجره متنی ۲۵۶ هزار توکنی پشتیبانی میکند و طول خروجی تا ۱۶ هزار توکن را امکانپذیر میسازد."
|
||||
},
|
||||
"doubao-seed-1.6-flash": {
|
||||
"description": "مدل تفکر عمیق چندرسانهای Doubao-Seed-1.6-flash با سرعت استنتاج بسیار بالا، TPOT تنها ۱۰ میلیثانیه است؛ همچنین از درک متن و تصویر پشتیبانی میکند، توانایی درک متنی آن از نسل قبلی lite بهتر است و درک تصویری آن با مدلهای pro رقبا برابری میکند. از پنجره متنی ۲۵۶ هزار توکنی و طول خروجی تا ۱۶ هزار توکن پشتیبانی میکند."
|
||||
"description": "مدل تفکر عمیق چندرسانهای Doubao-Seed-1.6-flash با سرعت استنتاج بسیار بالا، TPOT تنها ۱۰ میلیثانیه است؛ همچنین از درک متن و تصویر پشتیبانی میکند، توانایی درک متنی آن از نسل قبلی lite بهتر است و درک تصویری آن با مدلهای pro رقبا برابری میکند. از پنجره متنی ۲۵۶ هزار توکنی پشتیبانی میکند و طول خروجی تا ۱۶ هزار توکن را امکانپذیر میسازد."
|
||||
},
|
||||
"doubao-seed-1.6-thinking": {
|
||||
"description": "مدل Doubao-Seed-1.6-thinking با توانایی تفکر بهطور قابل توجهی تقویت شده است، نسبت به Doubao-1.5-thinking-pro در مهارتهای پایهای مانند برنامهنویسی، ریاضیات و استدلال منطقی پیشرفت داشته و از درک تصویری پشتیبانی میکند. از پنجره متنی ۲۵۶ هزار توکنی و طول خروجی تا ۱۶ هزار توکن پشتیبانی میکند."
|
||||
"description": "مدل Doubao-Seed-1.6-thinking با توانایی تفکر بهطور قابل توجهی تقویت شده است، نسبت به Doubao-1.5-thinking-pro در مهارتهای پایهای مانند برنامهنویسی، ریاضیات و استدلال منطقی پیشرفت داشته و از درک تصویری پشتیبانی میکند. از پنجره متنی ۲۵۶ هزار توکنی پشتیبانی میکند و طول خروجی تا ۱۶ هزار توکن را امکانپذیر میسازد."
|
||||
},
|
||||
"doubao-vision-lite-32k": {
|
||||
"description": "مدل Doubao-vision یک مدل چندرسانهای بزرگ است که توسط Doubao ارائه شده و دارای تواناییهای قوی در درک و استدلال تصاویر و همچنین درک دقیق دستورات است. این مدل در استخراج اطلاعات متنی از تصاویر و وظایف استدلال مبتنی بر تصویر عملکرد قدرتمندی نشان داده و میتواند در وظایف پیچیدهتر و گستردهتر پرسش و پاسخ بصری به کار رود."
|
||||
},
|
||||
"doubao-vision-pro-32k": {
|
||||
"description": "مدل Doubao-vision یک مدل چندرسانهای بزرگ است که توسط Doubao ارائه شده و دارای تواناییهای قوی در درک و استدلال تصاویر و همچنین درک دقیق دستورات است. این مدل در استخراج اطلاعات متنی از تصاویر و وظایف استدلال مبتنی بر تصویر عملکرد قدرتمندی نشان داده و میتواند در وظایف پیچیدهتر و گستردهتر پرسش و پاسخ بصری به کار رود."
|
||||
},
|
||||
"emohaa": {
|
||||
"description": "Emohaa یک مدل روانشناختی است که دارای توانایی مشاوره حرفهای بوده و به کاربران در درک مسائل احساسی کمک میکند."
|
||||
@@ -1082,9 +1103,6 @@
|
||||
"gemini-2.5-pro": {
|
||||
"description": "Gemini 2.5 Pro پیشرفتهترین مدل تفکر گوگل است که قادر به استنتاج مسائل پیچیده در حوزه کد، ریاضیات و STEM بوده و با استفاده از زمینه طولانی، تحلیل مجموعه دادهها، کدها و مستندات بزرگ را انجام میدهد."
|
||||
},
|
||||
"gemini-2.5-pro-exp-03-25": {
|
||||
"description": "Gemini 2.5 Pro Experimental پیشرفتهترین مدل تفکر گوگل است که قادر به استدلال در مورد مسائل پیچیده در زمینههای کد، ریاضیات و STEM میباشد و همچنین میتواند با استفاده از زمینههای طولانی، مجموعههای داده بزرگ، کتابخانههای کد و مستندات را تحلیل کند."
|
||||
},
|
||||
"gemini-2.5-pro-preview-03-25": {
|
||||
"description": "پیشنمایش Gemini 2.5 Pro مدل پیشرفته تفکر گوگل است که قادر به استدلال در مورد کد، ریاضیات و مسائل پیچیده در زمینه STEM میباشد و همچنین میتواند با استفاده از تحلیل زمینهای طولانی، مجموعههای داده بزرگ، کتابخانههای کد و مستندات را بررسی کند."
|
||||
},
|
||||
@@ -1151,6 +1169,12 @@
|
||||
"glm-4-plus": {
|
||||
"description": "GLM-4-Plus به عنوان پرچمدار هوشمند پیشرفته، دارای توانایی پردازش متون طولانی و وظایف پیچیده است و عملکرد آن به طور کامل بهبود یافته است."
|
||||
},
|
||||
"glm-4.1v-thinking-flash": {
|
||||
"description": "سری مدلهای GLM-4.1V-Thinking قویترین مدلهای زبان تصویری (VLM) در سطح 10 میلیارد پارامتر شناخته شده تا کنون هستند که وظایف زبان تصویری پیشرفته همرده SOTA را شامل میشوند، از جمله درک ویدئو، پرسش و پاسخ تصویری، حل مسائل علمی، شناسایی متن OCR، تفسیر اسناد و نمودارها، عاملهای رابط کاربری گرافیکی، کدنویسی صفحات وب فرانتاند، و گراندینگ. تواناییهای این مدلها حتی از مدل Qwen2.5-VL-72B با 8 برابر پارامتر بیشتر نیز فراتر رفته است. با استفاده از فناوری پیشرفته یادگیری تقویتی، مدل توانسته است با استدلال زنجیره تفکر دقت و غنای پاسخها را افزایش دهد و از نظر نتایج نهایی و قابلیت تبیین به طور قابل توجهی از مدلهای غیرتفکری سنتی پیشی بگیرد."
|
||||
},
|
||||
"glm-4.1v-thinking-flashx": {
|
||||
"description": "سری مدلهای GLM-4.1V-Thinking قویترین مدلهای زبان تصویری (VLM) در سطح 10 میلیارد پارامتر شناخته شده تا کنون هستند که وظایف زبان تصویری پیشرفته همرده SOTA را شامل میشوند، از جمله درک ویدئو، پرسش و پاسخ تصویری، حل مسائل علمی، شناسایی متن OCR، تفسیر اسناد و نمودارها، عاملهای رابط کاربری گرافیکی، کدنویسی صفحات وب فرانتاند، و گراندینگ. تواناییهای این مدلها حتی از مدل Qwen2.5-VL-72B با 8 برابر پارامتر بیشتر نیز فراتر رفته است. با استفاده از فناوری پیشرفته یادگیری تقویتی، مدل توانسته است با استدلال زنجیره تفکر دقت و غنای پاسخها را افزایش دهد و از نظر نتایج نهایی و قابلیت تبیین به طور قابل توجهی از مدلهای غیرتفکری سنتی پیشی بگیرد."
|
||||
},
|
||||
"glm-4v": {
|
||||
"description": "GLM-4V قابلیتهای قدرتمندی در درک و استدلال تصویری ارائه میدهد و از وظایف مختلف بصری پشتیبانی میکند."
|
||||
},
|
||||
@@ -1172,6 +1196,9 @@
|
||||
"glm-z1-flash": {
|
||||
"description": "سری GLM-Z1 دارای تواناییهای پیچیده استدلال قوی است و در زمینههای استدلال منطقی، ریاضی و برنامهنویسی عملکرد فوقالعادهای دارد. حداکثر طول متن زمینهای 32K است."
|
||||
},
|
||||
"glm-z1-flashx": {
|
||||
"description": "سرعت بالا و قیمت پایین: نسخه تقویتشده Flash با سرعت استنتاج بسیار سریعتر و تضمین همزمانی بالاتر."
|
||||
},
|
||||
"glm-zero-preview": {
|
||||
"description": "GLM-Zero-Preview دارای تواناییهای پیچیده استدلال است و در زمینههای استدلال منطقی، ریاضیات، برنامهنویسی و غیره عملکرد عالی دارد."
|
||||
},
|
||||
@@ -1223,6 +1250,9 @@
|
||||
"google/gemma-2b-it": {
|
||||
"description": "Gemma Instruct (2B) توانایی پردازش دستورات پایه را فراهم میکند و برای برنامههای سبک مناسب است."
|
||||
},
|
||||
"google/gemma-3-1b-it": {
|
||||
"description": "Gemma 3 1B یک مدل زبان متنباز از گوگل است که استانداردهای جدیدی در کارایی و عملکرد ایجاد کرده است."
|
||||
},
|
||||
"google/gemma-3-27b-it": {
|
||||
"description": "Gemma 3 27B یک مدل زبان متن باز از گوگل است که استانداردهای جدیدی را در زمینه کارایی و عملکرد تعیین کرده است."
|
||||
},
|
||||
@@ -1313,6 +1343,9 @@
|
||||
"gpt-4o-mini-search-preview": {
|
||||
"description": "نسخه پیشنمایش جستجوی GPT-4o mini مدلی است که به طور خاص برای درک و اجرای پرسشهای جستجوی وب آموزش دیده است و از API تکمیل چت استفاده میکند. علاوه بر هزینه توکنها، هر پرسش جستجوی وب بر اساس هر بار فراخوانی ابزار هزینه دریافت میکند."
|
||||
},
|
||||
"gpt-4o-mini-transcribe": {
|
||||
"description": "GPT-4o Mini Transcribe یک مدل تبدیل گفتار به متن است که از GPT-4o برای رونویسی صوت استفاده میکند. نسبت به مدل اصلی Whisper، نرخ خطای کلمات را کاهش داده و دقت و شناسایی زبان را بهبود بخشیده است. از آن برای دریافت رونویسی دقیقتر استفاده کنید."
|
||||
},
|
||||
"gpt-4o-mini-tts": {
|
||||
"description": "GPT-4o mini TTS یک مدل تبدیل متن به گفتار است که بر اساس GPT-4o mini ساخته شده است و با قیمت پایین تری از GPT-4o mini ارائه میدهد."
|
||||
},
|
||||
@@ -1322,12 +1355,15 @@
|
||||
"gpt-4o-realtime-preview-2024-10-01": {
|
||||
"description": "نسخه زنده GPT-4o، پشتیبانی از ورودی و خروجی صوتی و متنی به صورت زنده."
|
||||
},
|
||||
"gpt-4o-realtime-preview-2024-12-17": {
|
||||
"description": "نسخه زنده GPT-4o، پشتیبانی از ورودی و خروجی صوتی و متنی به صورت زنده."
|
||||
"gpt-4o-realtime-preview-2025-06-03": {
|
||||
"description": "نسخه بلادرنگ GPT-4o که از ورودی و خروجی همزمان صوت و متن پشتیبانی میکند."
|
||||
},
|
||||
"gpt-4o-search-preview": {
|
||||
"description": "نسخه پیشنمایش جستجوی GPT-4o مدلی است که به طور خاص برای درک و اجرای پرسشهای جستجوی وب آموزش دیده است و از API تکمیل چت استفاده میکند. علاوه بر هزینه توکنها، هر پرسش جستجوی وب بر اساس هر بار فراخوانی ابزار هزینه دریافت میکند."
|
||||
},
|
||||
"gpt-4o-transcribe": {
|
||||
"description": "GPT-4o Transcribe یک مدل تبدیل گفتار به متن است که از GPT-4o برای رونویسی صوت استفاده میکند. نسبت به مدل اصلی Whisper، نرخ خطای کلمات را کاهش داده و دقت و شناسایی زبان را بهبود بخشیده است. از آن برای دریافت رونویسی دقیقتر استفاده کنید."
|
||||
},
|
||||
"grok-2-1212": {
|
||||
"description": "این مدل در دقت، پیروی از دستورات و توانایی چند زبانه بهبود یافته است."
|
||||
},
|
||||
@@ -1346,9 +1382,15 @@
|
||||
"grok-3-mini-fast": {
|
||||
"description": "مدل سبکوزن که قبل از پاسخگویی تفکر میکند. سریع و هوشمند اجرا میشود، مناسب برای وظایف منطقی که نیاز به دانش عمیق حوزه ندارند و میتواند مسیر تفکر اصلی را ارائه دهد."
|
||||
},
|
||||
"grok-4": {
|
||||
"description": "جدیدترین و قدرتمندترین مدل پرچمدار ما که در پردازش زبان طبیعی، محاسبات ریاضی و استدلال عملکردی برجسته دارد — یک انتخاب همهکاره بینظیر است."
|
||||
},
|
||||
"gryphe/mythomax-l2-13b": {
|
||||
"description": "MythoMax l2 13B یک مدل زبانی است که خلاقیت و هوش را با ترکیب چندین مدل برتر به هم پیوند میدهد."
|
||||
},
|
||||
"hunyuan-a13b": {
|
||||
"description": "اولین مدل استدلال ترکیبی Hunyuan، نسخه ارتقا یافته hunyuan-standard-256K با 80 میلیارد پارامتر کل و 13 میلیارد پارامتر فعال است. حالت پیشفرض آن حالت تفکر کند است و از طریق پارامتر یا دستور میتوان بین حالتهای تفکر سریع و کند جابجا شد؛ روش جابجایی با افزودن /no_think قبل از پرسش انجام میشود. توانایی کلی نسبت به نسل قبلی بهبود یافته است، بهویژه در ریاضیات، علوم، درک متون بلند و قابلیتهای عامل."
|
||||
},
|
||||
"hunyuan-code": {
|
||||
"description": "مدل تولید کد جدید Hunyuan، که با استفاده از 200 میلیارد داده کد با کیفیت بالا آموزش داده شده است. این مدل پایه پس از شش ماه آموزش با دادههای SFT با کیفیت بالا بهروزرسانی شده است. طول پنجره متن به ۸ هزار کاراکتر افزایش یافته و در شاخصهای ارزیابی خودکار تولید کد در پنج زبان اصلی در رتبههای برتر قرار دارد. در ارزیابیهای دستی با کیفیت بالا برای ۱۰ معیار مختلف در پنج زبان اصلی، عملکرد این مدل در رده اول قرار دارد."
|
||||
},
|
||||
@@ -1400,6 +1442,9 @@
|
||||
"hunyuan-t1-vision": {
|
||||
"description": "مدل تفکر عمیق چندرسانهای Hunyuan که از زنجیره تفکر بلند بومی چندرسانهای پشتیبانی میکند، در پردازش انواع سناریوهای استدلال تصویری مهارت دارد و در مسائل علمی نسبت به مدل تفکر سریع بهبود قابل توجهی دارد."
|
||||
},
|
||||
"hunyuan-t1-vision-20250619": {
|
||||
"description": "جدیدترین مدل تفکر عمیق چندرسانهای t1-vision از Hunyuan که از زنجیره تفکر بلند چندرسانهای بومی پشتیبانی میکند و نسبت به نسخه پیشفرض نسل قبلی به طور کامل بهبود یافته است."
|
||||
},
|
||||
"hunyuan-turbo": {
|
||||
"description": "نسخه پیشنمایش مدل زبان بزرگ نسل جدید HunYuan که از ساختار مدل متخصص ترکیبی (MoE) جدید استفاده میکند. در مقایسه با hunyuan-pro، کارایی استنتاج سریعتر و عملکرد بهتری دارد."
|
||||
},
|
||||
@@ -1430,6 +1475,12 @@
|
||||
"hunyuan-turbos-role-plus": {
|
||||
"description": "جدیدترین مدل نقشآفرینی Hunyuan، مدل نقشآفرینی تنظیمشده رسمی Hunyuan است که بر اساس مدل Hunyuan و دادههای سناریوی نقشآفرینی آموزش افزایشی دیده است و در سناریوهای نقشآفرینی عملکرد پایه بهتری دارد."
|
||||
},
|
||||
"hunyuan-turbos-vision": {
|
||||
"description": "این مدل برای سناریوهای درک تصویر و متن مناسب است و بر اساس جدیدترین مدل turbos از Hunyuan ساخته شده است. این مدل پرچمدار زبان تصویری نسل جدید است که بر وظایف مرتبط با درک تصویر و متن تمرکز دارد، از جمله شناسایی موجودیتهای مبتنی بر تصویر، پرسش و پاسخ دانش، خلق متن تبلیغاتی و حل مسائل با عکسبرداری. نسبت به نسل قبلی به طور کامل بهبود یافته است."
|
||||
},
|
||||
"hunyuan-turbos-vision-20250619": {
|
||||
"description": "جدیدترین مدل پرچمدار زبان تصویری turbos-vision از Hunyuan که در وظایف مرتبط با درک تصویر و متن، از جمله شناسایی موجودیتهای مبتنی بر تصویر، پرسش و پاسخ دانش، خلق متن تبلیغاتی و حل مسائل با عکسبرداری، نسبت به نسخه پیشفرض نسل قبلی به طور کامل بهبود یافته است."
|
||||
},
|
||||
"hunyuan-vision": {
|
||||
"description": "جدیدترین مدل چندوجهی هونیوان، پشتیبانی از ورودی تصویر + متن برای تولید محتوای متنی."
|
||||
},
|
||||
@@ -1457,6 +1508,9 @@
|
||||
"jina-deepsearch-v1": {
|
||||
"description": "جستجوی عمیق ترکیبی از جستجوی اینترنتی، خواندن و استدلال است که میتواند تحقیقات جامع را انجام دهد. میتوانید آن را به عنوان یک نماینده در نظر بگیرید که وظایف تحقیق شما را میپذیرد - این نماینده جستجوی گستردهای انجام میدهد و پس از چندین بار تکرار، پاسخ را ارائه میدهد. این فرآیند شامل تحقیق مداوم، استدلال و حل مسئله از زوایای مختلف است. این با مدلهای بزرگ استاندارد که مستقیماً از دادههای پیشآموزش شده پاسخ تولید میکنند و سیستمهای RAG سنتی که به جستجوی سطحی یکباره وابستهاند، تفاوت اساسی دارد."
|
||||
},
|
||||
"kimi-k2-0711-preview": {
|
||||
"description": "kimi-k2 یک مدل پایه با معماری MoE است که دارای تواناییهای بسیار قوی در کدنویسی و عاملسازی است، با مجموع یک تریلیون پارامتر و 32 میلیارد پارامتر فعال. در تستهای معیار عملکرد در حوزههای دانش عمومی، برنامهنویسی، ریاضیات و عاملها، مدل K2 عملکردی فراتر از سایر مدلهای متنباز اصلی دارد."
|
||||
},
|
||||
"kimi-latest": {
|
||||
"description": "محصول دستیار هوشمند کیمی از جدیدترین مدل بزرگ کیمی استفاده میکند و ممکن است شامل ویژگیهای ناپایدار باشد. از درک تصویر پشتیبانی میکند و بهطور خودکار بر اساس طول متن درخواست، مدلهای 8k/32k/128k را بهعنوان مدل محاسبه انتخاب میکند."
|
||||
},
|
||||
@@ -1869,7 +1923,7 @@
|
||||
"description": "تمرکز بر استدلال پیشرفته و حل مسائل پیچیده، از جمله وظایف ریاضی و علمی. بسیار مناسب برای برنامههایی که نیاز به درک عمیق از زمینه و جریان کاری خودمختار دارند."
|
||||
},
|
||||
"o1-pro": {
|
||||
"description": "مدلهای سری o1 با آموزش تقویتی قادر به تفکر پیش از پاسخدهی و انجام وظایف استدلالی پیچیده هستند. مدل o1-pro از منابع محاسباتی بیشتری استفاده میکند تا تفکر عمیقتری داشته باشد و پاسخهای با کیفیتتری ارائه دهد."
|
||||
"description": "مدلهای سری o1 با آموزش تقویت یادگیری قادرند پیش از پاسخدهی تفکر کنند و وظایف استدلال پیچیده را انجام دهند. مدل o1-pro از منابع محاسباتی بیشتری استفاده میکند تا تفکر عمیقتری داشته باشد و پاسخهای با کیفیتتری ارائه دهد."
|
||||
},
|
||||
"o3": {
|
||||
"description": "o3 یک مدل همهکاره و قدرتمند است که در چندین حوزه عملکرد عالی دارد. این مدل استاندارد جدیدی برای وظایف ریاضی، علمی، برنامهنویسی و استدلال بصری تعیین کرده است. همچنین در نوشتن فنی و پیروی از دستورات نیز مهارت دارد. کاربران میتوانند از آن برای تحلیل متن، کد و تصاویر و حل مسائل پیچیده چند مرحلهای استفاده کنند."
|
||||
@@ -2349,7 +2403,7 @@
|
||||
"description": "مدل v0-1.5-md برای وظایف روزمره و تولید رابط کاربری (UI) مناسب است"
|
||||
},
|
||||
"whisper-1": {
|
||||
"description": "مدل شناسایی گفتار عمومی، پشتیبانی از شناسایی گفتار چند زبانه، ترجمه گفتار و شناسایی زبان."
|
||||
"description": "مدل شناسایی گفتار عمومی که از شناسایی گفتار چندزبانه، ترجمه گفتار و شناسایی زبان پشتیبانی میکند."
|
||||
},
|
||||
"wizardlm2": {
|
||||
"description": "WizardLM 2 یک مدل زبانی ارائه شده توسط هوش مصنوعی مایکروسافت است که در مکالمات پیچیده، چندزبانه، استدلال و دستیارهای هوشمند عملکرد برجستهای دارد."
|
||||
|
||||
@@ -520,6 +520,7 @@
|
||||
"hotkey": "کلیدهای میانبر",
|
||||
"llm": "مدل زبان",
|
||||
"provider": "ارائه دهنده خدمات هوش مصنوعی",
|
||||
"proxy": "پروکسی شبکه",
|
||||
"storage": "ذخیرهسازی دادهها",
|
||||
"sync": "همگامسازی ابری",
|
||||
"system-agent": "دستیار سیستم",
|
||||
|
||||
@@ -46,6 +46,9 @@
|
||||
"reasoningEffort": {
|
||||
"title": "Intensité du raisonnement"
|
||||
},
|
||||
"thinking": {
|
||||
"title": "Interrupteur de réflexion approfondie"
|
||||
},
|
||||
"title": "Fonctionnalités d'extension du modèle"
|
||||
},
|
||||
"history": {
|
||||
|
||||
@@ -1,4 +1,43 @@
|
||||
{
|
||||
"proxy": {
|
||||
"auth": "Authentification requise",
|
||||
"authDesc": "Si le serveur proxy nécessite un nom d'utilisateur et un mot de passe",
|
||||
"authSettings": "Paramètres d'authentification",
|
||||
"basicSettings": "Paramètres du proxy",
|
||||
"basicSettingsDesc": "Configurer les paramètres de connexion du serveur proxy",
|
||||
"bypass": "Adresses sans proxy",
|
||||
"connectionTest": "Test de connexion",
|
||||
"enable": "Activer le proxy",
|
||||
"enableDesc": "Une fois activé, l'accès au réseau se fera via le serveur proxy",
|
||||
"password": "Mot de passe",
|
||||
"password_placeholder": "Veuillez entrer le mot de passe",
|
||||
"port": "Port",
|
||||
"resetButton": "Réinitialiser",
|
||||
"saveButton": "Enregistrer",
|
||||
"saveFailed": "Échec de l'enregistrement : {{error}}",
|
||||
"saveSuccess": "Paramètres du proxy enregistrés avec succès",
|
||||
"server": "Adresse du serveur",
|
||||
"testButton": "Tester la connexion",
|
||||
"testDescription": "Tester la connexion avec la configuration proxy actuelle pour vérifier son bon fonctionnement",
|
||||
"testFailed": "Échec de la connexion",
|
||||
"testSuccessWithTime": "Connexion réussie, temps écoulé {{time}} ms",
|
||||
"testUrl": "Adresse de test",
|
||||
"testUrlPlaceholder": "Veuillez entrer l'URL à tester",
|
||||
"testing": "Test de la connexion en cours...",
|
||||
"type": "Type de proxy",
|
||||
"unsavedChanges": "Vous avez des modifications non enregistrées",
|
||||
"username": "Nom d'utilisateur",
|
||||
"username_placeholder": "Veuillez entrer le nom d'utilisateur",
|
||||
"validation": {
|
||||
"passwordRequired": "Le mot de passe est obligatoire lorsque l'authentification est activée",
|
||||
"portInvalid": "Le port doit être un nombre entre 1 et 65535",
|
||||
"portRequired": "Le port est obligatoire lorsque le proxy est activé",
|
||||
"serverInvalid": "Veuillez saisir une adresse de serveur valide (IP ou nom de domaine)",
|
||||
"serverRequired": "L'adresse du serveur est obligatoire lorsque le proxy est activé",
|
||||
"typeRequired": "Le type de proxy est obligatoire lorsque le proxy est activé",
|
||||
"usernameRequired": "Le nom d'utilisateur est obligatoire lorsque l'authentification est activée"
|
||||
}
|
||||
},
|
||||
"remoteServer": {
|
||||
"authError": "Échec de l'autorisation : {{error}}",
|
||||
"authPending": "Veuillez terminer l'autorisation dans le navigateur",
|
||||
|
||||
+94
-40
@@ -71,44 +71,23 @@
|
||||
"DeepSeek-V3": {
|
||||
"description": "DeepSeek-V3 est un modèle MoE développé en interne par la société DeepSeek. Les performances de DeepSeek-V3 surpassent celles d'autres modèles open source tels que Qwen2.5-72B et Llama-3.1-405B, et se mesurent à la performance des modèles fermés de pointe au monde comme GPT-4o et Claude-3.5-Sonnet."
|
||||
},
|
||||
"Doubao-1.5-thinking-pro-m": {
|
||||
"description": "Doubao-1.5 est un nouveau modèle de pensée profonde (version m avec des capacités de raisonnement multimodal natif), qui excelle dans des domaines spécialisés tels que les mathématiques, la programmation, le raisonnement scientifique et des tâches générales comme l'écriture créative, atteignant ou se rapprochant des niveaux de pointe dans plusieurs benchmarks autorisés tels que AIME 2024, Codeforces, GPQA. Prend en charge une fenêtre de contexte de 128k et une sortie de 16k."
|
||||
},
|
||||
"Doubao-1.5-thinking-vision-pro": {
|
||||
"description": "Nouveau modèle de pensée visuelle profonde, doté de capacités de compréhension et de raisonnement multimodal général plus puissantes, ayant obtenu des performances SOTA dans 37 des 59 benchmarks d'évaluation publics."
|
||||
},
|
||||
"Doubao-1.5-vision-pro": {
|
||||
"description": "Doubao-1.5-vision-pro est un modèle multimodal de nouvelle génération, prenant en charge la reconnaissance d'images à n'importe quelle résolution et rapport d'aspect extrême, améliorant les capacités de raisonnement visuel, de reconnaissance de documents, de compréhension des informations détaillées et de respect des instructions."
|
||||
},
|
||||
"Doubao-1.5-vision-pro-32k": {
|
||||
"description": "Doubao-1.5-vision-pro est un modèle multimodal de grande taille récemment mis à jour, prenant en charge la reconnaissance d'images à toute résolution et avec des rapports d'aspect extrêmes, améliorant les capacités de raisonnement visuel, de reconnaissance de documents, de compréhension des informations détaillées et de suivi des instructions."
|
||||
},
|
||||
"Doubao-lite-128k": {
|
||||
"description": "Doubao-lite présente une rapidité de réponse exceptionnelle et un excellent rapport qualité-prix, offrant des choix plus flexibles pour différents scénarios clients. Prend en charge le raisonnement et le réglage fin avec une fenêtre de contexte de 128k."
|
||||
"description": "Doubao-lite offre une vitesse de réponse exceptionnelle et un excellent rapport qualité-prix, offrant aux clients une flexibilité accrue pour différents scénarios. Prend en charge l'inférence et le fine-tuning avec une fenêtre contextuelle de 128k."
|
||||
},
|
||||
"Doubao-lite-32k": {
|
||||
"description": "Doubao-lite présente une rapidité de réponse exceptionnelle et un excellent rapport qualité-prix, offrant des choix plus flexibles pour différents scénarios clients. Prend en charge le raisonnement et le réglage fin avec une fenêtre de contexte de 32k."
|
||||
"description": "Doubao-lite offre une vitesse de réponse exceptionnelle et un excellent rapport qualité-prix, offrant aux clients une flexibilité accrue pour différents scénarios. Prend en charge l'inférence et le fine-tuning avec une fenêtre contextuelle de 32k."
|
||||
},
|
||||
"Doubao-lite-4k": {
|
||||
"description": "Doubao-lite présente une rapidité de réponse exceptionnelle et un excellent rapport qualité-prix, offrant des choix plus flexibles pour différents scénarios clients. Prend en charge le raisonnement et le réglage fin avec une fenêtre de contexte de 4k."
|
||||
"description": "Doubao-lite offre une vitesse de réponse exceptionnelle et un excellent rapport qualité-prix, offrant aux clients une flexibilité accrue pour différents scénarios. Prend en charge l'inférence et le fine-tuning avec une fenêtre contextuelle de 4k."
|
||||
},
|
||||
"Doubao-pro-128k": {
|
||||
"description": "Le modèle principal offrant les meilleures performances, adapté aux tâches complexes, avec de bons résultats dans des scénarios tels que le question-réponse, le résumé, la création, la classification de texte et le jeu de rôle. Prend en charge le raisonnement et le réglage fin avec une fenêtre de contexte de 128k."
|
||||
},
|
||||
"Doubao-pro-256k": {
|
||||
"description": "Le modèle phare avec les meilleures performances, adapté au traitement de tâches complexes, offrant de bons résultats dans des scénarios tels que les questions-réponses de référence, les résumés, la création, la classification de texte et le jeu de rôle. Prend en charge le raisonnement et le réglage fin avec une fenêtre contextuelle de 256k."
|
||||
"description": "Modèle principal le plus performant, adapté aux tâches complexes, avec d'excellents résultats dans les domaines des questions-réponses, résumés, création, classification de texte, jeu de rôle, etc. Prend en charge l'inférence et le fine-tuning avec une fenêtre contextuelle de 128k."
|
||||
},
|
||||
"Doubao-pro-32k": {
|
||||
"description": "Le modèle principal offrant les meilleures performances, adapté aux tâches complexes, avec de bons résultats dans des scénarios tels que le question-réponse, le résumé, la création, la classification de texte et le jeu de rôle. Prend en charge le raisonnement et le réglage fin avec une fenêtre de contexte de 32k."
|
||||
"description": "Modèle principal le plus performant, adapté aux tâches complexes, avec d'excellents résultats dans les domaines des questions-réponses, résumés, création, classification de texte, jeu de rôle, etc. Prend en charge l'inférence et le fine-tuning avec une fenêtre contextuelle de 32k."
|
||||
},
|
||||
"Doubao-pro-4k": {
|
||||
"description": "Le modèle principal offrant les meilleures performances, adapté aux tâches complexes, avec de bons résultats dans des scénarios tels que le question-réponse, le résumé, la création, la classification de texte et le jeu de rôle. Prend en charge le raisonnement et le réglage fin avec une fenêtre de contexte de 4k."
|
||||
},
|
||||
"Doubao-vision-lite-32k": {
|
||||
"description": "Le modèle Doubao-vision est un modèle multimodal lancé par Doubao, doté de puissantes capacités de compréhension et de raisonnement d'images, ainsi que d'une compréhension précise des instructions. Le modèle a démontré de solides performances dans l'extraction d'informations textuelles à partir d'images et dans des tâches de raisonnement basées sur des images, pouvant être appliqué à des tâches de questions-réponses visuelles plus complexes et variées."
|
||||
},
|
||||
"Doubao-vision-pro-32k": {
|
||||
"description": "Le modèle Doubao-vision est un modèle multimodal lancé par Doubao, doté de puissantes capacités de compréhension et de raisonnement d'images, ainsi que d'une compréhension précise des instructions. Le modèle a démontré de solides performances dans l'extraction d'informations textuelles à partir d'images et dans des tâches de raisonnement basées sur des images, pouvant être appliqué à des tâches de questions-réponses visuelles plus complexes et variées."
|
||||
"description": "Modèle principal le plus performant, adapté aux tâches complexes, avec d'excellents résultats dans les domaines des questions-réponses, résumés, création, classification de texte, jeu de rôle, etc. Prend en charge l'inférence et le fine-tuning avec une fenêtre contextuelle de 4k."
|
||||
},
|
||||
"ERNIE-3.5-128K": {
|
||||
"description": "Modèle de langage à grande échelle de pointe développé par Baidu, couvrant une vaste quantité de corpus en chinois et en anglais, avec de puissantes capacités générales, capable de répondre à la plupart des exigences en matière de dialogue, de questions-réponses, de création de contenu et d'applications de plugins ; prend en charge l'intégration automatique avec le plugin de recherche Baidu, garantissant la pertinence des informations de réponse."
|
||||
@@ -224,24 +203,21 @@
|
||||
"Pro/Qwen/Qwen2.5-VL-7B-Instruct": {
|
||||
"description": "Qwen2.5-VL est le nouveau membre de la série Qwen, doté de puissantes capacités de compréhension visuelle. Il peut analyser le texte, les graphiques et la mise en page dans les images, comprendre les vidéos longues et capturer des événements. Il est capable de raisonner, d'utiliser des outils, de prendre en charge le positionnement d'objets multiformats et de générer des sorties structurées. Il optimise la résolution dynamique et la fréquence d'images pour la compréhension vidéo, et améliore l'efficacité de l'encodeur visuel."
|
||||
},
|
||||
"Pro/THUDM/GLM-4.1V-9B-Thinking": {
|
||||
"description": "GLM-4.1V-9B-Thinking est un modèle de langage visuel open source (VLM) publié conjointement par Zhipu AI et le laboratoire KEG de l'Université Tsinghua, conçu pour traiter des tâches cognitives multimodales complexes. Ce modèle est basé sur le modèle de base GLM-4-9B-0414 et intègre un mécanisme de raisonnement « chaîne de pensée » (Chain-of-Thought) ainsi qu'une stratégie d'apprentissage par renforcement, améliorant significativement ses capacités de raisonnement intermodal et sa stabilité."
|
||||
},
|
||||
"Pro/THUDM/glm-4-9b-chat": {
|
||||
"description": "GLM-4-9B-Chat est la version open source de la série de modèles pré-entraînés GLM-4 lancée par Zhipu AI. Ce modèle excelle dans plusieurs domaines tels que la sémantique, les mathématiques, le raisonnement, le code et les connaissances. En plus de prendre en charge des dialogues multi-tours, GLM-4-9B-Chat dispose également de fonctionnalités avancées telles que la navigation sur le web, l'exécution de code, l'appel d'outils personnalisés (Function Call) et le raisonnement sur de longs textes. Le modèle prend en charge 26 langues, y compris le chinois, l'anglais, le japonais, le coréen et l'allemand. Dans plusieurs tests de référence, GLM-4-9B-Chat a montré d'excellentes performances, comme AlignBench-v2, MT-Bench, MMLU et C-Eval. Ce modèle prend en charge une longueur de contexte maximale de 128K, adapté à la recherche académique et aux applications commerciales."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1": {
|
||||
"description": "DeepSeek-R1 est un modèle d'inférence piloté par l'apprentissage par renforcement (RL), qui résout les problèmes de répétition et de lisibilité dans le modèle. Avant le RL, DeepSeek-R1 a introduit des données de démarrage à froid, optimisant encore les performances d'inférence. Il se compare à OpenAI-o1 dans les tâches mathématiques, de code et d'inférence, et améliore l'ensemble des performances grâce à des méthodes d'entraînement soigneusement conçues."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1-0120": {
|
||||
"description": "DeepSeek-R1 est un modèle de raisonnement piloté par apprentissage par renforcement (RL), résolvant les problèmes de répétitivité et de lisibilité dans les modèles. Avant le RL, DeepSeek-R1 a introduit des données de démarrage à froid pour optimiser davantage les performances de raisonnement. Il offre des performances comparables à OpenAI-o1 en mathématiques, code et tâches de raisonnement, avec une amélioration globale grâce à une méthode d’entraînement soigneusement conçue."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B": {
|
||||
"description": "DeepSeek-R1-Distill-Qwen-7B est un modèle obtenu par distillation de connaissances à partir de Qwen2.5-Math-7B. Ce modèle a été affiné à l'aide de 800 000 échantillons sélectionnés générés par DeepSeek-R1, démontrant d'excellentes capacités de raisonnement. Il obtient des performances remarquables dans plusieurs benchmarks, atteignant une précision de 92,8 % sur MATH-500, un taux de réussite de 55,5 % sur AIME 2024 et un score de 1189 sur CodeForces, montrant ainsi de solides compétences en mathématiques et en programmation pour un modèle de taille 7B."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-V3": {
|
||||
"description": "DeepSeek-V3 est un modèle de langage à experts mixtes (MoE) avec 671 milliards de paramètres, utilisant une attention potentielle multi-tête (MLA) et une architecture DeepSeekMoE, combinant une stratégie d'équilibrage de charge sans perte auxiliaire pour optimiser l'efficacité d'inférence et d'entraînement. Pré-entraîné sur 14,8 billions de tokens de haute qualité, et affiné par supervision et apprentissage par renforcement, DeepSeek-V3 surpasse d'autres modèles open source et se rapproche des modèles fermés de premier plan."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-V3-1226": {
|
||||
"description": "DeepSeek-V3 est un modèle de langage hybride d'experts (MoE) avec 6710 milliards de paramètres, utilisant une attention latente multi-têtes (MLA) et l'architecture DeepSeekMoE, combinée à une stratégie d'équilibrage de charge sans perte auxiliaire, optimisant l'efficacité de l'inférence et de l'entraînement. Pré-entraîné sur 14,8 trillions de tokens de haute qualité, suivi d'un ajustement supervisé et d'un apprentissage par renforcement, DeepSeek-V3 surpasse les autres modèles open source en termes de performance, se rapprochant des modèles fermés de pointe."
|
||||
},
|
||||
"QwQ-32B-Preview": {
|
||||
"description": "QwQ-32B-Preview est un modèle de traitement du langage naturel innovant, capable de gérer efficacement des tâches complexes de génération de dialogues et de compréhension contextuelle."
|
||||
},
|
||||
@@ -404,6 +380,9 @@
|
||||
"THUDM/GLM-4-9B-0414": {
|
||||
"description": "GLM-4-9B-0414 est un modèle de petite taille de la série GLM, avec 9 milliards de paramètres. Ce modèle hérite des caractéristiques techniques de la série GLM-4-32B, tout en offrant une option de déploiement plus légère. Bien que de taille réduite, GLM-4-9B-0414 excelle toujours dans des tâches telles que la génération de code, la conception de sites web, la génération de graphiques SVG et l'écriture basée sur la recherche."
|
||||
},
|
||||
"THUDM/GLM-4.1V-9B-Thinking": {
|
||||
"description": "GLM-4.1V-9B-Thinking est un modèle de langage visuel open source (VLM) publié conjointement par Zhipu AI et le laboratoire KEG de l'Université Tsinghua, conçu pour traiter des tâches cognitives multimodales complexes. Ce modèle est basé sur le modèle de base GLM-4-9B-0414 et intègre un mécanisme de raisonnement « chaîne de pensée » (Chain-of-Thought) ainsi qu'une stratégie d'apprentissage par renforcement, améliorant significativement ses capacités de raisonnement intermodal et sa stabilité."
|
||||
},
|
||||
"THUDM/GLM-Z1-32B-0414": {
|
||||
"description": "GLM-Z1-32B-0414 est un modèle de raisonnement avec des capacités de réflexion profonde. Ce modèle est basé sur GLM-4-32B-0414, développé par un démarrage à froid et un apprentissage par renforcement étendu, et a été formé davantage sur des tâches de mathématiques, de code et de logique. Par rapport au modèle de base, GLM-Z1-32B-0414 améliore considérablement les capacités mathématiques et la résolution de tâches complexes."
|
||||
},
|
||||
@@ -560,6 +539,9 @@
|
||||
"anthropic/claude-sonnet-4": {
|
||||
"description": "Claude Sonnet 4 peut générer des réponses quasi instantanées ou des réflexions prolongées étape par étape, que l'utilisateur peut suivre clairement. Les utilisateurs de l'API peuvent également contrôler précisément la durée de réflexion du modèle."
|
||||
},
|
||||
"ascend-tribe/pangu-pro-moe": {
|
||||
"description": "Pangu-Pro-MoE 72B-A16B est un grand modèle de langage sparse à 72 milliards de paramètres, avec 16 milliards de paramètres activés. Il repose sur une architecture Mixture of Experts groupée (MoGE), qui regroupe les experts lors de la sélection et contraint chaque token à activer un nombre égal d'experts dans chaque groupe, assurant ainsi un équilibre de charge entre les experts et améliorant considérablement l'efficacité de déploiement sur la plateforme Ascend."
|
||||
},
|
||||
"aya": {
|
||||
"description": "Aya 23 est un modèle multilingue lancé par Cohere, prenant en charge 23 langues, facilitant les applications linguistiques diversifiées."
|
||||
},
|
||||
@@ -569,6 +551,9 @@
|
||||
"baichuan/baichuan2-13b-chat": {
|
||||
"description": "Baichuan-13B est un modèle de langage open source et commercialisable développé par Baichuan Intelligence, contenant 13 milliards de paramètres, qui a obtenu les meilleurs résultats dans des benchmarks chinois et anglais de référence."
|
||||
},
|
||||
"baidu/ERNIE-4.5-300B-A47B": {
|
||||
"description": "ERNIE-4.5-300B-A47B est un grand modèle de langage développé par Baidu, basé sur une architecture Mixture of Experts (MoE). Avec un total de 300 milliards de paramètres, il n'active que 47 milliards de paramètres par token lors de l'inférence, garantissant ainsi une performance puissante tout en optimisant l'efficacité de calcul. En tant que modèle central de la série ERNIE 4.5, il excelle dans la compréhension, la génération, le raisonnement textuel et la programmation. Ce modèle utilise une méthode innovante de pré-entraînement multimodal hétérogène MoE, combinant entraînement sur texte et vision, ce qui améliore ses capacités globales, notamment dans le suivi des instructions et la mémoire des connaissances mondiales."
|
||||
},
|
||||
"c4ai-aya-expanse-32b": {
|
||||
"description": "Aya Expanse est un modèle multilingue haute performance de 32B, conçu pour défier les performances des modèles monolingues grâce à des innovations en matière d'optimisation par instructions, d'arbitrage de données, d'entraînement de préférences et de fusion de modèles. Il prend en charge 23 langues."
|
||||
},
|
||||
@@ -914,9 +899,39 @@
|
||||
"doubao-1.5-thinking-pro": {
|
||||
"description": "Le modèle de réflexion approfondie Doubao-1.5, entièrement nouveau, se distingue dans des domaines spécialisés tels que les mathématiques, la programmation, le raisonnement scientifique, ainsi que dans des tâches générales comme l'écriture créative. Il atteint ou se rapproche du niveau de premier plan de l'industrie sur plusieurs références de renom telles que AIME 2024, Codeforces, GPQA. Il prend en charge une fenêtre de contexte de 128k et une sortie de 16k."
|
||||
},
|
||||
"doubao-1.5-thinking-pro-m": {
|
||||
"description": "Nouveau modèle de réflexion profonde Doubao-1.5 (version m avec capacités natives d'inférence multimodale profonde), excellent dans les domaines spécialisés tels que mathématiques, programmation, raisonnement scientifique, ainsi que dans les tâches générales comme l'écriture créative. Atteint ou approche le niveau de pointe dans plusieurs benchmarks prestigieux tels que AIME 2024, Codeforces, GPQA. Prend en charge une fenêtre contextuelle de 128k et une sortie de 16k."
|
||||
},
|
||||
"doubao-1.5-thinking-vision-pro": {
|
||||
"description": "Nouveau modèle de réflexion visuelle profonde, doté d'une compréhension et d'un raisonnement multimodaux généraux renforcés, avec des performances SOTA sur 37 des 59 benchmarks publics."
|
||||
},
|
||||
"doubao-1.5-ui-tars": {
|
||||
"description": "Doubao-1.5-UI-TARS est un modèle Agent natif conçu pour l'interaction avec les interfaces graphiques (GUI). Il interagit de manière fluide avec les GUI grâce à des capacités humaines de perception, raisonnement et action."
|
||||
},
|
||||
"doubao-1.5-vision-lite": {
|
||||
"description": "Doubao-1.5-vision-lite est un modèle multimodal de nouvelle génération, prenant en charge la reconnaissance d'images à n'importe quelle résolution et rapport d'aspect extrême, améliorant les capacités de raisonnement visuel, de reconnaissance de documents, de compréhension des informations détaillées et de respect des instructions. Il prend en charge une fenêtre de contexte de 128k, avec une longueur de sortie maximale de 16k tokens."
|
||||
},
|
||||
"doubao-1.5-vision-pro": {
|
||||
"description": "Doubao-1.5-vision-pro est un modèle multimodal de nouvelle génération, prenant en charge la reconnaissance d'images à résolution arbitraire et aux rapports d'aspect extrêmes, améliorant le raisonnement visuel, la reconnaissance documentaire, la compréhension des détails et le respect des instructions."
|
||||
},
|
||||
"doubao-1.5-vision-pro-32k": {
|
||||
"description": "Doubao-1.5-vision-pro est un modèle multimodal de nouvelle génération, prenant en charge la reconnaissance d'images à résolution arbitraire et aux rapports d'aspect extrêmes, améliorant le raisonnement visuel, la reconnaissance documentaire, la compréhension des détails et le respect des instructions."
|
||||
},
|
||||
"doubao-lite-128k": {
|
||||
"description": "Offre une vitesse de réponse exceptionnelle et un excellent rapport qualité-prix, offrant aux clients une flexibilité accrue pour différents scénarios. Prend en charge l'inférence et le fine-tuning avec une fenêtre contextuelle de 128k."
|
||||
},
|
||||
"doubao-lite-32k": {
|
||||
"description": "Offre une vitesse de réponse exceptionnelle et un excellent rapport qualité-prix, offrant aux clients une flexibilité accrue pour différents scénarios. Prend en charge l'inférence et le fine-tuning avec une fenêtre contextuelle de 32k."
|
||||
},
|
||||
"doubao-lite-4k": {
|
||||
"description": "Offre une vitesse de réponse exceptionnelle et un excellent rapport qualité-prix, offrant aux clients une flexibilité accrue pour différents scénarios. Prend en charge l'inférence et le fine-tuning avec une fenêtre contextuelle de 4k."
|
||||
},
|
||||
"doubao-pro-256k": {
|
||||
"description": "Modèle principal le plus performant, adapté aux tâches complexes, avec d'excellents résultats dans les domaines des questions-réponses, résumés, création, classification de texte, jeu de rôle, etc. Prend en charge l'inférence et le fine-tuning avec une fenêtre contextuelle de 256k."
|
||||
},
|
||||
"doubao-pro-32k": {
|
||||
"description": "Modèle principal le plus performant, adapté aux tâches complexes, avec d'excellents résultats dans les domaines des questions-réponses, résumés, création, classification de texte, jeu de rôle, etc. Prend en charge l'inférence et le fine-tuning avec une fenêtre contextuelle de 32k."
|
||||
},
|
||||
"doubao-seed-1.6": {
|
||||
"description": "Doubao-Seed-1.6 est un tout nouveau modèle multimodal de réflexion profonde, supportant trois modes de pensée : auto, réflexion et non-réflexion. En mode non-réflexion, les performances du modèle sont largement améliorées par rapport à Doubao-1.5-pro/250115. Il prend en charge une fenêtre contextuelle de 256k et une longueur de sortie maximale de 16k tokens."
|
||||
},
|
||||
@@ -924,7 +939,13 @@
|
||||
"description": "Doubao-Seed-1.6-flash est un modèle multimodal de réflexion profonde à vitesse d'inférence extrême, avec un TPOT de seulement 10 ms ; il supporte à la fois la compréhension textuelle et visuelle, avec une capacité de compréhension textuelle supérieure à la génération lite précédente, et une compréhension visuelle comparable aux modèles pro des concurrents. Il prend en charge une fenêtre contextuelle de 256k et une longueur de sortie maximale de 16k tokens."
|
||||
},
|
||||
"doubao-seed-1.6-thinking": {
|
||||
"description": "Le modèle Doubao-Seed-1.6-thinking a une capacité de réflexion considérablement renforcée. Par rapport à Doubao-1.5-thinking-pro, il améliore davantage les compétences de base telles que le codage, les mathématiques et le raisonnement logique, tout en supportant la compréhension visuelle. Il prend en charge une fenêtre contextuelle de 256k et une longueur de sortie maximale de 16k tokens."
|
||||
"description": "Le modèle Doubao-Seed-1.6-thinking a une capacité de réflexion considérablement renforcée. Par rapport à Doubao-1.5-thinking-pro, il améliore davantage les compétences fondamentales telles que le codage, les mathématiques et le raisonnement logique, tout en supportant la compréhension visuelle. Il prend en charge une fenêtre contextuelle de 256k et une longueur de sortie maximale de 16k tokens."
|
||||
},
|
||||
"doubao-vision-lite-32k": {
|
||||
"description": "Le modèle Doubao-vision est un grand modèle multimodal développé par Doubao, doté de puissantes capacités de compréhension et de raisonnement d'images, ainsi que d'une compréhension précise des instructions. Il excelle dans l'extraction d'informations texte-image et les tâches de raisonnement basées sur l'image, pouvant être appliqué à des tâches de questions-réponses visuelles plus complexes et étendues."
|
||||
},
|
||||
"doubao-vision-pro-32k": {
|
||||
"description": "Le modèle Doubao-vision est un grand modèle multimodal développé par Doubao, doté de puissantes capacités de compréhension et de raisonnement d'images, ainsi que d'une compréhension précise des instructions. Il excelle dans l'extraction d'informations texte-image et les tâches de raisonnement basées sur l'image, pouvant être appliqué à des tâches de questions-réponses visuelles plus complexes et étendues."
|
||||
},
|
||||
"emohaa": {
|
||||
"description": "Emohaa est un modèle psychologique, doté de compétences de conseil professionnel, aidant les utilisateurs à comprendre les problèmes émotionnels."
|
||||
@@ -1082,9 +1103,6 @@
|
||||
"gemini-2.5-pro": {
|
||||
"description": "Gemini 2.5 Pro est le modèle de raisonnement le plus avancé de Google, capable de traiter des problèmes complexes en code, mathématiques et domaines STEM, ainsi que d'analyser de grands ensembles de données, des bases de code et des documents avec un contexte étendu."
|
||||
},
|
||||
"gemini-2.5-pro-exp-03-25": {
|
||||
"description": "Gemini 2.5 Pro Experimental est le modèle de pensée le plus avancé de Google, capable de raisonner sur des problèmes complexes en code, mathématiques et dans les domaines STEM, tout en utilisant un long contexte pour analyser de grands ensembles de données, des bibliothèques de code et des documents."
|
||||
},
|
||||
"gemini-2.5-pro-preview-03-25": {
|
||||
"description": "Gemini 2.5 Pro Preview est le modèle de pensée le plus avancé de Google, capable de raisonner sur des problèmes complexes en code, mathématiques et domaines STEM, ainsi que d'analyser de grands ensembles de données, bibliothèques de code et documents en utilisant un long contexte."
|
||||
},
|
||||
@@ -1151,6 +1169,12 @@
|
||||
"glm-4-plus": {
|
||||
"description": "GLM-4-Plus, en tant que modèle phare de haute intelligence, possède de puissantes capacités de traitement de longs textes et de tâches complexes, avec des performances globalement améliorées."
|
||||
},
|
||||
"glm-4.1v-thinking-flash": {
|
||||
"description": "La série GLM-4.1V-Thinking est actuellement le modèle visuel le plus performant connu dans la catégorie des VLM de 10 milliards de paramètres. Elle intègre les meilleures performances SOTA dans diverses tâches de langage visuel, incluant la compréhension vidéo, les questions-réponses sur images, la résolution de problèmes disciplinaires, la reconnaissance OCR, l'interprétation de documents et graphiques, les agents GUI, le codage web frontal, le grounding, etc. Ses capacités surpassent même celles du Qwen2.5-VL-72B, qui possède plus de huit fois plus de paramètres. Grâce à des techniques avancées d'apprentissage par renforcement, le modèle maîtrise le raisonnement par chaîne de pensée, améliorant la précision et la richesse des réponses, surpassant nettement les modèles traditionnels sans mécanisme de pensée en termes de résultats finaux et d'explicabilité."
|
||||
},
|
||||
"glm-4.1v-thinking-flashx": {
|
||||
"description": "La série GLM-4.1V-Thinking est actuellement le modèle visuel le plus performant connu dans la catégorie des VLM de 10 milliards de paramètres. Elle intègre les meilleures performances SOTA dans diverses tâches de langage visuel, incluant la compréhension vidéo, les questions-réponses sur images, la résolution de problèmes disciplinaires, la reconnaissance OCR, l'interprétation de documents et graphiques, les agents GUI, le codage web frontal, le grounding, etc. Ses capacités surpassent même celles du Qwen2.5-VL-72B, qui possède plus de huit fois plus de paramètres. Grâce à des techniques avancées d'apprentissage par renforcement, le modèle maîtrise le raisonnement par chaîne de pensée, améliorant la précision et la richesse des réponses, surpassant nettement les modèles traditionnels sans mécanisme de pensée en termes de résultats finaux et d'explicabilité."
|
||||
},
|
||||
"glm-4v": {
|
||||
"description": "GLM-4V offre de puissantes capacités de compréhension et de raisonnement d'image, prenant en charge diverses tâches visuelles."
|
||||
},
|
||||
@@ -1172,6 +1196,9 @@
|
||||
"glm-z1-flash": {
|
||||
"description": "La série GLM-Z1 possède de puissantes capacités de raisonnement complexe, excelling dans des domaines tels que le raisonnement logique, les mathématiques et la programmation. La longueur maximale du contexte est de 32K."
|
||||
},
|
||||
"glm-z1-flashx": {
|
||||
"description": "Haute vitesse et faible coût : version améliorée Flash, vitesse d'inférence ultra-rapide, meilleure garantie de concurrence."
|
||||
},
|
||||
"glm-zero-preview": {
|
||||
"description": "GLM-Zero-Preview possède de puissantes capacités de raisonnement complexe, se distinguant dans les domaines du raisonnement logique, des mathématiques et de la programmation."
|
||||
},
|
||||
@@ -1223,6 +1250,9 @@
|
||||
"google/gemma-2b-it": {
|
||||
"description": "Gemma Instruct (2B) offre des capacités de traitement d'instructions de base, adapté aux applications légères."
|
||||
},
|
||||
"google/gemma-3-1b-it": {
|
||||
"description": "Gemma 3 1B est un modèle de langage open source de Google, établissant de nouvelles normes en matière d'efficacité et de performance."
|
||||
},
|
||||
"google/gemma-3-27b-it": {
|
||||
"description": "Gemma 3 27B est un modèle de langage open source de Google, qui a établi de nouvelles normes en matière d'efficacité et de performance."
|
||||
},
|
||||
@@ -1313,6 +1343,9 @@
|
||||
"gpt-4o-mini-search-preview": {
|
||||
"description": "La version préliminaire GPT-4o mini Search est un modèle spécialement entraîné pour comprendre et exécuter des requêtes de recherche web, utilisant l’API Chat Completions. En plus des frais de jetons, les requêtes de recherche web sont facturées par appel d’outil."
|
||||
},
|
||||
"gpt-4o-mini-transcribe": {
|
||||
"description": "GPT-4o Mini Transcribe est un modèle de transcription audio en texte utilisant GPT-4o. Par rapport au modèle Whisper original, il améliore le taux d'erreur des mots ainsi que la reconnaissance et la précision linguistiques. Utilisez-le pour obtenir des transcriptions plus précises."
|
||||
},
|
||||
"gpt-4o-mini-tts": {
|
||||
"description": "GPT-4o mini TTS est un modèle de synthèse vocale basé sur GPT-4o mini, offrant une génération de voix de haute qualité à un coût plus faible."
|
||||
},
|
||||
@@ -1322,12 +1355,15 @@
|
||||
"gpt-4o-realtime-preview-2024-10-01": {
|
||||
"description": "Version en temps réel de GPT-4o, prenant en charge les entrées et sorties audio et textuelles en temps réel."
|
||||
},
|
||||
"gpt-4o-realtime-preview-2024-12-17": {
|
||||
"description": "Version en temps réel de GPT-4o, prenant en charge les entrées et sorties audio et textuelles en temps réel."
|
||||
"gpt-4o-realtime-preview-2025-06-03": {
|
||||
"description": "Version en temps réel de GPT-4o, prenant en charge l'entrée et la sortie audio et texte en temps réel."
|
||||
},
|
||||
"gpt-4o-search-preview": {
|
||||
"description": "La version préliminaire GPT-4o Search est un modèle spécialement entraîné pour comprendre et exécuter des requêtes de recherche web, utilisant l’API Chat Completions. En plus des frais de jetons, les requêtes de recherche web sont facturées par appel d’outil."
|
||||
},
|
||||
"gpt-4o-transcribe": {
|
||||
"description": "GPT-4o Transcribe est un modèle de transcription audio en texte utilisant GPT-4o. Par rapport au modèle Whisper original, il améliore le taux d'erreur des mots ainsi que la reconnaissance et la précision linguistiques. Utilisez-le pour obtenir des transcriptions plus précises."
|
||||
},
|
||||
"grok-2-1212": {
|
||||
"description": "Ce modèle a été amélioré en termes de précision, de respect des instructions et de capacités multilingues."
|
||||
},
|
||||
@@ -1346,9 +1382,15 @@
|
||||
"grok-3-mini-fast": {
|
||||
"description": "Modèle léger, réfléchit avant de répondre. Rapide et intelligent, adapté aux tâches logiques ne nécessitant pas de connaissances approfondies, avec accès à la trace de pensée originale."
|
||||
},
|
||||
"grok-4": {
|
||||
"description": "Notre tout dernier modèle phare, le plus puissant, excelle dans le traitement du langage naturel, le calcul mathématique et le raisonnement — un véritable champion polyvalent."
|
||||
},
|
||||
"gryphe/mythomax-l2-13b": {
|
||||
"description": "MythoMax l2 13B est un modèle linguistique combinant créativité et intelligence, intégrant plusieurs modèles de pointe."
|
||||
},
|
||||
"hunyuan-a13b": {
|
||||
"description": "Hunyuan est le premier modèle de raisonnement hybride, une version améliorée de hunyuan-standard-256K, avec un total de 80 milliards de paramètres et 13 milliards activés. Par défaut, il fonctionne en mode de réflexion lente, mais supporte le basculement entre modes de réflexion rapide et lente via paramètres ou instructions, en ajoutant / no_think avant la requête. Ses capacités globales sont améliorées par rapport à la génération précédente, notamment en mathématiques, sciences, compréhension de longs textes et capacités d'agent."
|
||||
},
|
||||
"hunyuan-code": {
|
||||
"description": "Dernier modèle de génération de code Hunyuan, formé sur un modèle de base avec 200B de données de code de haute qualité, entraîné pendant six mois avec des données SFT de haute qualité, avec une longueur de fenêtre contextuelle augmentée à 8K, se classant parmi les meilleurs sur les indicateurs d'évaluation automatique de génération de code dans cinq langages ; en première ligne des évaluations de qualité humaine sur dix aspects de tâches de code dans cinq langages."
|
||||
},
|
||||
@@ -1400,6 +1442,9 @@
|
||||
"hunyuan-t1-vision": {
|
||||
"description": "Modèle de réflexion profonde multimodal Hunyuan, supportant des chaînes de pensée natives multimodales longues, excellent dans divers scénarios d'inférence d'images, avec une amélioration globale par rapport aux modèles de pensée rapide dans les problèmes scientifiques."
|
||||
},
|
||||
"hunyuan-t1-vision-20250619": {
|
||||
"description": "La dernière version du modèle de réflexion profonde multimodale t1-vision de Hunyuan, supportant une chaîne de pensée native multimodale, avec des améliorations globales par rapport à la version par défaut précédente."
|
||||
},
|
||||
"hunyuan-turbo": {
|
||||
"description": "Version préliminaire du nouveau modèle de langage de génération Hunyuan, utilisant une nouvelle structure de modèle d'experts mixtes (MoE), offrant une efficacité d'inférence plus rapide et de meilleures performances par rapport à Hunyuan-Pro."
|
||||
},
|
||||
@@ -1430,6 +1475,12 @@
|
||||
"hunyuan-turbos-role-plus": {
|
||||
"description": "Dernière version du modèle de jeu de rôle Hunyuan, finement ajusté par l’équipe officielle Hunyuan. Ce modèle est entraîné en supplément avec un jeu de données spécifique aux scénarios de jeu de rôle, offrant de meilleures performances de base dans ces contextes."
|
||||
},
|
||||
"hunyuan-turbos-vision": {
|
||||
"description": "Ce modèle est adapté aux scénarios de compréhension image-texte. Basé sur la dernière génération turbos de Hunyuan, c'est un grand modèle phare de langage visuel, focalisé sur les tâches liées à la compréhension image-texte, incluant la reconnaissance d'entités basée sur l'image, les questions-réponses de connaissances, la création de contenu, la résolution de problèmes par photo, etc., avec des améliorations globales par rapport à la génération précédente."
|
||||
},
|
||||
"hunyuan-turbos-vision-20250619": {
|
||||
"description": "La dernière version du grand modèle phare de langage visuel turbos-vision de Hunyuan, avec des améliorations globales par rapport à la version par défaut précédente dans les tâches liées à la compréhension image-texte, incluant la reconnaissance d'entités basée sur l'image, les questions-réponses de connaissances, la création de contenu, la résolution de problèmes par photo, etc."
|
||||
},
|
||||
"hunyuan-vision": {
|
||||
"description": "Dernier modèle multimodal Hunyuan, prenant en charge l'entrée d'images et de textes pour générer du contenu textuel."
|
||||
},
|
||||
@@ -1457,6 +1508,9 @@
|
||||
"jina-deepsearch-v1": {
|
||||
"description": "La recherche approfondie combine la recherche sur le web, la lecture et le raisonnement pour mener des enquêtes complètes. Vous pouvez la considérer comme un agent qui prend en charge vos tâches de recherche - elle effectuera une recherche approfondie et itérative avant de fournir une réponse. Ce processus implique une recherche continue, un raisonnement et une résolution de problèmes sous différents angles. Cela diffère fondamentalement des grands modèles standard qui génèrent des réponses directement à partir de données pré-entraînées et des systèmes RAG traditionnels qui dépendent d'une recherche superficielle unique."
|
||||
},
|
||||
"kimi-k2-0711-preview": {
|
||||
"description": "kimi-k2 est un modèle de base à architecture MoE doté de capacités exceptionnelles en code et Agent, avec un total de 1T de paramètres et 32B de paramètres activés. Dans les tests de performance sur les principales catégories telles que le raisonnement général, la programmation, les mathématiques et les Agents, le modèle K2 surpasse les autres modèles open source majeurs."
|
||||
},
|
||||
"kimi-latest": {
|
||||
"description": "Le produit d'assistant intelligent Kimi utilise le dernier modèle Kimi, qui peut inclure des fonctionnalités encore instables. Il prend en charge la compréhension des images et choisit automatiquement le modèle de facturation 8k/32k/128k en fonction de la longueur du contexte de la demande."
|
||||
},
|
||||
@@ -2349,7 +2403,7 @@
|
||||
"description": "Le modèle v0-1.5-md convient aux tâches quotidiennes et à la génération d'interfaces utilisateur (UI)"
|
||||
},
|
||||
"whisper-1": {
|
||||
"description": "Modèle de reconnaissance vocale général, prenant en charge la reconnaissance vocale multilingue, la traduction vocale et la reconnaissance de langue."
|
||||
"description": "Modèle universel de reconnaissance vocale, prenant en charge la reconnaissance vocale multilingue, la traduction vocale et la reconnaissance de langue."
|
||||
},
|
||||
"wizardlm2": {
|
||||
"description": "WizardLM 2 est un modèle de langage proposé par Microsoft AI, particulièrement performant dans les domaines des dialogues complexes, du multilinguisme, du raisonnement et des assistants intelligents."
|
||||
|
||||
@@ -520,6 +520,7 @@
|
||||
"hotkey": "Raccourcis clavier",
|
||||
"llm": "Modèle de langue",
|
||||
"provider": "Fournisseur de services d'IA",
|
||||
"proxy": "Proxy réseau",
|
||||
"storage": "Stockage des données",
|
||||
"sync": "Synchronisation cloud",
|
||||
"system-agent": "Agent système",
|
||||
|
||||
@@ -46,6 +46,9 @@
|
||||
"reasoningEffort": {
|
||||
"title": "Intensità del ragionamento"
|
||||
},
|
||||
"thinking": {
|
||||
"title": "Interruttore di pensiero profondo"
|
||||
},
|
||||
"title": "Funzionalità di estensione del modello"
|
||||
},
|
||||
"history": {
|
||||
|
||||
@@ -1,4 +1,43 @@
|
||||
{
|
||||
"proxy": {
|
||||
"auth": "Autenticazione necessaria",
|
||||
"authDesc": "Se il server proxy richiede nome utente e password",
|
||||
"authSettings": "Impostazioni di autenticazione",
|
||||
"basicSettings": "Impostazioni proxy",
|
||||
"basicSettingsDesc": "Configura i parametri di connessione del server proxy",
|
||||
"bypass": "Indirizzi da escludere dal proxy",
|
||||
"connectionTest": "Test di connessione",
|
||||
"enable": "Abilita proxy",
|
||||
"enableDesc": "Se abilitato, l'accesso a Internet avverrà tramite il server proxy",
|
||||
"password": "Password",
|
||||
"password_placeholder": "Inserisci la password",
|
||||
"port": "Porta",
|
||||
"resetButton": "Reimposta",
|
||||
"saveButton": "Salva",
|
||||
"saveFailed": "Salvataggio fallito: {{error}}",
|
||||
"saveSuccess": "Impostazioni proxy salvate con successo",
|
||||
"server": "Indirizzo del server",
|
||||
"testButton": "Testa connessione",
|
||||
"testDescription": "Testa la connessione utilizzando la configurazione proxy corrente per verificare che funzioni correttamente",
|
||||
"testFailed": "Connessione fallita",
|
||||
"testSuccessWithTime": "Connessione testata con successo, tempo impiegato {{time}} ms",
|
||||
"testUrl": "Indirizzo di test",
|
||||
"testUrlPlaceholder": "Inserisci l'URL da testare",
|
||||
"testing": "Testando la connessione...",
|
||||
"type": "Tipo di proxy",
|
||||
"unsavedChanges": "Hai modifiche non salvate",
|
||||
"username": "Nome utente",
|
||||
"username_placeholder": "Inserisci il nome utente",
|
||||
"validation": {
|
||||
"passwordRequired": "La password è obbligatoria quando l'autenticazione è abilitata",
|
||||
"portInvalid": "La porta deve essere un numero compreso tra 1 e 65535",
|
||||
"portRequired": "La porta è obbligatoria quando il proxy è abilitato",
|
||||
"serverInvalid": "Inserisci un indirizzo server valido (IP o nome di dominio)",
|
||||
"serverRequired": "L'indirizzo del server è obbligatorio quando il proxy è abilitato",
|
||||
"typeRequired": "Il tipo di proxy è obbligatorio quando il proxy è abilitato",
|
||||
"usernameRequired": "Il nome utente è obbligatorio quando l'autenticazione è abilitata"
|
||||
}
|
||||
},
|
||||
"remoteServer": {
|
||||
"authError": "Autenticazione fallita: {{error}}",
|
||||
"authPending": "Completa l'autenticazione nel browser",
|
||||
|
||||
+93
-39
@@ -71,44 +71,23 @@
|
||||
"DeepSeek-V3": {
|
||||
"description": "DeepSeek-V3 è un modello MoE sviluppato internamente dalla DeepSeek Company. I risultati di DeepSeek-V3 in molte valutazioni superano quelli di altri modelli open source come Qwen2.5-72B e Llama-3.1-405B, e si confronta alla pari con i modelli closed source di punta a livello mondiale come GPT-4o e Claude-3.5-Sonnet."
|
||||
},
|
||||
"Doubao-1.5-thinking-pro-m": {
|
||||
"description": "Doubao-1.5 è un nuovo modello di pensiero profondo (versione m con capacità di ragionamento multimodale native), che si distingue in matematica, programmazione, ragionamento scientifico e compiti generali come la scrittura creativa, raggiungendo o avvicinandosi ai livelli di punta del settore in vari benchmark autorevoli come AIME 2024, Codeforces, GPQA. Supporta una finestra di contesto di 128k e un output di 16k."
|
||||
},
|
||||
"Doubao-1.5-thinking-vision-pro": {
|
||||
"description": "Nuovo modello di pensiero visivo profondo, con una maggiore capacità di comprensione e ragionamento multimodale generale, ottenendo prestazioni SOTA in 37 dei 59 benchmark pubblici."
|
||||
},
|
||||
"Doubao-1.5-vision-pro": {
|
||||
"description": "Doubao-1.5-vision-pro è un grande modello multimodale aggiornato, che supporta il riconoscimento di immagini a qualsiasi risoluzione e proporzioni estremamente lunghe, migliorando le capacità di ragionamento visivo, riconoscimento di documenti, comprensione delle informazioni dettagliate e rispetto delle istruzioni."
|
||||
},
|
||||
"Doubao-1.5-vision-pro-32k": {
|
||||
"description": "Doubao-1.5-vision-pro è un modello multimodale aggiornato, che supporta il riconoscimento di immagini con qualsiasi risoluzione e rapporti di aspetto estremi, migliorando le capacità di ragionamento visivo, riconoscimento di documenti, comprensione delle informazioni dettagliate e capacità di seguire istruzioni."
|
||||
},
|
||||
"Doubao-lite-128k": {
|
||||
"description": "Doubao-lite offre un'estrema velocità di risposta, un miglior rapporto qualità-prezzo e opzioni più flessibili per diversi scenari dei clienti. Supporta inferenze e fine-tuning con una finestra di contesto di 128k."
|
||||
"description": "Doubao-lite offre una velocità di risposta eccezionale e un miglior rapporto qualità-prezzo, fornendo ai clienti scelte più flessibili per diversi scenari. Supporta inferenza e fine-tuning con una finestra contestuale di 128k."
|
||||
},
|
||||
"Doubao-lite-32k": {
|
||||
"description": "Doubao-lite offre un'estrema velocità di risposta, un miglior rapporto qualità-prezzo e opzioni più flessibili per diversi scenari dei clienti. Supporta inferenze e fine-tuning con una finestra di contesto di 32k."
|
||||
"description": "Doubao-lite offre una velocità di risposta eccezionale e un miglior rapporto qualità-prezzo, fornendo ai clienti scelte più flessibili per diversi scenari. Supporta inferenza e fine-tuning con una finestra contestuale di 32k."
|
||||
},
|
||||
"Doubao-lite-4k": {
|
||||
"description": "Doubao-lite offre un'estrema velocità di risposta, un miglior rapporto qualità-prezzo e opzioni più flessibili per diversi scenari dei clienti. Supporta inferenze e fine-tuning con una finestra di contesto di 4k."
|
||||
"description": "Doubao-lite offre una velocità di risposta eccezionale e un miglior rapporto qualità-prezzo, fornendo ai clienti scelte più flessibili per diversi scenari. Supporta inferenza e fine-tuning con una finestra contestuale di 4k."
|
||||
},
|
||||
"Doubao-pro-128k": {
|
||||
"description": "Il modello principale presenta le migliori prestazioni, adatto per compiti complessi, con risultati eccellenti in scenari di domanda di riferimento, sintesi, creazione, classificazione del testo, e role-playing. Supporta inferenze e fine-tuning con una finestra di contesto di 128k."
|
||||
},
|
||||
"Doubao-pro-256k": {
|
||||
"description": "Il modello principale con le migliori prestazioni, adatto a gestire compiti complessi, con ottimi risultati in scenari di domande e risposte, riassunti, creazione, classificazione del testo e interpretazione di ruoli. Supporta il ragionamento e il fine-tuning con una finestra di contesto di 256k."
|
||||
"description": "Il modello principale con le migliori prestazioni, adatto per gestire compiti complessi, con ottimi risultati in domande di riferimento, sintesi, creazione, classificazione del testo, role-playing e altri scenari. Supporta inferenza e fine-tuning con una finestra contestuale di 128k."
|
||||
},
|
||||
"Doubao-pro-32k": {
|
||||
"description": "Il modello principale presenta le migliori prestazioni, adatto per compiti complessi, con risultati eccellenti in scenari di domanda di riferimento, sintesi, creazione, classificazione del testo, e role-playing. Supporta inferenze e fine-tuning con una finestra di contesto di 32k."
|
||||
"description": "Il modello principale con le migliori prestazioni, adatto per gestire compiti complessi, con ottimi risultati in domande di riferimento, sintesi, creazione, classificazione del testo, role-playing e altri scenari. Supporta inferenza e fine-tuning con una finestra contestuale di 32k."
|
||||
},
|
||||
"Doubao-pro-4k": {
|
||||
"description": "Il modello principale presenta le migliori prestazioni, adatto per compiti complessi, con risultati eccellenti in scenari di domanda di riferimento, sintesi, creazione, classificazione del testo, e role-playing. Supporta inferenze e fine-tuning con una finestra di contesto di 4k."
|
||||
},
|
||||
"Doubao-vision-lite-32k": {
|
||||
"description": "Il modello Doubao-vision è un modello multimodale lanciato da Doubao, dotato di potenti capacità di comprensione e ragionamento delle immagini, nonché di una precisa comprensione delle istruzioni. Il modello ha dimostrato prestazioni eccezionali nell'estrazione di informazioni testuali da immagini e in compiti di ragionamento basati su immagini, applicabile a compiti di domanda e risposta visiva più complessi e ampi."
|
||||
},
|
||||
"Doubao-vision-pro-32k": {
|
||||
"description": "Il modello Doubao-vision è un modello multimodale lanciato da Doubao, dotato di potenti capacità di comprensione e ragionamento delle immagini, nonché di una precisa comprensione delle istruzioni. Il modello ha dimostrato prestazioni eccezionali nell'estrazione di informazioni testuali da immagini e in compiti di ragionamento basati su immagini, applicabile a compiti di domanda e risposta visiva più complessi e ampi."
|
||||
"description": "Il modello principale con le migliori prestazioni, adatto per gestire compiti complessi, con ottimi risultati in domande di riferimento, sintesi, creazione, classificazione del testo, role-playing e altri scenari. Supporta inferenza e fine-tuning con una finestra contestuale di 4k."
|
||||
},
|
||||
"ERNIE-3.5-128K": {
|
||||
"description": "Modello di linguaggio di grande scala di punta sviluppato da Baidu, che copre un'enorme quantità di dati in cinese e inglese, con potenti capacità generali, in grado di soddisfare la maggior parte delle esigenze di domande e risposte, generazione creativa e scenari di applicazione dei plugin; supporta l'integrazione automatica con il plugin di ricerca di Baidu, garantendo l'aggiornamento delle informazioni nelle risposte."
|
||||
@@ -224,24 +203,21 @@
|
||||
"Pro/Qwen/Qwen2.5-VL-7B-Instruct": {
|
||||
"description": "Qwen2.5-VL è il nuovo membro della serie Qwen, dotato di potenti capacità di comprensione visiva. È in grado di analizzare il testo, i grafici e il layout all'interno delle immagini, nonché di comprendere video lunghi e catturare eventi. Può effettuare ragionamenti, manipolare strumenti, supportare la localizzazione di oggetti in diversi formati e generare output strutturati. Inoltre, è stato ottimizzato per la formazione dinamica di risoluzione e frame rate nella comprensione video, migliorando l'efficienza dell'encoder visivo."
|
||||
},
|
||||
"Pro/THUDM/GLM-4.1V-9B-Thinking": {
|
||||
"description": "GLM-4.1V-9B-Thinking è un modello di linguaggio visivo open source (VLM) rilasciato congiuntamente da Zhipu AI e dal laboratorio KEG dell'Università di Tsinghua, progettato specificamente per gestire compiti cognitivi multimodali complessi. Basato sul modello di base GLM-4-9B-0414, il modello introduce il meccanismo di ragionamento \"Catena di Pensiero\" (Chain-of-Thought) e utilizza strategie di apprendimento rinforzato, migliorando significativamente la capacità di ragionamento cross-modale e la stabilità."
|
||||
},
|
||||
"Pro/THUDM/glm-4-9b-chat": {
|
||||
"description": "GLM-4-9B-Chat è la versione open source del modello pre-addestrato GLM-4 della serie sviluppata da Zhipu AI. Questo modello ha dimostrato prestazioni eccellenti in vari aspetti, tra cui semantica, matematica, ragionamento, codice e conoscenza. Oltre a supportare conversazioni multi-turno, GLM-4-9B-Chat offre anche funzionalità avanzate come navigazione web, esecuzione di codice, chiamate a strumenti personalizzati (Function Call) e ragionamento su testi lunghi. Il modello supporta 26 lingue, tra cui cinese, inglese, giapponese, coreano e tedesco. Ha mostrato prestazioni eccellenti in vari benchmark, come AlignBench-v2, MT-Bench, MMLU e C-Eval. Questo modello supporta una lunghezza di contesto massima di 128K, rendendolo adatto per ricerche accademiche e applicazioni commerciali."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1": {
|
||||
"description": "DeepSeek-R1 è un modello di inferenza guidato dall'apprendimento per rinforzo (RL) che affronta i problemi di ripetitività e leggibilità nel modello. Prima dell'RL, DeepSeek-R1 ha introdotto dati di cold start, ottimizzando ulteriormente le prestazioni di inferenza. Si comporta in modo comparabile a OpenAI-o1 in compiti matematici, di codifica e di inferenza, e migliora l'efficacia complessiva grazie a metodi di addestramento ben progettati."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1-0120": {
|
||||
"description": "DeepSeek-R1 è un modello di ragionamento guidato da apprendimento rinforzato (RL) che risolve problemi di ripetitività e leggibilità. Prima del RL, ha introdotto dati di cold start per ottimizzare ulteriormente le prestazioni di ragionamento. Le sue prestazioni in matematica, codice e ragionamento sono comparabili a OpenAI-o1, con miglioramenti complessivi grazie a metodi di addestramento accuratamente progettati."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B": {
|
||||
"description": "DeepSeek-R1-Distill-Qwen-7B è un modello ottenuto attraverso il distillamento del knowledge da Qwen2.5-Math-7B. Questo modello è stato fine-tunato utilizzando 800.000 campioni selezionati generati da DeepSeek-R1, dimostrando un'ottima capacità di inferenza. Ha ottenuto risultati eccellenti in diversi benchmark, raggiungendo una precisione del 92,8% su MATH-500, un tasso di passaggio del 55,5% su AIME 2024 e una valutazione di 1189 su CodeForces, dimostrando una forte capacità matematica e di programmazione per un modello di 7B."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-V3": {
|
||||
"description": "DeepSeek-V3 è un modello di linguaggio con 6710 miliardi di parametri, basato su un'architettura di esperti misti (MoE) che utilizza attenzione multilivello (MLA) e la strategia di bilanciamento del carico senza perdite ausiliarie, ottimizzando l'efficienza di inferenza e addestramento. Pre-addestrato su 14,8 trilioni di token di alta qualità e successivamente affinato tramite supervisione e apprendimento per rinforzo, DeepSeek-V3 supera altri modelli open source, avvicinandosi ai modelli chiusi di punta."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-V3-1226": {
|
||||
"description": "DeepSeek-V3 è un modello linguistico ibrido esperto (MoE) con 6710 miliardi di parametri, che utilizza l'attenzione multilivello (MLA) e l'architettura DeepSeekMoE, combinando strategie di bilanciamento del carico senza perdite ausiliarie per ottimizzare l'efficienza di inferenza e addestramento. Pre-addestrato su 14,8 trilioni di token di alta qualità e successivamente affinato supervisionato e tramite apprendimento rinforzato, DeepSeek-V3 supera le prestazioni di altri modelli open source, avvicinandosi ai modelli closed source leader."
|
||||
},
|
||||
"QwQ-32B-Preview": {
|
||||
"description": "QwQ-32B-Preview è un modello di elaborazione del linguaggio naturale innovativo, in grado di gestire in modo efficiente compiti complessi di generazione di dialoghi e comprensione del contesto."
|
||||
},
|
||||
@@ -404,6 +380,9 @@
|
||||
"THUDM/GLM-4-9B-0414": {
|
||||
"description": "GLM-4-9B-0414 è un modello di piccole dimensioni della serie GLM, con 9 miliardi di parametri. Questo modello eredita le caratteristiche tecniche della serie GLM-4-32B, ma offre opzioni di distribuzione più leggere. Nonostante le dimensioni ridotte, GLM-4-9B-0414 mostra ancora capacità eccezionali in generazione di codice, progettazione di pagine web, generazione di grafica SVG e scrittura basata su ricerca."
|
||||
},
|
||||
"THUDM/GLM-4.1V-9B-Thinking": {
|
||||
"description": "GLM-4.1V-9B-Thinking è un modello di linguaggio visivo open source (VLM) rilasciato congiuntamente da Zhipu AI e dal laboratorio KEG dell'Università di Tsinghua, progettato specificamente per gestire compiti cognitivi multimodali complessi. Basato sul modello di base GLM-4-9B-0414, il modello introduce il meccanismo di ragionamento \"Catena di Pensiero\" (Chain-of-Thought) e utilizza strategie di apprendimento rinforzato, migliorando significativamente la capacità di ragionamento cross-modale e la stabilità."
|
||||
},
|
||||
"THUDM/GLM-Z1-32B-0414": {
|
||||
"description": "GLM-Z1-32B-0414 è un modello di inferenza con capacità di pensiero profondo. Questo modello è stato sviluppato sulla base di GLM-4-32B-0414 attraverso un avvio a freddo e un apprendimento rinforzato esteso, ed è stato ulteriormente addestrato in compiti di matematica, codice e logica. Rispetto al modello di base, GLM-Z1-32B-0414 ha migliorato significativamente le capacità matematiche e la capacità di risolvere compiti complessi."
|
||||
},
|
||||
@@ -560,6 +539,9 @@
|
||||
"anthropic/claude-sonnet-4": {
|
||||
"description": "Claude Sonnet 4 può generare risposte quasi istantanee o un ragionamento esteso e graduale, che gli utenti possono osservare chiaramente. Gli utenti API possono anche controllare con precisione il tempo di riflessione del modello."
|
||||
},
|
||||
"ascend-tribe/pangu-pro-moe": {
|
||||
"description": "Pangu-Pro-MoE 72B-A16B è un modello linguistico di grandi dimensioni a parametri sparsi con 72 miliardi di parametri totali e 16 miliardi di parametri attivati, basato sull'architettura Mixture of Group Experts (MoGE). Durante la fase di selezione degli esperti, gli esperti sono raggruppati e il token attiva un numero uguale di esperti all'interno di ogni gruppo, garantendo un bilanciamento del carico degli esperti e migliorando significativamente l'efficienza di distribuzione del modello sulla piattaforma Ascend."
|
||||
},
|
||||
"aya": {
|
||||
"description": "Aya 23 è un modello multilingue lanciato da Cohere, supporta 23 lingue, facilitando applicazioni linguistiche diversificate."
|
||||
},
|
||||
@@ -569,6 +551,9 @@
|
||||
"baichuan/baichuan2-13b-chat": {
|
||||
"description": "Baichuan-13B è un modello di linguaggio open source sviluppato da Baichuan Intelligence, con 13 miliardi di parametri, che ha ottenuto i migliori risultati nella sua categoria in benchmark autorevoli sia in cinese che in inglese."
|
||||
},
|
||||
"baidu/ERNIE-4.5-300B-A47B": {
|
||||
"description": "ERNIE-4.5-300B-A47B è un modello linguistico di grandi dimensioni sviluppato da Baidu basato sull'architettura Mixture of Experts (MoE). Il modello ha un totale di 300 miliardi di parametri, ma durante l'inferenza attiva solo 47 miliardi di parametri per token, garantendo così un equilibrio tra prestazioni elevate ed efficienza computazionale. Come uno dei modelli principali della serie ERNIE 4.5, eccelle in compiti di comprensione del testo, generazione, ragionamento e programmazione. Il modello utilizza un innovativo metodo di pre-addestramento multimodale eterogeneo MoE, addestrando congiuntamente testo e modalità visive, migliorando efficacemente le capacità complessive, con risultati particolarmente evidenti nell'aderenza alle istruzioni e nella memoria della conoscenza mondiale."
|
||||
},
|
||||
"c4ai-aya-expanse-32b": {
|
||||
"description": "Aya Expanse è un modello multilingue ad alte prestazioni da 32B, progettato per sfidare le prestazioni dei modelli monolingue attraverso innovazioni in ottimizzazione delle istruzioni, arbitraggio dei dati, addestramento delle preferenze e fusione dei modelli. Supporta 23 lingue."
|
||||
},
|
||||
@@ -914,9 +899,39 @@
|
||||
"doubao-1.5-thinking-pro": {
|
||||
"description": "Il modello di pensiero profondo Doubao-1.5, completamente nuovo, si distingue in ambiti professionali come matematica, programmazione e ragionamento scientifico, oltre che in compiti generali come la scrittura creativa, raggiungendo o avvicinandosi ai livelli di eccellenza del settore in numerosi benchmark autorevoli come AIME 2024, Codeforces e GPQA. Supporta una finestra di contesto di 128k e un output di 16k."
|
||||
},
|
||||
"doubao-1.5-thinking-pro-m": {
|
||||
"description": "Doubao-1.5 è un nuovo modello di pensiero profondo (versione m con capacità native di inferenza multimodale profonda), eccellente in matematica, programmazione, ragionamento scientifico e compiti generali come scrittura creativa. Raggiunge o si avvicina al livello top nel settore in benchmark autorevoli come AIME 2024, Codeforces, GPQA. Supporta una finestra contestuale di 128k e output di 16k."
|
||||
},
|
||||
"doubao-1.5-thinking-vision-pro": {
|
||||
"description": "Nuovo modello di pensiero profondo visivo con capacità multimodali generali potenziate, che ha raggiunto prestazioni SOTA in 37 su 59 benchmark pubblici."
|
||||
},
|
||||
"doubao-1.5-ui-tars": {
|
||||
"description": "Doubao-1.5-UI-TARS è un modello Agent nativo progettato per l'interazione con interfacce grafiche (GUI). Interagisce senza soluzione di continuità con la GUI attraverso capacità umanoidi di percezione, ragionamento e azione."
|
||||
},
|
||||
"doubao-1.5-vision-lite": {
|
||||
"description": "Doubao-1.5-vision-lite è un grande modello multimodale aggiornato, che supporta il riconoscimento di immagini a qualsiasi risoluzione e proporzioni estremamente lunghe, migliorando le capacità di ragionamento visivo, riconoscimento di documenti, comprensione delle informazioni dettagliate e rispetto delle istruzioni. Supporta una finestra di contesto di 128k e una lunghezza di uscita massima di 16k token."
|
||||
},
|
||||
"doubao-1.5-vision-pro": {
|
||||
"description": "Doubao-1.5-vision-pro è un modello multimodale avanzato che supporta il riconoscimento di immagini a qualsiasi risoluzione e rapporti d'aspetto estremi, migliorando il ragionamento visivo, il riconoscimento documentale, la comprensione dei dettagli e l'aderenza alle istruzioni."
|
||||
},
|
||||
"doubao-1.5-vision-pro-32k": {
|
||||
"description": "Doubao-1.5-vision-pro è un modello multimodale avanzato che supporta il riconoscimento di immagini a qualsiasi risoluzione e rapporti d'aspetto estremi, migliorando il ragionamento visivo, il riconoscimento documentale, la comprensione dei dettagli e l'aderenza alle istruzioni."
|
||||
},
|
||||
"doubao-lite-128k": {
|
||||
"description": "Offre una velocità di risposta eccezionale e un miglior rapporto qualità-prezzo, fornendo ai clienti scelte più flessibili per diversi scenari. Supporta inferenza e fine-tuning con una finestra contestuale di 128k."
|
||||
},
|
||||
"doubao-lite-32k": {
|
||||
"description": "Offre una velocità di risposta eccezionale e un miglior rapporto qualità-prezzo, fornendo ai clienti scelte più flessibili per diversi scenari. Supporta inferenza e fine-tuning con una finestra contestuale di 32k."
|
||||
},
|
||||
"doubao-lite-4k": {
|
||||
"description": "Offre una velocità di risposta eccezionale e un miglior rapporto qualità-prezzo, fornendo ai clienti scelte più flessibili per diversi scenari. Supporta inferenza e fine-tuning con una finestra contestuale di 4k."
|
||||
},
|
||||
"doubao-pro-256k": {
|
||||
"description": "Il modello principale con le migliori prestazioni, adatto per gestire compiti complessi, con ottimi risultati in domande di riferimento, sintesi, creazione, classificazione del testo, role-playing e altri scenari. Supporta inferenza e fine-tuning con una finestra contestuale di 256k."
|
||||
},
|
||||
"doubao-pro-32k": {
|
||||
"description": "Il modello principale con le migliori prestazioni, adatto per gestire compiti complessi, con ottimi risultati in domande di riferimento, sintesi, creazione, classificazione del testo, role-playing e altri scenari. Supporta inferenza e fine-tuning con una finestra contestuale di 32k."
|
||||
},
|
||||
"doubao-seed-1.6": {
|
||||
"description": "Doubao-Seed-1.6 è un nuovo modello multimodale di pensiero profondo che supporta tre modalità di pensiero: auto, thinking e non-thinking. In modalità non-thinking, le prestazioni del modello migliorano significativamente rispetto a Doubao-1.5-pro/250115. Supporta una finestra contestuale di 256k e una lunghezza massima di output di 16k token."
|
||||
},
|
||||
@@ -926,6 +941,12 @@
|
||||
"doubao-seed-1.6-thinking": {
|
||||
"description": "Il modello Doubao-Seed-1.6-thinking ha capacità di pensiero notevolmente potenziate; rispetto a Doubao-1.5-thinking-pro, migliora ulteriormente le capacità di base come coding, matematica e ragionamento logico, supportando anche la comprensione visiva. Supporta una finestra contestuale di 256k e una lunghezza massima di output di 16k token."
|
||||
},
|
||||
"doubao-vision-lite-32k": {
|
||||
"description": "Il modello Doubao-vision è un modello multimodale lanciato da Doubao, con potenti capacità di comprensione e ragionamento delle immagini e una precisa comprensione delle istruzioni. Il modello mostra prestazioni eccellenti nell'estrazione di informazioni da testo e immagini e in compiti di ragionamento basati su immagini, applicabile a compiti di domande visive più complessi e ampi."
|
||||
},
|
||||
"doubao-vision-pro-32k": {
|
||||
"description": "Il modello Doubao-vision è un modello multimodale lanciato da Doubao, con potenti capacità di comprensione e ragionamento delle immagini e una precisa comprensione delle istruzioni. Il modello mostra prestazioni eccellenti nell'estrazione di informazioni da testo e immagini e in compiti di ragionamento basati su immagini, applicabile a compiti di domande visive più complessi e ampi."
|
||||
},
|
||||
"emohaa": {
|
||||
"description": "Emohaa è un modello psicologico, con capacità di consulenza professionale, aiuta gli utenti a comprendere i problemi emotivi."
|
||||
},
|
||||
@@ -1082,9 +1103,6 @@
|
||||
"gemini-2.5-pro": {
|
||||
"description": "Gemini 2.5 Pro è il modello di pensiero più avanzato di Google, capace di ragionare su codice, matematica e problemi complessi nei campi STEM, oltre a utilizzare contesti lunghi per analizzare grandi dataset, codebase e documenti."
|
||||
},
|
||||
"gemini-2.5-pro-exp-03-25": {
|
||||
"description": "Gemini 2.5 Pro Experimental è il modello di pensiero più avanzato di Google, in grado di ragionare su problemi complessi in codice, matematica e nei campi STEM, e di analizzare grandi set di dati, codebase e documenti utilizzando contesti lunghi."
|
||||
},
|
||||
"gemini-2.5-pro-preview-03-25": {
|
||||
"description": "Gemini 2.5 Pro Preview è il modello di pensiero più avanzato di Google, in grado di ragionare su problemi complessi in codice, matematica e nei campi STEM, oltre a utilizzare analisi di lungo contesto per grandi set di dati, codici sorgente e documenti."
|
||||
},
|
||||
@@ -1151,6 +1169,12 @@
|
||||
"glm-4-plus": {
|
||||
"description": "GLM-4-Plus, come flagship ad alta intelligenza, ha potenti capacità di elaborazione di testi lunghi e compiti complessi, con prestazioni complessive migliorate."
|
||||
},
|
||||
"glm-4.1v-thinking-flash": {
|
||||
"description": "La serie GLM-4.1V-Thinking è attualmente il modello visivo più performante tra i modelli VLM di livello 10 miliardi di parametri noti, integrando le migliori prestazioni SOTA nelle attività di linguaggio visivo di pari livello, tra cui comprensione video, domande sulle immagini, risoluzione di problemi disciplinari, riconoscimento OCR, interpretazione di documenti e grafici, agent GUI, coding front-end web, grounding e altro. Le capacità in molteplici compiti superano persino il modello Qwen2.5-VL-72B con 8 volte più parametri. Grazie a tecniche avanzate di apprendimento rinforzato, il modello padroneggia il ragionamento tramite catena di pensiero per migliorare accuratezza e ricchezza delle risposte, superando significativamente i modelli tradizionali non-thinking in termini di risultati finali e interpretabilità."
|
||||
},
|
||||
"glm-4.1v-thinking-flashx": {
|
||||
"description": "La serie GLM-4.1V-Thinking è attualmente il modello visivo più performante tra i modelli VLM di livello 10 miliardi di parametri noti, integrando le migliori prestazioni SOTA nelle attività di linguaggio visivo di pari livello, tra cui comprensione video, domande sulle immagini, risoluzione di problemi disciplinari, riconoscimento OCR, interpretazione di documenti e grafici, agent GUI, coding front-end web, grounding e altro. Le capacità in molteplici compiti superano persino il modello Qwen2.5-VL-72B con 8 volte più parametri. Grazie a tecniche avanzate di apprendimento rinforzato, il modello padroneggia il ragionamento tramite catena di pensiero per migliorare accuratezza e ricchezza delle risposte, superando significativamente i modelli tradizionali non-thinking in termini di risultati finali e interpretabilità."
|
||||
},
|
||||
"glm-4v": {
|
||||
"description": "GLM-4V offre potenti capacità di comprensione e ragionamento visivo, supportando vari compiti visivi."
|
||||
},
|
||||
@@ -1172,6 +1196,9 @@
|
||||
"glm-z1-flash": {
|
||||
"description": "La serie GLM-Z1 possiede potenti capacità di ragionamento complesso, eccellendo in logica, matematica e programmazione. La lunghezza massima del contesto è di 32K."
|
||||
},
|
||||
"glm-z1-flashx": {
|
||||
"description": "Alta velocità e basso costo: versione potenziata Flash, con velocità di inferenza ultra-rapida e migliore garanzia di concorrenza."
|
||||
},
|
||||
"glm-zero-preview": {
|
||||
"description": "GLM-Zero-Preview possiede potenti capacità di ragionamento complesso, eccellendo nei campi del ragionamento logico, della matematica e della programmazione."
|
||||
},
|
||||
@@ -1223,6 +1250,9 @@
|
||||
"google/gemma-2b-it": {
|
||||
"description": "Gemma Instruct (2B) offre capacità di elaborazione di istruzioni di base, adatta per applicazioni leggere."
|
||||
},
|
||||
"google/gemma-3-1b-it": {
|
||||
"description": "Gemma 3 1B è un modello linguistico open source di Google che ha stabilito nuovi standard in termini di efficienza e prestazioni."
|
||||
},
|
||||
"google/gemma-3-27b-it": {
|
||||
"description": "Gemma 3 27B è un modello linguistico open source di Google, che ha stabilito nuovi standard in termini di efficienza e prestazioni."
|
||||
},
|
||||
@@ -1313,6 +1343,9 @@
|
||||
"gpt-4o-mini-search-preview": {
|
||||
"description": "La versione preview di GPT-4o mini per la ricerca è un modello appositamente addestrato per comprendere ed eseguire query di ricerca web, utilizzando l’API Chat Completions. Oltre ai costi per token, le query di ricerca web comportano un costo per ogni chiamata allo strumento."
|
||||
},
|
||||
"gpt-4o-mini-transcribe": {
|
||||
"description": "GPT-4o Mini Transcribe è un modello di trascrizione vocale che utilizza GPT-4o per convertire audio in testo. Rispetto al modello Whisper originale, migliora il tasso di errore delle parole e la precisione nel riconoscimento linguistico. Usalo per ottenere trascrizioni più accurate."
|
||||
},
|
||||
"gpt-4o-mini-tts": {
|
||||
"description": "GPT-4o mini TTS è un modello di sintesi vocale basato su GPT-4o mini, che offre una generazione di voce di alta qualità a un costo più basso."
|
||||
},
|
||||
@@ -1322,12 +1355,15 @@
|
||||
"gpt-4o-realtime-preview-2024-10-01": {
|
||||
"description": "Versione in tempo reale di GPT-4o, supporta input e output audio e testuali in tempo reale."
|
||||
},
|
||||
"gpt-4o-realtime-preview-2024-12-17": {
|
||||
"gpt-4o-realtime-preview-2025-06-03": {
|
||||
"description": "Versione in tempo reale di GPT-4o, supporta input e output audio e testuali in tempo reale."
|
||||
},
|
||||
"gpt-4o-search-preview": {
|
||||
"description": "La versione preview di GPT-4o per la ricerca è un modello appositamente addestrato per comprendere ed eseguire query di ricerca web, utilizzando l’API Chat Completions. Oltre ai costi per token, le query di ricerca web comportano un costo per ogni chiamata allo strumento."
|
||||
},
|
||||
"gpt-4o-transcribe": {
|
||||
"description": "GPT-4o Transcribe è un modello di trascrizione vocale che utilizza GPT-4o per convertire audio in testo. Rispetto al modello Whisper originale, migliora il tasso di errore delle parole e la precisione nel riconoscimento linguistico. Usalo per ottenere trascrizioni più accurate."
|
||||
},
|
||||
"grok-2-1212": {
|
||||
"description": "Questo modello ha migliorato l'accuratezza, il rispetto delle istruzioni e le capacità multilingue."
|
||||
},
|
||||
@@ -1346,9 +1382,15 @@
|
||||
"grok-3-mini-fast": {
|
||||
"description": "Modello leggero che riflette prima di rispondere. Veloce e intelligente, adatto a compiti logici che non richiedono conoscenze di dominio profonde, con tracciamento del processo di pensiero originale."
|
||||
},
|
||||
"grok-4": {
|
||||
"description": "Il nostro modello di punta più recente e potente, eccellente nell'elaborazione del linguaggio naturale, nel calcolo matematico e nel ragionamento — un vero campione versatile e completo."
|
||||
},
|
||||
"gryphe/mythomax-l2-13b": {
|
||||
"description": "MythoMax l2 13B è un modello linguistico che combina creatività e intelligenza, unendo diversi modelli di punta."
|
||||
},
|
||||
"hunyuan-a13b": {
|
||||
"description": "Hunyuan è il primo modello di ragionamento ibrido, versione aggiornata di hunyuan-standard-256K, con 80 miliardi di parametri totali e 13 miliardi attivati. Di default opera in modalità pensiero lento, ma supporta il passaggio tra modalità pensiero lento e veloce tramite parametri o istruzioni, con il cambio che avviene aggiungendo / no_think prima della query. Le capacità complessive sono migliorate rispetto alla generazione precedente, con miglioramenti significativi in matematica, scienze, comprensione di testi lunghi e capacità agent."
|
||||
},
|
||||
"hunyuan-code": {
|
||||
"description": "Ultimo modello di generazione di codice di Hunyuan, addestrato su un modello di base con 200B di dati di codice di alta qualità, con sei mesi di addestramento su dati SFT di alta qualità, la lunghezza della finestra di contesto è aumentata a 8K, e si posiziona tra i primi in cinque indicatori di valutazione automatica della generazione di codice; nelle valutazioni di alta qualità su dieci aspetti di codice in cinque lingue, le prestazioni sono nella prima fascia."
|
||||
},
|
||||
@@ -1400,6 +1442,9 @@
|
||||
"hunyuan-t1-vision": {
|
||||
"description": "Modello di comprensione multimodale profonda Hunyuan, supporta catene di pensiero native multimodali, eccelle in vari scenari di ragionamento visivo e migliora significativamente rispetto ai modelli di pensiero rapido nei problemi scientifici."
|
||||
},
|
||||
"hunyuan-t1-vision-20250619": {
|
||||
"description": "L'ultima versione del modello di pensiero profondo multimodale t1-vision di Hunyuan, supporta catene di pensiero native multimodali e presenta miglioramenti completi rispetto alla versione predefinita della generazione precedente."
|
||||
},
|
||||
"hunyuan-turbo": {
|
||||
"description": "Anteprima della nuova generazione di modelli di linguaggio di Hunyuan, utilizza una nuova struttura di modello ibrido di esperti (MoE), con una maggiore efficienza di inferenza e prestazioni superiori rispetto a hunyuan-pro."
|
||||
},
|
||||
@@ -1430,6 +1475,12 @@
|
||||
"hunyuan-turbos-role-plus": {
|
||||
"description": "Ultima versione del modello di role-playing di Hunyuan, finemente addestrato ufficialmente, basato sul modello Hunyuan e ulteriormente addestrato con dataset specifici per scenari di role-playing, offrendo migliori prestazioni di base in tali contesti."
|
||||
},
|
||||
"hunyuan-turbos-vision": {
|
||||
"description": "Questo modello è adatto per scenari di comprensione testo-immagine ed è basato sulla più recente versione turbos di Hunyuan, una nuova generazione di modello linguistico visivo di punta focalizzato su compiti di comprensione testo-immagine, inclusi riconoscimento di entità basato su immagini, domande di conoscenza, creazione di testi e risoluzione di problemi tramite foto, con miglioramenti completi rispetto alla generazione precedente."
|
||||
},
|
||||
"hunyuan-turbos-vision-20250619": {
|
||||
"description": "L'ultima versione del modello linguistico visivo di punta turbos-vision di Hunyuan, con miglioramenti completi rispetto alla versione predefinita della generazione precedente in compiti di comprensione testo-immagine, inclusi riconoscimento di entità basato su immagini, domande di conoscenza, creazione di testi e risoluzione di problemi tramite foto."
|
||||
},
|
||||
"hunyuan-vision": {
|
||||
"description": "Ultimo modello multimodale di Hunyuan, supporta l'input di immagini e testo per generare contenuti testuali."
|
||||
},
|
||||
@@ -1457,6 +1508,9 @@
|
||||
"jina-deepsearch-v1": {
|
||||
"description": "La ricerca approfondita combina la ricerca online, la lettura e il ragionamento, consentendo indagini complete. Puoi considerarlo come un agente che accetta il tuo compito di ricerca - eseguirà una ricerca approfondita e iterativa prima di fornire una risposta. Questo processo implica una continua ricerca, ragionamento e risoluzione dei problemi da diverse angolazioni. Questo è fondamentalmente diverso dai modelli di grandi dimensioni standard che generano risposte direttamente dai dati pre-addestrati e dai tradizionali sistemi RAG che si basano su ricerche superficiali una tantum."
|
||||
},
|
||||
"kimi-k2-0711-preview": {
|
||||
"description": "kimi-k2 è un modello base con architettura MoE dotato di potenti capacità di codice e Agent, con un totale di 1T parametri e 32B parametri attivi. Nei test di benchmark per ragionamento generale, programmazione, matematica e Agent, il modello K2 supera altri modelli open source principali."
|
||||
},
|
||||
"kimi-latest": {
|
||||
"description": "Il prodotto Kimi Smart Assistant utilizza il più recente modello Kimi, che potrebbe includere funzionalità non ancora stabili. Supporta la comprensione delle immagini e selezionerà automaticamente il modello di fatturazione 8k/32k/128k in base alla lunghezza del contesto della richiesta."
|
||||
},
|
||||
@@ -1869,7 +1923,7 @@
|
||||
"description": "o1 è il nuovo modello di inferenza di OpenAI, adatto a compiti complessi che richiedono una vasta conoscenza generale. Questo modello ha un contesto di 128K e una data di cutoff della conoscenza di ottobre 2023."
|
||||
},
|
||||
"o1-pro": {
|
||||
"description": "La serie di modelli o1 è stata addestrata con apprendimento rinforzato, in grado di riflettere prima di rispondere ed eseguire compiti di ragionamento complessi. Il modello o1-pro utilizza più risorse computazionali per un pensiero più approfondito, offrendo risposte di qualità superiore in modo costante."
|
||||
"description": "La serie di modelli o1 è stata addestrata con apprendimento rinforzato, in grado di riflettere prima di rispondere ed eseguire compiti di ragionamento complessi. Il modello o1-pro utilizza più risorse computazionali per un pensiero più approfondito, offrendo risposte di qualità superiore in modo continuo."
|
||||
},
|
||||
"o3": {
|
||||
"description": "o3 è un modello versatile e potente, che si distingue in vari campi. Stabilisce nuovi standard per compiti di matematica, scienza, programmazione e ragionamento visivo. È anche abile nella scrittura tecnica e nel seguire istruzioni. Gli utenti possono utilizzarlo per analizzare testi, codici e immagini, risolvendo problemi complessi in più passaggi."
|
||||
@@ -2349,7 +2403,7 @@
|
||||
"description": "Il modello v0-1.5-md è adatto per compiti quotidiani e generazione di interfacce utente (UI)"
|
||||
},
|
||||
"whisper-1": {
|
||||
"description": "Modello di riconoscimento vocale universale, supporta il riconoscimento vocale multilingue, la traduzione vocale e il riconoscimento linguistico."
|
||||
"description": "Modello universale di riconoscimento vocale, supporta riconoscimento vocale multilingue, traduzione vocale e identificazione della lingua."
|
||||
},
|
||||
"wizardlm2": {
|
||||
"description": "WizardLM 2 è un modello di linguaggio fornito da Microsoft AI, particolarmente efficace in dialoghi complessi, multilingue, ragionamento e assistenti intelligenti."
|
||||
|
||||
@@ -520,6 +520,7 @@
|
||||
"hotkey": "Scorciatoie",
|
||||
"llm": "Modello linguistico",
|
||||
"provider": "Fornitore di servizi AI",
|
||||
"proxy": "Proxy di rete",
|
||||
"storage": "Storage dati",
|
||||
"sync": "云端同步",
|
||||
"system-agent": "Assistente di sistema",
|
||||
|
||||
@@ -46,6 +46,9 @@
|
||||
"reasoningEffort": {
|
||||
"title": "推論の強度"
|
||||
},
|
||||
"thinking": {
|
||||
"title": "深い思考のスイッチ"
|
||||
},
|
||||
"title": "モデル拡張機能"
|
||||
},
|
||||
"history": {
|
||||
|
||||
@@ -1,4 +1,43 @@
|
||||
{
|
||||
"proxy": {
|
||||
"auth": "認証が必要",
|
||||
"authDesc": "プロキシサーバーがユーザー名とパスワードを必要とする場合",
|
||||
"authSettings": "認証設定",
|
||||
"basicSettings": "プロキシ設定",
|
||||
"basicSettingsDesc": "プロキシサーバーの接続パラメータを設定します",
|
||||
"bypass": "プロキシを使用しないアドレス",
|
||||
"connectionTest": "接続テスト",
|
||||
"enable": "プロキシを有効にする",
|
||||
"enableDesc": "有効にすると、プロキシサーバーを通じてネットワークにアクセスします",
|
||||
"password": "パスワード",
|
||||
"password_placeholder": "パスワードを入力してください",
|
||||
"port": "ポート",
|
||||
"resetButton": "リセット",
|
||||
"saveButton": "保存",
|
||||
"saveFailed": "保存に失敗しました:{{error}}",
|
||||
"saveSuccess": "プロキシ設定が正常に保存されました",
|
||||
"server": "サーバーアドレス",
|
||||
"testButton": "接続テスト",
|
||||
"testDescription": "現在のプロキシ設定を使用して接続をテストし、設定が正常に機能しているか確認します",
|
||||
"testFailed": "接続に失敗しました",
|
||||
"testSuccessWithTime": "接続テストに成功しました。所要時間 {{time}} ms",
|
||||
"testUrl": "テストURL",
|
||||
"testUrlPlaceholder": "テストするURLを入力してください",
|
||||
"testing": "接続をテスト中...",
|
||||
"type": "プロキシタイプ",
|
||||
"unsavedChanges": "保存されていない変更があります",
|
||||
"username": "ユーザー名",
|
||||
"username_placeholder": "ユーザー名を入力してください",
|
||||
"validation": {
|
||||
"passwordRequired": "認証を有効にする場合、パスワードは必須です",
|
||||
"portInvalid": "ポートは1から65535の間の数字でなければなりません",
|
||||
"portRequired": "プロキシを有効にする場合、ポートは必須です",
|
||||
"serverInvalid": "有効なサーバーアドレス(IPまたはドメイン名)を入力してください",
|
||||
"serverRequired": "プロキシを有効にする場合、サーバーアドレスは必須です",
|
||||
"typeRequired": "プロキシを有効にする場合、プロキシタイプは必須です",
|
||||
"usernameRequired": "認証を有効にする場合、ユーザー名は必須です"
|
||||
}
|
||||
},
|
||||
"remoteServer": {
|
||||
"authError": "認証エラー: {{error}}",
|
||||
"authPending": "ブラウザで認証を完了してください",
|
||||
|
||||
+98
-44
@@ -71,44 +71,23 @@
|
||||
"DeepSeek-V3": {
|
||||
"description": "DeepSeek-V3は、深度求索社が独自に開発したMoEモデルです。DeepSeek-V3は、Qwen2.5-72BやLlama-3.1-405Bなどの他のオープンソースモデルを超える評価成績を収め、性能面では世界トップクラスのクローズドソースモデルであるGPT-4oやClaude-3.5-Sonnetと肩を並べています。"
|
||||
},
|
||||
"Doubao-1.5-thinking-pro-m": {
|
||||
"description": "Doubao-1.5は新しい深い思考モデルであり(mバージョンはネイティブなマルチモーダル深推論能力を備えています)、数学、プログラミング、科学推論などの専門分野や創造的な執筆などの一般的なタスクで優れたパフォーマンスを発揮し、AIME 2024、Codeforces、GPQAなどの複数の権威あるベンチマークで業界の第一梯隊レベルに達しています。128kのコンテキストウィンドウと16kの出力をサポートしています。"
|
||||
},
|
||||
"Doubao-1.5-thinking-vision-pro": {
|
||||
"description": "全く新しい視覚的深層思考モデルで、より強力な汎用マルチモーダル理解と推論能力を備えており、59 の公開評価基準のうち 37 の基準で SOTA パフォーマンスを達成しています。"
|
||||
},
|
||||
"Doubao-1.5-vision-pro": {
|
||||
"description": "Doubao-1.5-vision-proは新たにアップグレードされた多モーダル大モデルで、任意の解像度と極端なアスペクト比の画像認識をサポートし、視覚推論、文書認識、詳細情報の理解、指示の遵守能力を強化しています。"
|
||||
},
|
||||
"Doubao-1.5-vision-pro-32k": {
|
||||
"description": "Doubao-1.5-vision-proは全く新しいアップグレード版のマルチモーダル大モデルで、任意の解像度と極端なアスペクト比の画像認識をサポートし、視覚推論、文書認識、詳細情報の理解、指示遵守能力を強化しています。"
|
||||
},
|
||||
"Doubao-lite-128k": {
|
||||
"description": "Doubao-liteは、極めて高速な応答速度と優れたコストパフォーマンスを備え、顧客のさまざまなシーンに柔軟な選択肢を提供します。128kコンテキストウィンドウの推論と微調整をサポートしています。"
|
||||
"description": "Doubao-liteは極めて高速な応答速度と優れたコストパフォーマンスを備え、さまざまなシナリオに柔軟な選択肢を提供します。128kのコンテキストウィンドウでの推論と微調整をサポートします。"
|
||||
},
|
||||
"Doubao-lite-32k": {
|
||||
"description": "Doubao-liteは、極めて高速な応答速度と優れたコストパフォーマンスを備え、顧客のさまざまなシーンに柔軟な選択肢を提供します。32kコンテキストウィンドウの推論と微調整をサポートしています。"
|
||||
"description": "Doubao-liteは極めて高速な応答速度と優れたコストパフォーマンスを備え、さまざまなシナリオに柔軟な選択肢を提供します。32kのコンテキストウィンドウでの推論と微調整をサポートします。"
|
||||
},
|
||||
"Doubao-lite-4k": {
|
||||
"description": "Doubao-liteは、極めて高速な応答速度と優れたコストパフォーマンスを備え、顧客のさまざまなシーンに柔軟な選択肢を提供します。4kコンテキストウィンドウの推論と微調整をサポートしています。"
|
||||
"description": "Doubao-liteは極めて高速な応答速度と優れたコストパフォーマンスを備え、さまざまなシナリオに柔軟な選択肢を提供します。4kのコンテキストウィンドウでの推論と微調整をサポートします。"
|
||||
},
|
||||
"Doubao-pro-128k": {
|
||||
"description": "最も効果的な主力モデルで、複雑なタスクの処理に適しており、参考質問応答、要約、創作、テキスト分類、ロールプレイングなどのシーンで素晴らしい結果を出します。128kコンテキストウィンドウの推論と微調整をサポートしています。"
|
||||
},
|
||||
"Doubao-pro-256k": {
|
||||
"description": "最も効果的な主力モデルで、複雑なタスクの処理に適しており、参考質問応答、要約、創作、テキスト分類、ロールプレイなどのシーンで優れた効果を発揮します。256kのコンテキストウィンドウでの推論とファインチューニングをサポートします。"
|
||||
"description": "最も高性能な主力モデルで、複雑なタスクの処理に適しています。参考質問応答、要約、創作、テキスト分類、ロールプレイなどのシーンで優れた効果を発揮します。128kのコンテキストウィンドウでの推論と微調整をサポートします。"
|
||||
},
|
||||
"Doubao-pro-32k": {
|
||||
"description": "最も効果的な主力モデルで、複雑なタスクの処理に適しており、参考質問応答、要約、創作、テキスト分類、ロールプレイングなどのシーンで素晴らしい結果を出します。32kコンテキストウィンドウの推論と微調整をサポートしています。"
|
||||
"description": "最も高性能な主力モデルで、複雑なタスクの処理に適しています。参考質問応答、要約、創作、テキスト分類、ロールプレイなどのシーンで優れた効果を発揮します。32kのコンテキストウィンドウでの推論と微調整をサポートします。"
|
||||
},
|
||||
"Doubao-pro-4k": {
|
||||
"description": "最も効果的な主力モデルで、複雑なタスクの処理に適しており、参考質問応答、要約、創作、テキスト分類、ロールプレイングなどのシーンで素晴らしい結果を出します。4kコンテキストウィンドウの推論と微調整をサポートしています。"
|
||||
},
|
||||
"Doubao-vision-lite-32k": {
|
||||
"description": "Doubao-visionモデルは豆包が提供するマルチモーダル大モデルで、強力な画像理解と推論能力、正確な指示理解能力を備えています。モデルは画像テキスト情報の抽出や画像に基づく推論タスクで強力な性能を発揮し、より複雑で広範な視覚的質問応答タスクに応用できます。"
|
||||
},
|
||||
"Doubao-vision-pro-32k": {
|
||||
"description": "Doubao-visionモデルは豆包が提供するマルチモーダル大モデルで、強力な画像理解と推論能力、正確な指示理解能力を備えています。モデルは画像テキスト情報の抽出や画像に基づく推論タスクで強力な性能を発揮し、より複雑で広範な視覚的質問応答タスクに応用できます。"
|
||||
"description": "最も高性能な主力モデルで、複雑なタスクの処理に適しています。参考質問応答、要約、創作、テキスト分類、ロールプレイなどのシーンで優れた効果を発揮します。4kのコンテキストウィンドウでの推論と微調整をサポートします。"
|
||||
},
|
||||
"ERNIE-3.5-128K": {
|
||||
"description": "百度が独自に開発したフラッグシップの大規模言語モデルで、膨大な中英語のコーパスをカバーし、強力な汎用能力を持っています。ほとんどの対話型質問応答、創作生成、プラグインアプリケーションの要件を満たすことができます。また、百度検索プラグインとの自動接続をサポートし、質問応答情報のタイムリーさを保証します。"
|
||||
@@ -224,24 +203,21 @@
|
||||
"Pro/Qwen/Qwen2.5-VL-7B-Instruct": {
|
||||
"description": "Qwen2.5-VLはQwenシリーズの新メンバーで、強力な視覚理解能力を備えています。画像内のテキスト、チャート、レイアウトを分析でき、長い動画の理解やイベントの捕捉が可能です。推論やツール操作が行え、多様な形式の物体位置特定や構造化された出力生成をサポートします。動画理解のための動的解像度とフレームレートのトレーニングが最適化され、視覚エンコーダーの効率も向上しています。"
|
||||
},
|
||||
"Pro/THUDM/GLM-4.1V-9B-Thinking": {
|
||||
"description": "GLM-4.1V-9B-Thinking は、智譜AIと清華大学KEG研究室が共同で発表したオープンソースの視覚言語モデル(VLM)であり、複雑なマルチモーダル認知タスクの処理に特化して設計されています。本モデルはGLM-4-9B-0414の基礎モデルをベースに、「思考の連鎖(Chain-of-Thought)」推論メカニズムを導入し、強化学習戦略を採用することで、マルチモーダル間の推論能力と安定性を大幅に向上させています。"
|
||||
},
|
||||
"Pro/THUDM/glm-4-9b-chat": {
|
||||
"description": "GLM-4-9B-Chatは智譜AIが提供するGLM-4シリーズの事前訓練モデルのオープンバージョンです。このモデルは意味、数学、推論、コード、知識などの複数の側面で優れたパフォーマンスを示します。多輪対話をサポートするだけでなく、GLM-4-9B-Chatはウェブブラウジング、コード実行、カスタムツール呼び出し(Function Call)、長文推論などの高度な機能も備えています。モデルは中国語、英語、日本語、韓国語、ドイツ語など26の言語をサポートしています。多くのベンチマークテストで、GLM-4-9B-Chatは優れた性能を示し、AlignBench-v2、MT-Bench、MMLU、C-Evalなどでの評価が行われています。このモデルは最大128Kのコンテキスト長をサポートし、学術研究や商業アプリケーションに適しています。"
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1": {
|
||||
"description": "DeepSeek-R1は、強化学習(RL)駆動の推論モデルで、モデル内の繰り返しと可読性の問題を解決します。RLの前に、DeepSeek-R1はコールドスタートデータを導入し、推論性能をさらに最適化しました。数学、コード、推論タスクにおいてOpenAI-o1と同等の性能を発揮し、精巧に設計されたトレーニング手法によって全体的な効果を向上させています。"
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1-0120": {
|
||||
"description": "DeepSeek-R1は強化学習(RL)駆動の推論モデルで、モデルの反復性と可読性の問題を解決しました。RL導入前にコールドスタートデータを導入し、推論性能をさらに最適化。数学、コード、推論タスクにおいてOpenAI-o1と同等の性能を示し、精緻に設計された訓練手法により全体的な効果を向上させています。"
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B": {
|
||||
"description": "DeepSeek-R1-Distill-Qwen-7B は、Qwen2.5-Math-7B を基に知識蒸留によって得られたモデルです。このモデルは、DeepSeek-R1 によって生成された80万の精選されたサンプルを使用して微調整されており、優れた推論能力を発揮します。複数のベンチマークテストで優れた性能を示し、MATH-500では92.8%の精度、AIME 2024では55.5%の合格率、CodeForcesでは1189のスコアを達成し、7B規模のモデルとして強力な数学およびプログラミング能力を実証しています。"
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-V3": {
|
||||
"description": "DeepSeek-V3は、6710億パラメータを持つ混合専門家(MoE)言語モデルで、多頭潜在注意力(MLA)とDeepSeekMoEアーキテクチャを採用し、無補助損失の負荷バランス戦略を組み合わせて推論とトレーニングの効率を最適化しています。14.8兆の高品質トークンで事前トレーニングを行い、監視付き微調整と強化学習を経て、DeepSeek-V3は他のオープンソースモデルを超え、先進的なクローズドモデルに近づいています。"
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-V3-1226": {
|
||||
"description": "DeepSeek-V3は、6710億のパラメータを持つ混合専門家(MoE)言語モデルであり、マルチヘッド潜在注意(MLA)とDeepSeekMoEアーキテクチャを採用し、補助損失なしの負荷バランス戦略を組み合わせて、推論とトレーニングの効率を最適化しています。14.8兆の高品質トークンで事前トレーニングを行い、監視付き微調整と強化学習を経て、DeepSeek-V3は他のオープンソースモデルを超え、先進的なクローズドソースモデルに近づいています。"
|
||||
},
|
||||
"QwQ-32B-Preview": {
|
||||
"description": "QwQ-32B-Previewは、複雑な対話生成と文脈理解タスクを効率的に処理できる革新的な自然言語処理モデルです。"
|
||||
},
|
||||
@@ -404,6 +380,9 @@
|
||||
"THUDM/GLM-4-9B-0414": {
|
||||
"description": "GLM-4-9B-0414はGLMシリーズの小型モデルで、90億パラメータを持ちます。このモデルはGLM-4-32Bシリーズの技術的特徴を継承しつつ、より軽量なデプロイメントオプションを提供します。規模は小さいものの、GLM-4-9B-0414はコード生成、ウェブデザイン、SVGグラフィック生成、検索ベースの執筆などのタスクで優れた能力を示しています。"
|
||||
},
|
||||
"THUDM/GLM-4.1V-9B-Thinking": {
|
||||
"description": "GLM-4.1V-9B-Thinking は、智譜AIと清華大学KEG研究室が共同で発表したオープンソースの視覚言語モデル(VLM)であり、複雑なマルチモーダル認知タスクの処理に特化して設計されています。本モデルはGLM-4-9B-0414の基礎モデルをベースに、「思考の連鎖(Chain-of-Thought)」推論メカニズムを導入し、強化学習戦略を採用することで、マルチモーダル間の推論能力と安定性を大幅に向上させています。"
|
||||
},
|
||||
"THUDM/GLM-Z1-32B-0414": {
|
||||
"description": "GLM-Z1-32B-0414は深い思考能力を持つ推論モデルです。このモデルはGLM-4-32B-0414に基づき、コールドスタートと拡張強化学習を通じて開発され、数学、コード、論理タスクにおいてさらに訓練されています。基礎モデルと比較して、GLM-Z1-32B-0414は数学能力と複雑なタスクの解決能力を大幅に向上させています。"
|
||||
},
|
||||
@@ -560,6 +539,9 @@
|
||||
"anthropic/claude-sonnet-4": {
|
||||
"description": "Claude Sonnet 4 はほぼ即時の応答や段階的な思考の延長を生成でき、ユーザーはこれらのプロセスを明確に確認できます。API ユーザーはモデルの思考時間を細かく制御することも可能です。"
|
||||
},
|
||||
"ascend-tribe/pangu-pro-moe": {
|
||||
"description": "Pangu-Pro-MoE 72B-A16B は、720億パラメータ、160億アクティベーションパラメータのスパース大規模言語モデルであり、グループ化された混合エキスパート(MoGE)アーキテクチャに基づいています。エキスパート選択段階でエキスパートをグループ化し、各グループ内でトークンが均等にエキスパートをアクティベートするよう制約を設けることで、エキスパートの負荷バランスを実現し、昇騰プラットフォーム上でのモデル展開効率を大幅に向上させています。"
|
||||
},
|
||||
"aya": {
|
||||
"description": "Aya 23は、Cohereが提供する多言語モデルであり、23の言語をサポートし、多様な言語アプリケーションを便利にします。"
|
||||
},
|
||||
@@ -569,6 +551,9 @@
|
||||
"baichuan/baichuan2-13b-chat": {
|
||||
"description": "Baichuan-13Bは百川智能が開発した130億パラメータを持つオープンソースの商用大規模言語モデルで、権威ある中国語と英語のベンチマークで同サイズの中で最良の結果を達成しています。"
|
||||
},
|
||||
"baidu/ERNIE-4.5-300B-A47B": {
|
||||
"description": "ERNIE-4.5-300B-A47B は、百度(Baidu)が開発した混合エキスパート(MoE)アーキテクチャに基づく大規模言語モデルです。総パラメータ数は3000億ですが、推論時には各トークンで470億パラメータのみをアクティベートし、強力な性能を維持しつつ計算効率も両立しています。ERNIE 4.5シリーズの中核モデルの一つとして、テキスト理解、生成、推論、プログラミングなどのタスクで卓越した能力を発揮します。本モデルは革新的なマルチモーダル異種MoE事前学習手法を採用し、テキストと視覚モダリティの共同学習により、特に指示遵守と世界知識の記憶において優れた効果を発揮しています。"
|
||||
},
|
||||
"c4ai-aya-expanse-32b": {
|
||||
"description": "Aya Expanseは、高性能な32B多言語モデルで、指示調整、データアービトラージ、好みのトレーニング、モデル統合の革新を通じて、単一言語モデルのパフォーマンスに挑戦します。23の言語をサポートしています。"
|
||||
},
|
||||
@@ -914,17 +899,53 @@
|
||||
"doubao-1.5-thinking-pro": {
|
||||
"description": "Doubao-1.5の新しい深層思考モデルは、数学、プログラミング、科学的推論などの専門分野や、創造的な執筆などの一般的なタスクで優れたパフォーマンスを発揮し、AIME 2024、Codeforces、GPQAなどの複数の権威あるベンチマークで業界の最前線に達するか、またはそれに近いレベルを実現しています。128kのコンテキストウィンドウと16kの出力をサポートしています。"
|
||||
},
|
||||
"doubao-1.5-thinking-pro-m": {
|
||||
"description": "Doubao-1.5の新しい深層思考モデル(mバージョンはネイティブのマルチモーダル深層推論能力を備えています)は、数学、プログラミング、科学的推論などの専門分野および創造的な執筆などの一般タスクで優れたパフォーマンスを発揮し、AIME 2024、Codeforces、GPQAなどの複数の権威あるベンチマークで業界トップクラスのレベルに達しています。128kのコンテキストウィンドウと16kの出力をサポートします。"
|
||||
},
|
||||
"doubao-1.5-thinking-vision-pro": {
|
||||
"description": "新しい視覚深層思考モデルで、より強力な汎用マルチモーダル理解と推論能力を備え、59の公開ベンチマークのうち37でSOTA(最先端)を達成しています。"
|
||||
},
|
||||
"doubao-1.5-ui-tars": {
|
||||
"description": "Doubao-1.5-UI-TARSは、グラフィカルユーザーインターフェース(GUI)向けにネイティブ設計されたエージェントモデルです。知覚、推論、行動などの人間のような能力を通じてGUIとシームレスにインタラクションします。"
|
||||
},
|
||||
"doubao-1.5-vision-lite": {
|
||||
"description": "Doubao-1.5-vision-liteは新たにアップグレードされた多モーダル大モデルで、任意の解像度と極端なアスペクト比の画像認識をサポートし、視覚推論、文書認識、詳細情報の理解、指示の遵守能力を強化しています。128kのコンテキストウィンドウをサポートし、出力長は最大16kトークンをサポートします。"
|
||||
},
|
||||
"doubao-1.5-vision-pro": {
|
||||
"description": "Doubao-1.5-vision-proは新たにアップグレードされたマルチモーダル大規模モデルで、任意の解像度および極端なアスペクト比の画像認識をサポートし、視覚的推論、文書認識、詳細情報の理解、指示の遵守能力を強化しています。"
|
||||
},
|
||||
"doubao-1.5-vision-pro-32k": {
|
||||
"description": "Doubao-1.5-vision-proは新たにアップグレードされたマルチモーダル大規模モデルで、任意の解像度および極端なアスペクト比の画像認識をサポートし、視覚的推論、文書認識、詳細情報の理解、指示の遵守能力を強化しています。"
|
||||
},
|
||||
"doubao-lite-128k": {
|
||||
"description": "極めて高速な応答速度と優れたコストパフォーマンスを備え、さまざまなシナリオに柔軟な選択肢を提供します。128kのコンテキストウィンドウでの推論と微調整をサポートします。"
|
||||
},
|
||||
"doubao-lite-32k": {
|
||||
"description": "極めて高速な応答速度と優れたコストパフォーマンスを備え、さまざまなシナリオに柔軟な選択肢を提供します。32kのコンテキストウィンドウでの推論と微調整をサポートします。"
|
||||
},
|
||||
"doubao-lite-4k": {
|
||||
"description": "極めて高速な応答速度と優れたコストパフォーマンスを備え、さまざまなシナリオに柔軟な選択肢を提供します。4kのコンテキストウィンドウでの推論と微調整をサポートします。"
|
||||
},
|
||||
"doubao-pro-256k": {
|
||||
"description": "最も高性能な主力モデルで、複雑なタスクの処理に適しています。参考質問応答、要約、創作、テキスト分類、ロールプレイなどのシーンで優れた効果を発揮します。256kのコンテキストウィンドウでの推論と微調整をサポートします。"
|
||||
},
|
||||
"doubao-pro-32k": {
|
||||
"description": "最も高性能な主力モデルで、複雑なタスクの処理に適しています。参考質問応答、要約、創作、テキスト分類、ロールプレイなどのシーンで優れた効果を発揮します。32kのコンテキストウィンドウでの推論と微調整をサポートします。"
|
||||
},
|
||||
"doubao-seed-1.6": {
|
||||
"description": "Doubao-Seed-1.6 は新しいマルチモーダル深層思考モデルで、auto/thinking/non-thinking の3つの思考モードをサポートします。non-thinking モードでは、Doubao-1.5-pro/250115 と比較して大幅に性能が向上しています。256k のコンテキストウィンドウをサポートし、最大16kトークンの出力長に対応しています。"
|
||||
"description": "Doubao-Seed-1.6 は新しいマルチモーダル深層思考モデルで、auto/thinking/non-thinking の三つの思考モードをサポートします。non-thinking モードでは、Doubao-1.5-pro/250115 と比較して大幅に性能が向上しています。256k のコンテキストウィンドウをサポートし、最大 16k トークンの出力長に対応しています。"
|
||||
},
|
||||
"doubao-seed-1.6-flash": {
|
||||
"description": "Doubao-Seed-1.6-flash は推論速度に極限を追求したマルチモーダル深層思考モデルで、TPOT はわずか10msです。テキストと視覚の理解を同時にサポートし、テキスト理解能力は前世代の lite を超え、視覚理解は競合の pro シリーズモデルに匹敵します。256k のコンテキストウィンドウをサポートし、最大16kトークンの出力長に対応しています。"
|
||||
"description": "Doubao-Seed-1.6-flash は推論速度に優れたマルチモーダル深層思考モデルで、TPOT はわずか 10ms です。テキストと視覚の理解を同時にサポートし、テキスト理解能力は前世代の lite を超え、視覚理解は競合他社の pro シリーズモデルに匹敵します。256k のコンテキストウィンドウをサポートし、最大 16k トークンの出力長に対応しています。"
|
||||
},
|
||||
"doubao-seed-1.6-thinking": {
|
||||
"description": "Doubao-Seed-1.6-thinking モデルは思考能力が大幅に強化されており、Doubao-1.5-thinking-pro と比較して、コーディング、数学、論理推論などの基礎能力がさらに向上しています。視覚理解もサポートしています。256k のコンテキストウィンドウをサポートし、最大16kトークンの出力長に対応しています。"
|
||||
"description": "Doubao-Seed-1.6-thinking モデルは思考能力が大幅に強化されており、Doubao-1.5-thinking-pro と比較して、コーディング、数学、論理推論などの基礎能力がさらに向上しています。視覚理解もサポートしています。256k のコンテキストウィンドウをサポートし、最大 16k トークンの出力長に対応しています。"
|
||||
},
|
||||
"doubao-vision-lite-32k": {
|
||||
"description": "Doubao-visionモデルは豆包が提供するマルチモーダル大規模モデルで、強力な画像理解と推論能力、正確な指示理解能力を備えています。画像テキスト情報抽出や画像に基づく推論タスクで高い性能を示し、より複雑で幅広い視覚質問応答タスクに応用可能です。"
|
||||
},
|
||||
"doubao-vision-pro-32k": {
|
||||
"description": "Doubao-visionモデルは豆包が提供するマルチモーダル大規模モデルで、強力な画像理解と推論能力、正確な指示理解能力を備えています。画像テキスト情報抽出や画像に基づく推論タスクで高い性能を示し、より複雑で幅広い視覚質問応答タスクに応用可能です。"
|
||||
},
|
||||
"emohaa": {
|
||||
"description": "Emohaaは心理モデルで、専門的な相談能力を持ち、ユーザーが感情問題を理解するのを助けます。"
|
||||
@@ -1082,9 +1103,6 @@
|
||||
"gemini-2.5-pro": {
|
||||
"description": "Gemini 2.5 ProはGoogleの最先端思考モデルで、コード、数学、STEM分野の複雑な問題の推論が可能であり、長文コンテキストを用いて大規模データセット、コードベース、ドキュメントの分析を行います。"
|
||||
},
|
||||
"gemini-2.5-pro-exp-03-25": {
|
||||
"description": "Gemini 2.5 Pro Experimentalは、Googleの最先端の思考モデルであり、コード、数学、STEM分野の複雑な問題に対して推論を行うことができ、長いコンテキストを利用して大規模なデータセット、コードベース、文書を分析します。"
|
||||
},
|
||||
"gemini-2.5-pro-preview-03-25": {
|
||||
"description": "Gemini 2.5 Pro Previewは、Googleの最先端の思考モデルであり、コード、数学、STEM分野の複雑な問題に対して推論を行い、長いコンテキストを使用して大規模なデータセット、コードベース、文書を分析することができます。"
|
||||
},
|
||||
@@ -1151,6 +1169,12 @@
|
||||
"glm-4-plus": {
|
||||
"description": "GLM-4-Plusは高い知能を持つフラッグシップモデルで、長文や複雑なタスクを処理する能力が強化され、全体的なパフォーマンスが向上しています。"
|
||||
},
|
||||
"glm-4.1v-thinking-flash": {
|
||||
"description": "GLM-4.1V-Thinking シリーズモデルは、現時点で知られている10BクラスのVLMモデルの中で最も性能の高い視覚モデルであり、同クラスのSOTAの各種視覚言語タスクを統合しています。これには動画理解、画像質問応答、学科問題解決、OCR文字認識、文書およびグラフ解析、GUIエージェント、フロントエンドウェブコーディング、グラウンディングなどが含まれ、多くのタスク能力は8倍のパラメータを持つQwen2.5-VL-72Bをも上回ります。先進的な強化学習技術により、思考の連鎖推論を通じて回答の正確性と豊かさを向上させ、最終的な成果と説明可能性の両面で従来の非thinkingモデルを大きく凌駕しています。"
|
||||
},
|
||||
"glm-4.1v-thinking-flashx": {
|
||||
"description": "GLM-4.1V-Thinking シリーズモデルは、現時点で知られている10BクラスのVLMモデルの中で最も性能の高い視覚モデルであり、同クラスのSOTAの各種視覚言語タスクを統合しています。これには動画理解、画像質問応答、学科問題解決、OCR文字認識、文書およびグラフ解析、GUIエージェント、フロントエンドウェブコーディング、グラウンディングなどが含まれ、多くのタスク能力は8倍のパラメータを持つQwen2.5-VL-72Bをも上回ります。先進的な強化学習技術により、思考の連鎖推論を通じて回答の正確性と豊かさを向上させ、最終的な成果と説明可能性の両面で従来の非thinkingモデルを大きく凌駕しています。"
|
||||
},
|
||||
"glm-4v": {
|
||||
"description": "GLM-4Vは強力な画像理解と推論能力を提供し、さまざまな視覚タスクをサポートします。"
|
||||
},
|
||||
@@ -1172,6 +1196,9 @@
|
||||
"glm-z1-flash": {
|
||||
"description": "GLM-Z1シリーズは強力な複雑推論能力を持ち、論理推論、数学、プログラミングなどの分野で優れたパフォーマンスを発揮します。最大コンテキスト長は32Kです。"
|
||||
},
|
||||
"glm-z1-flashx": {
|
||||
"description": "高速かつ低価格:Flash強化版で、超高速推論速度とより速い同時処理を保証します。"
|
||||
},
|
||||
"glm-zero-preview": {
|
||||
"description": "GLM-Zero-Previewは、強力な複雑な推論能力を備え、論理推論、数学、プログラミングなどの分野で優れたパフォーマンスを発揮します。"
|
||||
},
|
||||
@@ -1223,6 +1250,9 @@
|
||||
"google/gemma-2b-it": {
|
||||
"description": "Gemma Instruct (2B)は、基本的な指示処理能力を提供し、軽量アプリケーションに適しています。"
|
||||
},
|
||||
"google/gemma-3-1b-it": {
|
||||
"description": "Gemma 3 1B はGoogleのオープンソース言語モデルであり、効率と性能の面で新たな基準を打ち立てました。"
|
||||
},
|
||||
"google/gemma-3-27b-it": {
|
||||
"description": "Gemma 3 27Bは、Googleのオープンソース言語モデルで、効率と性能の面で新たな基準を打ち立てました。"
|
||||
},
|
||||
@@ -1305,7 +1335,7 @@
|
||||
"description": "GPT-4o miniは、OpenAIがGPT-4 Omniの後に発表した最新のモデルで、画像とテキストの入力をサポートし、テキストを出力します。最先端の小型モデルとして、最近の他の先進モデルよりもはるかに安価で、GPT-3.5 Turboよりも60%以上安価です。最先端の知能を維持しつつ、コストパフォーマンスが大幅に向上しています。GPT-4o miniはMMLUテストで82%のスコアを獲得し、現在チャットの好みではGPT-4よりも高い評価を得ています。"
|
||||
},
|
||||
"gpt-4o-mini-audio-preview": {
|
||||
"description": "GPT-4o mini Audio モデルは音声の入力と出力に対応しています。"
|
||||
"description": "GPT-4o mini Audio モデルは音声の入力と出力をサポートします。"
|
||||
},
|
||||
"gpt-4o-mini-realtime-preview": {
|
||||
"description": "GPT-4o-miniリアルタイムバージョン、音声とテキストのリアルタイム入力と出力をサポート"
|
||||
@@ -1313,6 +1343,9 @@
|
||||
"gpt-4o-mini-search-preview": {
|
||||
"description": "GPT-4o mini検索プレビュー版は、ウェブ検索クエリの理解と実行に特化して訓練されたモデルで、Chat Completions APIを使用しています。トークン料金に加え、ウェブ検索クエリはツール呼び出しごとに料金が発生します。"
|
||||
},
|
||||
"gpt-4o-mini-transcribe": {
|
||||
"description": "GPT-4o Mini TranscribeはGPT-4oを使用した音声からテキストへの転写モデルです。元のWhisperモデルと比較して単語誤り率が改善され、言語認識と精度が向上しています。より正確な転写を得るためにご利用ください。"
|
||||
},
|
||||
"gpt-4o-mini-tts": {
|
||||
"description": "GPT-4o mini TTS は、GPT-4o mini に基づくテキスト音声合成モデルで、高品質な音声生成を低コストで提供します。"
|
||||
},
|
||||
@@ -1322,12 +1355,15 @@
|
||||
"gpt-4o-realtime-preview-2024-10-01": {
|
||||
"description": "GPT-4oリアルタイムバージョン、音声とテキストのリアルタイム入力と出力をサポート"
|
||||
},
|
||||
"gpt-4o-realtime-preview-2024-12-17": {
|
||||
"description": "GPT-4oリアルタイムバージョン、音声とテキストのリアルタイム入力と出力をサポート"
|
||||
"gpt-4o-realtime-preview-2025-06-03": {
|
||||
"description": "GPT-4oのリアルタイムバージョンで、音声とテキストのリアルタイム入出力をサポートします。"
|
||||
},
|
||||
"gpt-4o-search-preview": {
|
||||
"description": "GPT-4o検索プレビュー版は、ウェブ検索クエリの理解と実行に特化して訓練されたモデルで、Chat Completions APIを使用しています。トークン料金に加え、ウェブ検索クエリはツール呼び出しごとに料金が発生します。"
|
||||
},
|
||||
"gpt-4o-transcribe": {
|
||||
"description": "GPT-4o TranscribeはGPT-4oを使用した音声からテキストへの転写モデルです。元のWhisperモデルと比較して単語誤り率が改善され、言語認識と精度が向上しています。より正確な転写を得るためにご利用ください。"
|
||||
},
|
||||
"grok-2-1212": {
|
||||
"description": "このモデルは、精度、指示の遵守、そして多言語能力において改善されています。"
|
||||
},
|
||||
@@ -1346,9 +1382,15 @@
|
||||
"grok-3-mini-fast": {
|
||||
"description": "軽量モデルで、会話前に思考します。高速かつスマートに動作し、深い専門知識を必要としない論理タスクに適しており、元の思考過程を取得できます。"
|
||||
},
|
||||
"grok-4": {
|
||||
"description": "私たちの最新かつ最強のフラッグシップモデルであり、自然言語処理、数学計算、推論において卓越した性能を発揮します——まさに完璧な万能型プレイヤーです。"
|
||||
},
|
||||
"gryphe/mythomax-l2-13b": {
|
||||
"description": "MythoMax l2 13Bは複数のトップモデルを統合した創造性と知性を兼ね備えた言語モデルです。"
|
||||
},
|
||||
"hunyuan-a13b": {
|
||||
"description": "混元の初のハイブリッド推論モデルであるhunyuan-standard-256Kのアップグレード版で、総パラメータ80B、アクティベーション13Bを持ちます。デフォルトはスロースルーモードで、パラメータまたは指示によって高速・低速思考モードの切り替えが可能です。切り替え方法はクエリの前に「/」または「no_think」を付加します。全体的な能力は前世代に比べて大幅に向上しており、特に数学、科学、長文理解、エージェント能力が顕著に強化されています。"
|
||||
},
|
||||
"hunyuan-code": {
|
||||
"description": "混元の最新のコード生成モデルで、200Bの高品質コードデータで基盤モデルを増強し、半年間の高品質SFTデータトレーニングを経て、コンテキストウィンドウの長さが8Kに増加しました。5つの主要言語のコード生成自動評価指標で上位に位置し、5つの言語における10項目の総合コードタスクの人工高品質評価で、パフォーマンスは第一梯隊にあります。"
|
||||
},
|
||||
@@ -1400,6 +1442,9 @@
|
||||
"hunyuan-t1-vision": {
|
||||
"description": "混元多モーダル理解の深層思考モデルで、多モーダルのネイティブ長思考チェーンをサポートし、さまざまな画像推論シナリオに優れています。理系の難問においては速思考モデルよりも包括的に向上しています。"
|
||||
},
|
||||
"hunyuan-t1-vision-20250619": {
|
||||
"description": "混元の最新バージョンt1-vision多モーダル理解深層思考モデルで、マルチモーダルのネイティブな長い思考の連鎖をサポートし、前世代のデフォルトモデルに比べて全体的に性能が向上しています。"
|
||||
},
|
||||
"hunyuan-turbo": {
|
||||
"description": "混元の新世代大規模言語モデルのプレビュー版で、全く新しい混合専門家モデル(MoE)構造を採用し、hunyuan-proに比べて推論効率が向上し、パフォーマンスも強化されています。"
|
||||
},
|
||||
@@ -1430,6 +1475,12 @@
|
||||
"hunyuan-turbos-role-plus": {
|
||||
"description": "混元の最新ロールプレイングモデルで、混元公式による精調整訓練を経たロールプレイングモデルです。混元モデルを基にロールプレイングシナリオのデータセットで追加訓練されており、ロールプレイングシナリオでより良い基礎性能を持ちます。"
|
||||
},
|
||||
"hunyuan-turbos-vision": {
|
||||
"description": "本モデルは画像と言語の理解シーンに適しており、混元の最新turbosに基づく次世代の視覚言語フラッグシップ大規模モデルです。画像に基づく実体認識、知識質問応答、コピーライティング、写真による問題解決などのタスクに焦点を当てており、前世代モデルに比べて全体的に性能が向上しています。"
|
||||
},
|
||||
"hunyuan-turbos-vision-20250619": {
|
||||
"description": "混元の最新バージョンturbos-vision視覚言語フラッグシップ大規模モデルであり、画像に基づく実体認識、知識質問応答、コピーライティング、写真による問題解決などの画像と言語の理解関連タスクにおいて、前世代のデフォルトモデルに比べて全体的に性能が向上しています。"
|
||||
},
|
||||
"hunyuan-vision": {
|
||||
"description": "混元の最新のマルチモーダルモデルで、画像とテキストの入力をサポートし、テキストコンテンツを生成します。"
|
||||
},
|
||||
@@ -1457,6 +1508,9 @@
|
||||
"jina-deepsearch-v1": {
|
||||
"description": "深層検索は、ウェブ検索、読解、推論を組み合わせて、包括的な調査を行います。これは、あなたの研究タスクを受け入れる代理人として考えることができ、広範な検索を行い、何度も反復してから答えを提供します。このプロセスには、継続的な研究、推論、さまざまな視点からの問題解決が含まれます。これは、事前に訓練されたデータから直接答えを生成する標準的な大規模モデルや、一度きりの表面的な検索に依存する従来のRAGシステムとは根本的に異なります。"
|
||||
},
|
||||
"kimi-k2-0711-preview": {
|
||||
"description": "kimi-k2は強力なコードおよびエージェント能力を備えたMoEアーキテクチャの基盤モデルで、総パラメータ数は1兆、活性化パラメータは320億です。一般知識推論、プログラミング、数学、エージェントなどの主要カテゴリのベンチマーク性能テストで、K2モデルは他の主流オープンソースモデルを上回る性能を示しています。"
|
||||
},
|
||||
"kimi-latest": {
|
||||
"description": "Kimi スマートアシスタント製品は最新の Kimi 大モデルを使用しており、まだ安定していない機能が含まれている可能性があります。画像理解をサポートし、リクエストのコンテキストの長さに応じて 8k/32k/128k モデルを請求モデルとして自動的に選択します。"
|
||||
},
|
||||
@@ -1869,7 +1923,7 @@
|
||||
"description": "o1はOpenAIの新しい推論モデルで、広範な一般知識を必要とする複雑なタスクに適しています。このモデルは128Kのコンテキストを持ち、2023年10月の知識のカットオフがあります。"
|
||||
},
|
||||
"o1-pro": {
|
||||
"description": "o1 シリーズモデルは強化学習で訓練されており、回答前に思考を行い、複雑な推論タスクを実行できます。o1-pro モデルはより多くの計算資源を使用してより深い思考を行い、継続的に高品質な回答を提供します。"
|
||||
"description": "o1 シリーズモデルは強化学習により訓練されており、回答前に思考を行い、複雑な推論タスクを実行できます。o1-pro モデルはより多くの計算資源を使用してより深い思考を行い、継続的に高品質な回答を提供します。"
|
||||
},
|
||||
"o3": {
|
||||
"description": "o3は全能で強力なモデルで、複数の分野で優れたパフォーマンスを発揮します。数学、科学、プログラミング、視覚推論タスクの新たな基準を設定しました。また、技術的な執筆や指示の遵守にも優れています。ユーザーはこれを利用して、テキスト、コード、画像を分析し、複雑な多段階の問題を解決できます。"
|
||||
@@ -2349,7 +2403,7 @@
|
||||
"description": "v0-1.5-md モデルは、日常的なタスクやユーザーインターフェース(UI)生成に適しています"
|
||||
},
|
||||
"whisper-1": {
|
||||
"description": "汎用音声認識モデル、多言語音声認識、音声翻訳、言語認識をサポート"
|
||||
"description": "汎用音声認識モデルで、多言語の音声認識、音声翻訳、言語識別をサポートします。"
|
||||
},
|
||||
"wizardlm2": {
|
||||
"description": "WizardLM 2は、Microsoft AIが提供する言語モデルであり、複雑な対話、多言語、推論、インテリジェントアシスタントの分野で特に優れた性能を発揮します。"
|
||||
|
||||
@@ -520,6 +520,7 @@
|
||||
"hotkey": "ショートカットキー",
|
||||
"llm": "言語モデル",
|
||||
"provider": "AIサービスプロバイダー",
|
||||
"proxy": "ネットワークプロキシ",
|
||||
"storage": "データストレージ",
|
||||
"sync": "クラウド同期",
|
||||
"system-agent": "システムアシスタント",
|
||||
|
||||
@@ -46,6 +46,9 @@
|
||||
"reasoningEffort": {
|
||||
"title": "추론 강도"
|
||||
},
|
||||
"thinking": {
|
||||
"title": "심층 사고 스위치"
|
||||
},
|
||||
"title": "모델 확장 기능"
|
||||
},
|
||||
"history": {
|
||||
|
||||
@@ -1,4 +1,43 @@
|
||||
{
|
||||
"proxy": {
|
||||
"auth": "인증 필요",
|
||||
"authDesc": "프록시 서버가 사용자 이름과 비밀번호를 요구하는 경우",
|
||||
"authSettings": "인증 설정",
|
||||
"basicSettings": "프록시 설정",
|
||||
"basicSettingsDesc": "프록시 서버 연결 매개변수 구성",
|
||||
"bypass": "프록시를 사용하지 않는 주소",
|
||||
"connectionTest": "연결 테스트",
|
||||
"enable": "프록시 활성화",
|
||||
"enableDesc": "활성화하면 프록시 서버를 통해 네트워크에 접속합니다",
|
||||
"password": "비밀번호",
|
||||
"password_placeholder": "비밀번호를 입력하세요",
|
||||
"port": "포트",
|
||||
"resetButton": "재설정",
|
||||
"saveButton": "저장",
|
||||
"saveFailed": "저장 실패: {{error}}",
|
||||
"saveSuccess": "프록시 설정이 성공적으로 저장되었습니다",
|
||||
"server": "서버 주소",
|
||||
"testButton": "연결 테스트",
|
||||
"testDescription": "현재 프록시 구성을 사용하여 연결을 테스트하고 구성이 정상 작동하는지 확인합니다",
|
||||
"testFailed": "연결 실패",
|
||||
"testSuccessWithTime": "연결 테스트 성공, 소요 시간 {{time}} ms",
|
||||
"testUrl": "테스트 주소",
|
||||
"testUrlPlaceholder": "테스트할 URL을 입력하세요",
|
||||
"testing": "연결 테스트 중...",
|
||||
"type": "프록시 유형",
|
||||
"unsavedChanges": "저장하지 않은 변경 사항이 있습니다",
|
||||
"username": "사용자 이름",
|
||||
"username_placeholder": "사용자 이름을 입력하세요",
|
||||
"validation": {
|
||||
"passwordRequired": "인증 활성화 시 비밀번호는 필수 항목입니다",
|
||||
"portInvalid": "포트는 1에서 65535 사이의 숫자여야 합니다",
|
||||
"portRequired": "프록시 활성화 시 포트는 필수 항목입니다",
|
||||
"serverInvalid": "유효한 서버 주소(IP 또는 도메인)를 입력하세요",
|
||||
"serverRequired": "프록시 활성화 시 서버 주소는 필수 항목입니다",
|
||||
"typeRequired": "프록시 활성화 시 프록시 유형은 필수 항목입니다",
|
||||
"usernameRequired": "인증 활성화 시 사용자 이름은 필수 항목입니다"
|
||||
}
|
||||
},
|
||||
"remoteServer": {
|
||||
"authError": "인증 실패: {{error}}",
|
||||
"authPending": "브라우저에서 인증을 완료하세요",
|
||||
|
||||
+97
-43
@@ -71,44 +71,23 @@
|
||||
"DeepSeek-V3": {
|
||||
"description": "DeepSeek-V3는 심층 탐색 회사에서 자체 개발한 MoE 모델입니다. DeepSeek-V3는 여러 평가에서 Qwen2.5-72B 및 Llama-3.1-405B와 같은 다른 오픈 소스 모델을 초월하며, 성능 면에서 세계 최고의 폐쇄형 모델인 GPT-4o 및 Claude-3.5-Sonnet과 동등합니다."
|
||||
},
|
||||
"Doubao-1.5-thinking-pro-m": {
|
||||
"description": "Doubao-1.5는 새로운 깊은 사고 모델(m 버전은 원래 다중 모달 깊은 추론 능력을 갖추고 있음)로, 수학, 프로그래밍, 과학 추론 등 전문 분야 및 창의적 작문 등 일반 작업에서 뛰어난 성능을 보이며, AIME 2024, Codeforces, GPQA 등 여러 권위 있는 벤치마크에서 업계 1위 수준에 도달하거나 근접했습니다. 128k 맥락 창 및 16k 출력을 지원합니다."
|
||||
},
|
||||
"Doubao-1.5-thinking-vision-pro": {
|
||||
"description": "새로운 비주얼 심층 사고 모델로, 더 강력한 일반 다중 모달 이해 및 추론 능력을 갖추고 있으며, 59개의 공개 평가 기준 중 37개에서 SOTA 성과를 달성했습니다."
|
||||
},
|
||||
"Doubao-1.5-vision-pro": {
|
||||
"description": "Doubao-1.5-vision-pro는 새롭게 업그레이드된 다중 모드 대모델로, 임의의 해상도와 극단적인 가로 세로 비율의 이미지 인식을 지원하며, 시각적 추론, 문서 인식, 세부 정보 이해 및 지시 준수 능력을 강화합니다."
|
||||
},
|
||||
"Doubao-1.5-vision-pro-32k": {
|
||||
"description": "Doubao-1.5-vision-pro는 새롭게 업그레이드된 다중 모달 대형 모델로, 임의의 해상도와 극단적인 가로 세로 비율의 이미지 인식을 지원하며, 시각적 추론, 문서 인식, 세부 정보 이해 및 지시 준수 능력을 강화했습니다."
|
||||
},
|
||||
"Doubao-lite-128k": {
|
||||
"description": "Doubao-lite는 극한의 응답 속도와 더 나은 가격 대비 성능을 자랑하며, 고객의 다양한 상황에 유연한 선택을 제공합니다. 128k 컨텍스트 윈도우의 추론 및 세부 조정을 지원합니다."
|
||||
"description": "Doubao-lite는 탁월한 응답 속도와 뛰어난 가성비를 자랑하며, 고객의 다양한 시나리오에 더 유연한 선택을 제공합니다. 128k 컨텍스트 윈도우 추론 및 미세 조정을 지원합니다."
|
||||
},
|
||||
"Doubao-lite-32k": {
|
||||
"description": "Doubao-lite는 극한의 응답 속도와 더 나은 가격 대비 성능을 자랑하며, 고객의 다양한 상황에 유연한 선택을 제공합니다. 32k 컨텍스트 윈도우의 추론 및 세부 조정을 지원합니다."
|
||||
"description": "Doubao-lite는 탁월한 응답 속도와 뛰어난 가성비를 자랑하며, 고객의 다양한 시나리오에 더 유연한 선택을 제공합니다. 32k 컨텍스트 윈도우 추론 및 미세 조정을 지원합니다."
|
||||
},
|
||||
"Doubao-lite-4k": {
|
||||
"description": "Doubao-lite는 극한의 응답 속도와 더 나은 가격 대비 성능을 자랑하며, 고객의 다양한 상황에 유연한 선택을 제공합니다. 4k 컨텍스트 윈도우의 추론 및 세부 조정을 지원합니다."
|
||||
"description": "Doubao-lite는 탁월한 응답 속도와 뛰어난 가성비를 자랑하며, 고객의 다양한 시나리오에 더 유연한 선택을 제공합니다. 4k 컨텍스트 윈도우 추론 및 미세 조정을 지원합니다."
|
||||
},
|
||||
"Doubao-pro-128k": {
|
||||
"description": "가장 효과적인 주력 모델로, 복잡한 작업 처리에 적합하며, 참고 질문, 요약, 창작, 텍스트 분류, 역할 수행 등 많은 장면에서 뛰어난 성과를 보입니다. 128k 컨텍스트 윈도우의 추론 및 세부 조정을 지원합니다."
|
||||
},
|
||||
"Doubao-pro-256k": {
|
||||
"description": "가장 효과적인 주력 모델로, 복잡한 작업 처리에 적합하며, 참고 질문 응답, 요약, 창작, 텍스트 분류, 역할 수행 등 다양한 상황에서 좋은 성과를 보입니다. 256k의 컨텍스트 윈도우 추론 및 미세 조정을 지원합니다."
|
||||
"description": "최고 성능의 주력 모델로 복잡한 작업 처리에 적합하며, 참고 질문 답변, 요약, 창작, 텍스트 분류, 역할극 등 다양한 시나리오에서 우수한 성과를 보입니다. 128k 컨텍스트 윈도우 추론 및 미세 조정을 지원합니다."
|
||||
},
|
||||
"Doubao-pro-32k": {
|
||||
"description": "가장 효과적인 주력 모델로, 복잡한 작업 처리에 적합하며, 참고 질문, 요약, 창작, 텍스트 분류, 역할 수행 등 많은 장면에서 뛰어난 성과를 보입니다. 32k 컨텍스트 윈도우의 추론 및 세부 조정을 지원합니다."
|
||||
"description": "최고 성능의 주력 모델로 복잡한 작업 처리에 적합하며, 참고 질문 답변, 요약, 창작, 텍스트 분류, 역할극 등 다양한 시나리오에서 우수한 성과를 보입니다. 32k 컨텍스트 윈도우 추론 및 미세 조정을 지원합니다."
|
||||
},
|
||||
"Doubao-pro-4k": {
|
||||
"description": "가장 효과적인 주력 모델로, 복잡한 작업 처리에 적합하며, 참고 질문, 요약, 창작, 텍스트 분류, 역할 수행 등 많은 장면에서 뛰어난 성과를 보입니다. 4k 컨텍스트 윈도우의 추론 및 세부 조정을 지원합니다."
|
||||
},
|
||||
"Doubao-vision-lite-32k": {
|
||||
"description": "Doubao-vision 모델은 Doubao에서 출시한 다중 모달 대형 모델로, 강력한 이미지 이해 및 추론 능력과 정확한 지시 이해 능력을 갖추고 있습니다. 이 모델은 이미지 텍스트 정보 추출 및 이미지 기반 추론 작업에서 강력한 성능을 보여주며, 더 복잡하고 넓은 시각적 질문 응답 작업에 적용될 수 있습니다."
|
||||
},
|
||||
"Doubao-vision-pro-32k": {
|
||||
"description": "Doubao-vision 모델은 Doubao에서 출시한 다중 모달 대형 모델로, 강력한 이미지 이해 및 추론 능력과 정확한 지시 이해 능력을 갖추고 있습니다. 이 모델은 이미지 텍스트 정보 추출 및 이미지 기반 추론 작업에서 강력한 성능을 보여주며, 더 복잡하고 넓은 시각적 질문 응답 작업에 적용될 수 있습니다."
|
||||
"description": "최고 성능의 주력 모델로 복잡한 작업 처리에 적합하며, 참고 질문 답변, 요약, 창작, 텍스트 분류, 역할극 등 다양한 시나리오에서 우수한 성과를 보입니다. 4k 컨텍스트 윈도우 추론 및 미세 조정을 지원합니다."
|
||||
},
|
||||
"ERNIE-3.5-128K": {
|
||||
"description": "바이두가 자체 개발한 플래그십 대규모 언어 모델로, 방대한 중문 및 영문 코퍼스를 포함하고 있으며, 강력한 일반 능력을 갖추고 있어 대부분의 대화형 질문 응답, 창작 생성, 플러그인 응용 시나리오 요구를 충족할 수 있습니다. 또한 바이두 검색 플러그인과의 자동 연동을 지원하여 질문 응답 정보의 시의성을 보장합니다."
|
||||
@@ -224,24 +203,21 @@
|
||||
"Pro/Qwen/Qwen2.5-VL-7B-Instruct": {
|
||||
"description": "Qwen2.5-VL은 Qwen 시리즈의 새로운 멤버로, 강력한 시각 이해 능력을 갖추고 있습니다. 이미지 내 텍스트, 차트, 레이아웃을 분석할 수 있으며, 긴 동영상을 이해하고 이벤트를 포착할 수 있습니다. 추론을 수행하고 도구를 조작할 수 있으며, 다중 형식 객체 위치 지정과 구조화된 출력 생성을 지원합니다. 동영상 이해를 위한 동적 해상도 및 프레임 속도 훈련이 최적화되었으며, 시각 인코더 효율성이 향상되었습니다."
|
||||
},
|
||||
"Pro/THUDM/GLM-4.1V-9B-Thinking": {
|
||||
"description": "GLM-4.1V-9B-Thinking은 지푸 AI와 칭화대 KEG 연구실이 공동으로 발표한 오픈소스 비주얼 언어 모델(VLM)로, 복잡한 다중 모달 인지 작업을 처리하도록 설계되었습니다. 이 모델은 GLM-4-9B-0414 기본 모델을 기반으로 하며, '사고 사슬'(Chain-of-Thought) 추론 메커니즘을 도입하고 강화 학습 전략을 채택하여 교차 모달 추론 능력과 안정성을 크게 향상시켰습니다."
|
||||
},
|
||||
"Pro/THUDM/glm-4-9b-chat": {
|
||||
"description": "GLM-4-9B-Chat은 Zhizhu AI가 출시한 GLM-4 시리즈의 사전 훈련 모델 중 오픈 소스 버전입니다. 이 모델은 의미, 수학, 추론, 코드 및 지식 등 여러 측면에서 뛰어난 성능을 보입니다. GLM-4-9B-Chat은 다중 회전 대화를 지원할 뿐만 아니라 웹 브라우징, 코드 실행, 사용자 정의 도구 호출(Function Call) 및 긴 텍스트 추론과 같은 고급 기능도 갖추고 있습니다. 이 모델은 중국어, 영어, 일본어, 한국어 및 독일어를 포함한 26개 언어를 지원합니다. 여러 벤치마크 테스트에서 GLM-4-9B-Chat은 AlignBench-v2, MT-Bench, MMLU 및 C-Eval 등에서 뛰어난 성능을 보였습니다. 이 모델은 최대 128K의 컨텍스트 길이를 지원하며, 학술 연구 및 상업적 응용에 적합합니다."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1": {
|
||||
"description": "DeepSeek-R1은 강화 학습(RL) 기반의 추론 모델로, 모델 내의 반복성과 가독성 문제를 해결합니다. RL 이전에 DeepSeek-R1은 콜드 스타트 데이터를 도입하여 추론 성능을 더욱 최적화했습니다. 수학, 코드 및 추론 작업에서 OpenAI-o1과 유사한 성능을 보이며, 정교하게 설계된 훈련 방법을 통해 전체적인 효과를 향상시켰습니다."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1-0120": {
|
||||
"description": "DeepSeek-R1은 강화 학습(RL) 기반 추론 모델로, 모델 내 반복성과 가독성 문제를 해결했습니다. RL 이전에 콜드 스타트 데이터를 도입하여 추론 성능을 추가 최적화했으며, 수학, 코드, 추론 작업에서 OpenAI-o1과 유사한 성능을 보이고, 정교한 훈련 방법을 통해 전체 성능을 향상시켰습니다."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B": {
|
||||
"description": "DeepSeek-R1-Distill-Qwen-7B는 Qwen2.5-Math-7B를 기반으로 지식 증류를 통해 개발된 모델입니다. 이 모델은 DeepSeek-R1에서 생성된 80만 개의 선별된 샘플을 사용하여 미세 조정되었으며, 우수한 추론 능력을 보여줍니다. 다양한 벤치마크에서 뛰어난 성능을 발휘하며, MATH-500에서 92.8%의 정확도, AIME 2024에서 55.5%의 통과율, CodeForces에서 1189점을 기록하여 7B 규모 모델로서 강력한 수학 및 프로그래밍 능력을 입증했습니다."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-V3": {
|
||||
"description": "DeepSeek-V3는 6710억 개의 매개변수를 가진 혼합 전문가(MoE) 언어 모델로, 다중 헤드 잠재 주의(MLA) 및 DeepSeekMoE 아키텍처를 사용하여 보조 손실 없는 부하 균형 전략을 결합하여 추론 및 훈련 효율성을 최적화합니다. 14.8조 개의 고품질 토큰에서 사전 훈련을 수행하고 감독 미세 조정 및 강화 학습을 통해 DeepSeek-V3는 성능 면에서 다른 오픈 소스 모델을 초월하며, 선도적인 폐쇄형 모델에 근접합니다."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-V3-1226": {
|
||||
"description": "DeepSeek-V3는 6710억 개의 매개변수를 가진 혼합 전문가(MoE) 언어 모델로, 다중 헤드 잠재 주의(MLA) 및 DeepSeekMoE 아키텍처를 채택하고, 보조 손실 없는 부하 균형 전략을 결합하여 추론 및 훈련 효율성을 최적화합니다. 14.8조 개의 고품질 토큰에서 사전 훈련을 거치고 감독 미세 조정 및 강화 학습을 통해 DeepSeek-V3는 성능 면에서 다른 오픈 소스 모델을 초월하며, 선도적인 폐쇄형 모델에 근접합니다."
|
||||
},
|
||||
"QwQ-32B-Preview": {
|
||||
"description": "QwQ-32B-Preview는 복잡한 대화 생성 및 맥락 이해 작업을 효율적으로 처리할 수 있는 혁신적인 자연어 처리 모델입니다."
|
||||
},
|
||||
@@ -404,6 +380,9 @@
|
||||
"THUDM/GLM-4-9B-0414": {
|
||||
"description": "GLM-4-9B-0414는 GLM 시리즈의 소형 모델로, 90억 개의 매개변수를 가지고 있습니다. 이 모델은 GLM-4-32B 시리즈의 기술적 특징을 계승하면서도 더 경량화된 배포 옵션을 제공합니다. 규모가 작음에도 불구하고, GLM-4-9B-0414는 코드 생성, 웹 디자인, SVG 그래픽 생성 및 검색 기반 작문 등 작업에서 뛰어난 능력을 보여줍니다."
|
||||
},
|
||||
"THUDM/GLM-4.1V-9B-Thinking": {
|
||||
"description": "GLM-4.1V-9B-Thinking은 지푸 AI와 칭화대 KEG 연구실이 공동으로 발표한 오픈소스 비주얼 언어 모델(VLM)로, 복잡한 다중 모달 인지 작업을 처리하도록 설계되었습니다. 이 모델은 GLM-4-9B-0414 기본 모델을 기반으로 하며, '사고 사슬'(Chain-of-Thought) 추론 메커니즘을 도입하고 강화 학습 전략을 채택하여 교차 모달 추론 능력과 안정성을 크게 향상시켰습니다."
|
||||
},
|
||||
"THUDM/GLM-Z1-32B-0414": {
|
||||
"description": "GLM-Z1-32B-0414는 깊은 사고 능력을 갖춘 추론 모델로, GLM-4-32B-0414를 기반으로 냉각 시작 및 확장 강화 학습을 통해 개발되었으며, 수학, 코드 및 논리 작업에서 추가 훈련을 받았습니다. 기본 모델에 비해 GLM-Z1-32B-0414는 수학 능력과 복잡한 작업 해결 능력이 크게 향상되었습니다."
|
||||
},
|
||||
@@ -560,6 +539,9 @@
|
||||
"anthropic/claude-sonnet-4": {
|
||||
"description": "Claude Sonnet 4는 거의 즉각적인 응답이나 단계별 심층 사고를 생성할 수 있으며, 사용자는 이러한 과정을 명확하게 볼 수 있습니다. API 사용자는 모델의 사고 시간을 세밀하게 제어할 수도 있습니다."
|
||||
},
|
||||
"ascend-tribe/pangu-pro-moe": {
|
||||
"description": "Pangu-Pro-MoE 72B-A16B는 720억 개의 파라미터와 160억 활성 파라미터를 가진 희소 대형 언어 모델로, 그룹 혼합 전문가(MoGE) 아키텍처를 기반으로 합니다. 전문가 선택 단계에서 전문가를 그룹화하고 각 그룹 내에서 토큰이 동일 수의 전문가를 활성화하도록 제한하여 전문가 부하 균형을 달성함으로써 Ascend 플랫폼에서의 모델 배포 효율성을 크게 향상시켰습니다."
|
||||
},
|
||||
"aya": {
|
||||
"description": "Aya 23은 Cohere에서 출시한 다국어 모델로, 23개 언어를 지원하여 다양한 언어 응용에 편리함을 제공합니다."
|
||||
},
|
||||
@@ -569,6 +551,9 @@
|
||||
"baichuan/baichuan2-13b-chat": {
|
||||
"description": "Baichuan-13B는 백천 인공지능이 개발한 130억 개의 매개변수를 가진 오픈 소스 상용 대형 언어 모델로, 권위 있는 중국어 및 영어 벤치마크에서 동일한 크기에서 최고의 성과를 달성했습니다."
|
||||
},
|
||||
"baidu/ERNIE-4.5-300B-A47B": {
|
||||
"description": "ERNIE-4.5-300B-A47B는 바이두에서 개발한 혼합 전문가(MoE) 아키텍처 기반의 대형 언어 모델입니다. 총 3천억 개의 파라미터를 보유하지만 추론 시 각 토큰당 470억 파라미터만 활성화하여 강력한 성능과 계산 효율성을 동시에 달성합니다. ERNIE 4.5 시리즈의 핵심 모델 중 하나로, 텍스트 이해, 생성, 추론 및 프로그래밍 작업에서 뛰어난 능력을 보여줍니다. 이 모델은 텍스트와 시각 모달리티의 공동 학습을 통한 혁신적인 다중 모달 이기종 MoE 사전학습 방식을 채택하여, 특히 명령 준수와 세계 지식 기억 측면에서 탁월한 성능을 발휘합니다."
|
||||
},
|
||||
"c4ai-aya-expanse-32b": {
|
||||
"description": "Aya Expanse는 지시 조정, 데이터 차익 거래, 선호 훈련 및 모델 통합의 혁신을 통해 단일 언어 모델의 성능에 도전하는 고성능 32B 다국어 모델입니다. 23개 언어를 지원합니다."
|
||||
},
|
||||
@@ -914,17 +899,53 @@
|
||||
"doubao-1.5-thinking-pro": {
|
||||
"description": "Doubao-1.5는 수학, 프로그래밍, 과학적 추론 등 전문 분야와 창의적 글쓰기 등 일반 작업에서 뛰어난 성능을 발휘하는 새로운 심층 사고 모델입니다. AIME 2024, Codeforces, GPQA 등 여러 권위 있는 기준에서 업계 최상위 수준에 도달하거나 근접했습니다. 128k의 컨텍스트 윈도우와 16k 출력을 지원합니다."
|
||||
},
|
||||
"doubao-1.5-thinking-pro-m": {
|
||||
"description": "Doubao-1.5는 완전히 새로워진 심층 사고 모델(m 버전은 본래 다중 모달 심층 추론 기능 탑재)로, 수학, 프로그래밍, 과학적 추론 등 전문 분야와 창의적 글쓰기 등 일반 작업에서 뛰어난 성능을 보이며, AIME 2024, Codeforces, GPQA 등 여러 권위 있는 벤치마크에서 업계 최상위권 수준에 도달하거나 근접했습니다. 128k 컨텍스트 윈도우와 16k 출력 지원."
|
||||
},
|
||||
"doubao-1.5-thinking-vision-pro": {
|
||||
"description": "완전히 새로워진 시각 심층 사고 모델로, 강력한 범용 다중 모달 이해 및 추론 능력을 갖추었으며, 59개의 공개 평가 벤치마크 중 37개에서 최첨단(SOTA) 성과를 달성했습니다."
|
||||
},
|
||||
"doubao-1.5-ui-tars": {
|
||||
"description": "Doubao-1.5-UI-TARS는 그래픽 사용자 인터페이스(GUI) 상호작용에 본래 최적화된 에이전트 모델입니다. 인지, 추론, 행동 등 인간과 유사한 능력을 통해 GUI와 원활하게 상호작용합니다."
|
||||
},
|
||||
"doubao-1.5-vision-lite": {
|
||||
"description": "Doubao-1.5-vision-lite는 새롭게 업그레이드된 다중 모드 대모델로, 임의의 해상도와 극단적인 가로 세로 비율의 이미지 인식을 지원하며, 시각적 추론, 문서 인식, 세부 정보 이해 및 지시 준수 능력을 강화합니다. 128k 문맥 창을 지원하며, 최대 16k 토큰의 출력 길이를 지원합니다."
|
||||
},
|
||||
"doubao-1.5-vision-pro": {
|
||||
"description": "Doubao-1.5-vision-pro는 완전히 업그레이드된 다중 모달 대형 모델로, 임의 해상도 및 극단적인 종횡비 이미지 인식을 지원하며, 시각 추론, 문서 인식, 세부 정보 이해 및 명령 준수 능력이 강화되었습니다."
|
||||
},
|
||||
"doubao-1.5-vision-pro-32k": {
|
||||
"description": "Doubao-1.5-vision-pro는 완전히 업그레이드된 다중 모달 대형 모델로, 임의 해상도 및 극단적인 종횡비 이미지 인식을 지원하며, 시각 추론, 문서 인식, 세부 정보 이해 및 명령 준수 능력이 강화되었습니다."
|
||||
},
|
||||
"doubao-lite-128k": {
|
||||
"description": "탁월한 응답 속도와 뛰어난 가성비를 자랑하며, 고객의 다양한 시나리오에 더 유연한 선택을 제공합니다. 128k 컨텍스트 윈도우 추론 및 미세 조정을 지원합니다."
|
||||
},
|
||||
"doubao-lite-32k": {
|
||||
"description": "탁월한 응답 속도와 뛰어난 가성비를 자랑하며, 고객의 다양한 시나리오에 더 유연한 선택을 제공합니다. 32k 컨텍스트 윈도우 추론 및 미세 조정을 지원합니다."
|
||||
},
|
||||
"doubao-lite-4k": {
|
||||
"description": "탁월한 응답 속도와 뛰어난 가성비를 자랑하며, 고객의 다양한 시나리오에 더 유연한 선택을 제공합니다. 4k 컨텍스트 윈도우 추론 및 미세 조정을 지원합니다."
|
||||
},
|
||||
"doubao-pro-256k": {
|
||||
"description": "최고 성능의 주력 모델로 복잡한 작업 처리에 적합하며, 참고 질문 답변, 요약, 창작, 텍스트 분류, 역할극 등 다양한 시나리오에서 우수한 성과를 보입니다. 256k 컨텍스트 윈도우 추론 및 미세 조정을 지원합니다."
|
||||
},
|
||||
"doubao-pro-32k": {
|
||||
"description": "최고 성능의 주력 모델로 복잡한 작업 처리에 적합하며, 참고 질문 답변, 요약, 창작, 텍스트 분류, 역할극 등 다양한 시나리오에서 우수한 성과를 보입니다. 32k 컨텍스트 윈도우 추론 및 미세 조정을 지원합니다."
|
||||
},
|
||||
"doubao-seed-1.6": {
|
||||
"description": "Doubao-Seed-1.6은 완전히 새로워진 다중 모달 심층 사고 모델로, auto/thinking/non-thinking 세 가지 사고 모드를 모두 지원합니다. non-thinking 모드에서 모델 성능은 Doubao-1.5-pro/250115에 비해 크게 향상되었습니다. 256k 컨텍스트 윈도우를 지원하며, 출력 길이는 최대 16k 토큰까지 가능합니다."
|
||||
"description": "Doubao-Seed-1.6은 완전히 새로워진 다중 모달 심층 사고 모델로, auto/thinking/non-thinking 세 가지 사고 모드를 모두 지원합니다. non-thinking 모드에서는 Doubao-1.5-pro/250115에 비해 모델 성능이 크게 향상되었습니다. 256k 컨텍스트 창을 지원하며, 출력 길이는 최대 16k 토큰까지 가능합니다."
|
||||
},
|
||||
"doubao-seed-1.6-flash": {
|
||||
"description": "Doubao-Seed-1.6-flash는 추론 속도가 극대화된 다중 모달 심층 사고 모델로, TPOT가 단 10ms에 불과합니다. 텍스트와 시각 이해를 모두 지원하며, 텍스트 이해 능력은 이전 세대 lite를 능가하고, 시각 이해는 경쟁사 pro 시리즈 모델과 견줄 만합니다. 256k 컨텍스트 윈도우를 지원하며, 출력 길이는 최대 16k 토큰까지 가능합니다."
|
||||
"description": "Doubao-Seed-1.6-flash는 추론 속도가 극대화된 다중 모달 심층 사고 모델로, TPOT가 단 10ms에 불과합니다. 텍스트와 시각 이해를 모두 지원하며, 텍스트 이해 능력은 이전 세대 lite를 능가하고, 시각 이해는 경쟁사 pro 시리즈 모델과 견줄 만합니다. 256k 컨텍스트 창을 지원하며, 출력 길이는 최대 16k 토큰까지 가능합니다."
|
||||
},
|
||||
"doubao-seed-1.6-thinking": {
|
||||
"description": "Doubao-Seed-1.6-thinking 모델은 사고 능력이 크게 강화되어 Doubao-1.5-thinking-pro에 비해 코딩, 수학, 논리 추론 등 기본 능력이 더욱 향상되었으며, 시각 이해를 지원합니다. 256k 컨텍스트 윈도우를 지원하며, 출력 길이는 최대 16k 토큰까지 가능합니다."
|
||||
"description": "Doubao-Seed-1.6-thinking 모델은 사고 능력이 크게 강화되어 Doubao-1.5-thinking-pro에 비해 코딩, 수학, 논리 추론 등 기본 능력이 더욱 향상되었으며, 시각 이해도 지원합니다. 256k 컨텍스트 창을 지원하며, 출력 길이는 최대 16k 토큰까지 가능합니다."
|
||||
},
|
||||
"doubao-vision-lite-32k": {
|
||||
"description": "Doubao-vision 모델은 Doubao에서 출시한 다중 모달 대형 모델로, 강력한 이미지 이해 및 추론 능력과 정밀한 명령 이해 능력을 갖추고 있습니다. 이미지 텍스트 정보 추출 및 이미지 기반 추론 작업에서 뛰어난 성능을 보여, 더 복잡하고 광범위한 시각 질문 응답 작업에 적용할 수 있습니다."
|
||||
},
|
||||
"doubao-vision-pro-32k": {
|
||||
"description": "Doubao-vision 모델은 Doubao에서 출시한 다중 모달 대형 모델로, 강력한 이미지 이해 및 추론 능력과 정밀한 명령 이해 능력을 갖추고 있습니다. 이미지 텍스트 정보 추출 및 이미지 기반 추론 작업에서 뛰어난 성능을 보여, 더 복잡하고 광범위한 시각 질문 응답 작업에 적용할 수 있습니다."
|
||||
},
|
||||
"emohaa": {
|
||||
"description": "Emohaa는 심리 모델로, 전문 상담 능력을 갖추고 있어 사용자가 감정 문제를 이해하는 데 도움을 줍니다."
|
||||
@@ -1082,9 +1103,6 @@
|
||||
"gemini-2.5-pro": {
|
||||
"description": "Gemini 2.5 Pro는 구글의 최첨단 사고 모델로, 코드, 수학 및 STEM 분야의 복잡한 문제를 추론할 수 있으며, 긴 문맥을 활용해 대규모 데이터셋, 코드베이스 및 문서를 분석합니다."
|
||||
},
|
||||
"gemini-2.5-pro-exp-03-25": {
|
||||
"description": "Gemini 2.5 Pro Experimental은 Google의 최첨단 사고 모델로, 코드, 수학 및 STEM 분야의 복잡한 문제를 추론할 수 있으며, 긴 문맥을 활용하여 대규모 데이터 세트, 코드베이스 및 문서를 분석할 수 있습니다."
|
||||
},
|
||||
"gemini-2.5-pro-preview-03-25": {
|
||||
"description": "Gemini 2.5 Pro Preview는 Google의 최첨단 사고 모델로, 코드, 수학 및 STEM 분야의 복잡한 문제를 추론하고 긴 맥락을 사용하여 대규모 데이터 세트, 코드베이스 및 문서를 분석할 수 있습니다."
|
||||
},
|
||||
@@ -1151,6 +1169,12 @@
|
||||
"glm-4-plus": {
|
||||
"description": "GLM-4-Plus는 고지능 플래그십 모델로, 긴 텍스트 및 복잡한 작업 처리 능력이 뛰어나며 성능이 전반적으로 향상되었습니다."
|
||||
},
|
||||
"glm-4.1v-thinking-flash": {
|
||||
"description": "GLM-4.1V-Thinking 시리즈 모델은 현재 알려진 10B급 VLM 모델 중 가장 성능이 뛰어난 비주얼 모델로, 동급 SOTA의 다양한 비주얼 언어 작업을 통합합니다. 여기에는 비디오 이해, 이미지 질문응답, 학과 문제 해결, OCR 문자 인식, 문서 및 차트 해석, GUI 에이전트, 프론트엔드 웹 코딩, 그라운딩 등이 포함되며, 여러 작업 능력은 8배 이상의 파라미터를 가진 Qwen2.5-VL-72B를 능가합니다. 선도적인 강화 학습 기술을 통해 사고 사슬 추론 방식을 습득하여 답변의 정확성과 풍부함을 향상시키며, 최종 결과와 해석 가능성 측면에서 전통적인 비사고 모델을 현저히 능가합니다."
|
||||
},
|
||||
"glm-4.1v-thinking-flashx": {
|
||||
"description": "GLM-4.1V-Thinking 시리즈 모델은 현재 알려진 10B급 VLM 모델 중 가장 성능이 뛰어난 비주얼 모델로, 동급 SOTA의 다양한 비주얼 언어 작업을 통합합니다. 여기에는 비디오 이해, 이미지 질문응답, 학과 문제 해결, OCR 문자 인식, 문서 및 차트 해석, GUI 에이전트, 프론트엔드 웹 코딩, 그라운딩 등이 포함되며, 여러 작업 능력은 8배 이상의 파라미터를 가진 Qwen2.5-VL-72B를 능가합니다. 선도적인 강화 학습 기술을 통해 사고 사슬 추론 방식을 습득하여 답변의 정확성과 풍부함을 향상시키며, 최종 결과와 해석 가능성 측면에서 전통적인 비사고 모델을 현저히 능가합니다."
|
||||
},
|
||||
"glm-4v": {
|
||||
"description": "GLM-4V는 강력한 이미지 이해 및 추론 능력을 제공하며, 다양한 시각적 작업을 지원합니다."
|
||||
},
|
||||
@@ -1172,6 +1196,9 @@
|
||||
"glm-z1-flash": {
|
||||
"description": "GLM-Z1 시리즈는 강력한 복잡한 추론 능력을 갖추고 있으며, 논리 추론, 수학, 프로그래밍 등 분야에서 뛰어난 성능을 발휘합니다. 최대 문맥 길이는 32K입니다."
|
||||
},
|
||||
"glm-z1-flashx": {
|
||||
"description": "고속 저가: Flash 강화 버전으로, 매우 빠른 추론 속도와 더 빠른 동시성 보장을 제공합니다."
|
||||
},
|
||||
"glm-zero-preview": {
|
||||
"description": "GLM-Zero-Preview는 강력한 복잡한 추론 능력을 갖추고 있으며, 논리 추론, 수학, 프로그래밍 등 분야에서 우수한 성능을 발휘합니다."
|
||||
},
|
||||
@@ -1223,6 +1250,9 @@
|
||||
"google/gemma-2b-it": {
|
||||
"description": "Gemma Instruct (2B)는 기본적인 지시 처리 능력을 제공하며, 경량 애플리케이션에 적합합니다."
|
||||
},
|
||||
"google/gemma-3-1b-it": {
|
||||
"description": "Gemma 3 1B는 구글의 오픈소스 언어 모델로, 효율성과 성능 면에서 새로운 기준을 세웠습니다."
|
||||
},
|
||||
"google/gemma-3-27b-it": {
|
||||
"description": "Gemma 3 27B는 구글의 오픈 소스 언어 모델로, 효율성과 성능 면에서 새로운 기준을 세웠습니다."
|
||||
},
|
||||
@@ -1313,6 +1343,9 @@
|
||||
"gpt-4o-mini-search-preview": {
|
||||
"description": "GPT-4o mini 검색 미리보기 버전은 웹 검색 쿼리 이해 및 실행을 위해 특별히 훈련된 모델로, Chat Completions API를 사용합니다. 토큰 비용 외에 웹 검색 쿼리는 도구 호출당 별도의 비용이 부과됩니다."
|
||||
},
|
||||
"gpt-4o-mini-transcribe": {
|
||||
"description": "GPT-4o Mini Transcribe는 GPT-4o를 사용하여 오디오를 텍스트로 전사하는 음성 인식 모델입니다. 원래 Whisper 모델에 비해 단어 오류율이 개선되었고, 언어 인식 및 정확도가 향상되었습니다. 보다 정확한 전사를 위해 사용하세요."
|
||||
},
|
||||
"gpt-4o-mini-tts": {
|
||||
"description": "GPT-4o mini TTS 는 GPT-4o mini 에 기반한 텍스트 음성 변환 모델로, 높은 품질의 음성 생성을 저렴한 가격으로 제공합니다."
|
||||
},
|
||||
@@ -1322,12 +1355,15 @@
|
||||
"gpt-4o-realtime-preview-2024-10-01": {
|
||||
"description": "GPT-4o 실시간 버전으로, 오디오 및 텍스트의 실시간 입력 및 출력을 지원합니다."
|
||||
},
|
||||
"gpt-4o-realtime-preview-2024-12-17": {
|
||||
"description": "GPT-4o 실시간 버전으로, 오디오 및 텍스트의 실시간 입력 및 출력을 지원합니다."
|
||||
"gpt-4o-realtime-preview-2025-06-03": {
|
||||
"description": "GPT-4o 실시간 버전으로, 오디오와 텍스트의 실시간 입출력을 지원합니다."
|
||||
},
|
||||
"gpt-4o-search-preview": {
|
||||
"description": "GPT-4o 검색 미리보기 버전은 웹 검색 쿼리 이해 및 실행을 위해 특별히 훈련된 모델로, Chat Completions API를 사용합니다. 토큰 비용 외에 웹 검색 쿼리는 도구 호출당 별도의 비용이 부과됩니다."
|
||||
},
|
||||
"gpt-4o-transcribe": {
|
||||
"description": "GPT-4o Transcribe는 GPT-4o를 사용하여 오디오를 텍스트로 전사하는 음성 인식 모델입니다. 원래 Whisper 모델에 비해 단어 오류율이 개선되었고, 언어 인식 및 정확도가 향상되었습니다. 보다 정확한 전사를 위해 사용하세요."
|
||||
},
|
||||
"grok-2-1212": {
|
||||
"description": "이 모델은 정확성, 지시 준수 및 다국어 능력에서 개선되었습니다."
|
||||
},
|
||||
@@ -1346,9 +1382,15 @@
|
||||
"grok-3-mini-fast": {
|
||||
"description": "경량 모델로, 대화 전에 먼저 사고합니다. 빠르고 지능적으로 작동하며, 깊은 도메인 지식이 필요 없는 논리 작업에 적합하고 원시 사고 경로를 획득할 수 있습니다."
|
||||
},
|
||||
"grok-4": {
|
||||
"description": "저희의 최신이자 가장 강력한 플래그십 모델로, 자연어 처리, 수학 계산 및 추론에서 뛰어난 성능을 자랑합니다 — 완벽한 만능형 선수입니다."
|
||||
},
|
||||
"gryphe/mythomax-l2-13b": {
|
||||
"description": "MythoMax l2 13B는 여러 최상위 모델을 통합한 창의성과 지능이 결합된 언어 모델입니다."
|
||||
},
|
||||
"hunyuan-a13b": {
|
||||
"description": "혼위안의 첫 혼합 추론 모델인 hunyuan-standard-256K의 업그레이드 버전으로, 총 800억 파라미터, 활성화 130억 파라미터를 갖추고 있습니다. 기본적으로 느린 사고 모드이며, 파라미터나 명령어를 통해 빠른/느린 사고 모드 전환을 지원합니다. 빠른/느린 사고 전환 방식은 쿼리 앞에 /no_think를 추가하는 방식입니다. 전반적인 능력은 이전 세대에 비해 전면적으로 향상되었으며, 특히 수학, 과학, 긴 문서 이해 및 에이전트 능력이 크게 개선되었습니다."
|
||||
},
|
||||
"hunyuan-code": {
|
||||
"description": "혼원 최신 코드 생성 모델로, 200B 고품질 코드 데이터로 증훈된 기초 모델을 기반으로 하며, 6개월간 고품질 SFT 데이터 훈련을 거쳤습니다. 컨텍스트 길이는 8K로 증가하였으며, 다섯 가지 언어의 코드 생성 자동 평가 지표에서 상위에 위치하고 있습니다. 다섯 가지 언어의 10개 항목에서 종합 코드 작업의 인공지능 고품질 평가에서 성능이 1위입니다."
|
||||
},
|
||||
@@ -1400,6 +1442,9 @@
|
||||
"hunyuan-t1-vision": {
|
||||
"description": "혼원 다중모달 이해 심층 사고 모델로, 다중모달 원천 사고 체인을 지원하며 다양한 이미지 추론 시나리오에 능숙합니다. 이과 문제에서 빠른 사고 모델 대비 전반적인 성능 향상을 보입니다."
|
||||
},
|
||||
"hunyuan-t1-vision-20250619": {
|
||||
"description": "혼위안 최신 버전 t1-vision 다중 모달 이해 심층 사고 모델로, 다중 모달 원생 사고 사슬을 지원하며 이전 세대 기본 모델에 비해 전면적으로 향상되었습니다."
|
||||
},
|
||||
"hunyuan-turbo": {
|
||||
"description": "혼원 최신 세대 대형 언어 모델의 미리보기 버전으로, 새로운 혼합 전문가 모델(MoE) 구조를 채택하여 hunyuan-pro보다 추론 효율이 더 빠르고 성능이 더 뛰어납니다."
|
||||
},
|
||||
@@ -1430,6 +1475,12 @@
|
||||
"hunyuan-turbos-role-plus": {
|
||||
"description": "혼원 최신 버전 역할극 모델로, 혼원 공식 미세 조정 훈련을 거친 역할극 모델입니다. 혼원 모델과 역할극 시나리오 데이터셋을 결합해 추가 훈련하여 역할극 시나리오에서 더 우수한 기본 성능을 제공합니다."
|
||||
},
|
||||
"hunyuan-turbos-vision": {
|
||||
"description": "이 모델은 이미지-텍스트 이해 시나리오에 적합하며, 혼위안 최신 turbos 기반의 차세대 비주얼 언어 플래그십 대형 모델입니다. 이미지 기반 엔티티 인식, 지식 질문응답, 문안 작성, 사진 촬영 문제 해결 등 이미지-텍스트 이해 관련 작업에 집중하며, 이전 세대 모델에 비해 전면적으로 향상되었습니다."
|
||||
},
|
||||
"hunyuan-turbos-vision-20250619": {
|
||||
"description": "혼위안 최신 버전 turbos-vision 비주얼 언어 플래그십 대형 모델로, 이미지 기반 엔티티 인식, 지식 질문응답, 문안 작성, 사진 촬영 문제 해결 등 이미지-텍스트 이해 관련 작업에서 이전 세대 기본 모델에 비해 전면적으로 향상되었습니다."
|
||||
},
|
||||
"hunyuan-vision": {
|
||||
"description": "혼원 최신 다중 모달 모델로, 이미지와 텍스트 입력을 지원하여 텍스트 콘텐츠를 생성합니다."
|
||||
},
|
||||
@@ -1457,6 +1508,9 @@
|
||||
"jina-deepsearch-v1": {
|
||||
"description": "딥 서치는 웹 검색, 독서 및 추론을 결합하여 포괄적인 조사를 수행합니다. 연구 작업을 수용하는 에이전트로 생각할 수 있으며, 광범위한 검색을 수행하고 여러 번 반복한 후에야 답변을 제공합니다. 이 과정은 지속적인 연구, 추론 및 다양한 각도에서 문제를 해결하는 것을 포함합니다. 이는 사전 훈련된 데이터에서 직접 답변을 생성하는 표준 대형 모델 및 일회성 표면 검색에 의존하는 전통적인 RAG 시스템과 근본적으로 다릅니다."
|
||||
},
|
||||
"kimi-k2-0711-preview": {
|
||||
"description": "kimi-k2는 강력한 코드 및 에이전트 기능을 갖춘 MoE 아키텍처 기반 모델로, 총 파라미터 1조, 활성화 파라미터 320억을 보유하고 있습니다. 일반 지식 추론, 프로그래밍, 수학, 에이전트 등 주요 분야 벤치마크 성능 테스트에서 K2 모델은 다른 주요 오픈소스 모델을 능가하는 성능을 보여줍니다."
|
||||
},
|
||||
"kimi-latest": {
|
||||
"description": "Kimi 스마트 어시스턴트 제품은 최신 Kimi 대형 모델을 사용하며, 아직 안정되지 않은 기능이 포함될 수 있습니다. 이미지 이해를 지원하며, 요청의 맥락 길이에 따라 8k/32k/128k 모델을 청구 모델로 자동 선택합니다."
|
||||
},
|
||||
@@ -1869,7 +1923,7 @@
|
||||
"description": "o1은 OpenAI의 새로운 추론 모델로, 광범위한 일반 지식이 필요한 복잡한 작업에 적합합니다. 이 모델은 128K의 컨텍스트와 2023년 10월의 지식 기준일을 가지고 있습니다."
|
||||
},
|
||||
"o1-pro": {
|
||||
"description": "o1 시리즈 모델은 강화 학습을 통해 훈련되어 답변 전에 사고를 수행하고 복잡한 추론 작업을 실행할 수 있습니다. o1-pro 모델은 더 많은 계산 자원을 사용하여 더 깊이 사고함으로써 지속적으로 더 우수한 답변을 제공합니다."
|
||||
"description": "o1 시리즈 모델은 강화 학습을 통해 훈련되어 답변 전에 사고를 진행하고 복잡한 추론 작업을 수행할 수 있습니다. o1-pro 모델은 더 많은 계산 자원을 사용하여 더 깊이 사고함으로써 지속적으로 더 우수한 답변을 제공합니다."
|
||||
},
|
||||
"o3": {
|
||||
"description": "o3는 다재다능한 강력한 모델로, 여러 분야에서 뛰어난 성능을 발휘합니다. 수학, 과학, 프로그래밍 및 시각적 추론 작업에서 새로운 기준을 세웠습니다. 기술 작문 및 지시 준수에도 능숙합니다. 사용자는 이를 통해 텍스트, 코드 및 이미지를 분석하고, 다단계 복잡한 문제를 해결할 수 있습니다."
|
||||
@@ -1881,7 +1935,7 @@
|
||||
"description": "o3-mini는 최신 소형 추론 모델로, o1-mini와 동일한 비용과 지연 목표에서 높은 지능을 제공합니다."
|
||||
},
|
||||
"o3-pro": {
|
||||
"description": "o3-pro 모델은 더 많은 계산을 사용하여 더 깊이 사고하고 항상 더 나은 답변을 제공하며, Responses API에서만 사용할 수 있습니다."
|
||||
"description": "o3-pro 모델은 더 많은 계산을 사용하여 더 깊이 사고하고 항상 더 나은 답변을 제공하며, Responses API에서만 사용 가능합니다."
|
||||
},
|
||||
"o4-mini": {
|
||||
"description": "o4-mini는 최신 소형 o 시리즈 모델로, 빠르고 효율적인 추론을 위해 최적화되어 있으며, 코딩 및 시각적 작업에서 매우 높은 효율성과 성능을 자랑합니다."
|
||||
|
||||
@@ -520,6 +520,7 @@
|
||||
"hotkey": "단축키",
|
||||
"llm": "언어 모델",
|
||||
"provider": "AI 서비스 제공자",
|
||||
"proxy": "네트워크 프록시",
|
||||
"storage": "데이터 저장소",
|
||||
"sync": "클라우드 동기화",
|
||||
"system-agent": "시스템 도우미",
|
||||
|
||||
@@ -46,6 +46,9 @@
|
||||
"reasoningEffort": {
|
||||
"title": "Redeneringsinspanning"
|
||||
},
|
||||
"thinking": {
|
||||
"title": "Diepdenkschakelaar"
|
||||
},
|
||||
"title": "Modeluitbreidingsfunctie"
|
||||
},
|
||||
"history": {
|
||||
|
||||
@@ -1,4 +1,43 @@
|
||||
{
|
||||
"proxy": {
|
||||
"auth": "Authenticatie vereist",
|
||||
"authDesc": "Als de proxyserver een gebruikersnaam en wachtwoord vereist",
|
||||
"authSettings": "Authenticatie-instellingen",
|
||||
"basicSettings": "Proxy-instellingen",
|
||||
"basicSettingsDesc": "Configureer de verbindingsparameters van de proxyserver",
|
||||
"bypass": "Adressen zonder proxy",
|
||||
"connectionTest": "Verbindingstest",
|
||||
"enable": "Proxy inschakelen",
|
||||
"enableDesc": "Als ingeschakeld wordt het netwerk via de proxyserver benaderd",
|
||||
"password": "Wachtwoord",
|
||||
"password_placeholder": "Voer wachtwoord in",
|
||||
"port": "Poort",
|
||||
"resetButton": "Resetten",
|
||||
"saveButton": "Opslaan",
|
||||
"saveFailed": "Opslaan mislukt: {{error}}",
|
||||
"saveSuccess": "Proxy-instellingen succesvol opgeslagen",
|
||||
"server": "Serveradres",
|
||||
"testButton": "Test verbinding",
|
||||
"testDescription": "Test de verbinding met de huidige proxyconfiguratie om te verifiëren of de instellingen correct werken",
|
||||
"testFailed": "Verbinding mislukt",
|
||||
"testSuccessWithTime": "Verbindingstest geslaagd, duurde {{time}} ms",
|
||||
"testUrl": "Testadres",
|
||||
"testUrlPlaceholder": "Voer de te testen URL in",
|
||||
"testing": "Verbinding aan het testen...",
|
||||
"type": "Proxy type",
|
||||
"unsavedChanges": "U heeft niet-opgeslagen wijzigingen",
|
||||
"username": "Gebruikersnaam",
|
||||
"username_placeholder": "Voer gebruikersnaam in",
|
||||
"validation": {
|
||||
"passwordRequired": "Wachtwoord is verplicht bij ingeschakelde authenticatie",
|
||||
"portInvalid": "Poort moet een getal tussen 1 en 65535 zijn",
|
||||
"portRequired": "Poort is verplicht bij ingeschakelde proxy",
|
||||
"serverInvalid": "Voer een geldig serveradres in (IP of domeinnaam)",
|
||||
"serverRequired": "Serveradres is verplicht bij ingeschakelde proxy",
|
||||
"typeRequired": "Proxytype is verplicht bij ingeschakelde proxy",
|
||||
"usernameRequired": "Gebruikersnaam is verplicht bij ingeschakelde authenticatie"
|
||||
}
|
||||
},
|
||||
"remoteServer": {
|
||||
"authError": "Autorisatiefout: {{error}}",
|
||||
"authPending": "Voltooi de autorisatie in de browser",
|
||||
|
||||
+95
-41
@@ -71,44 +71,23 @@
|
||||
"DeepSeek-V3": {
|
||||
"description": "DeepSeek-V3 is een MoE-model dat zelf is ontwikkeld door DeepSeek Company. De prestaties van DeepSeek-V3 overtreffen die van andere open-source modellen zoals Qwen2.5-72B en Llama-3.1-405B, en presteert op het gebied van prestaties gelijkwaardig aan de wereldtop gesloten modellen zoals GPT-4o en Claude-3.5-Sonnet."
|
||||
},
|
||||
"Doubao-1.5-thinking-pro-m": {
|
||||
"description": "Doubao-1.5 is een nieuw diep denkmodel (de m-versie heeft ingebouwde multimodale diep redeneringscapaciteiten), dat uitblinkt in wiskunde, programmeren, wetenschappelijke redenering en creatieve schrijfopdrachten, en in verschillende autoritaire benchmarks zoals AIME 2024, Codeforces, GPQA, het niveau van de top van de industrie bereikt of benadert. Ondersteunt een contextvenster van 128k en 16k output."
|
||||
},
|
||||
"Doubao-1.5-thinking-vision-pro": {
|
||||
"description": "Een nieuw visueel diepdenkend model, met sterkere algemene multimodale begrip- en redeneringscapaciteiten, dat SOTA-prestaties behaalt op 37 van de 59 openbare evaluatiestandaarden."
|
||||
},
|
||||
"Doubao-1.5-vision-pro": {
|
||||
"description": "Doubao-1.5-vision-pro is een nieuw geüpgradede multimodale groot model, dat ondersteuning biedt voor beeldherkenning met willekeurige resoluties en extreme beeldverhoudingen, en de visuele redenering, documentherkenning, begrip van gedetailleerde informatie en het volgen van instructies verbetert."
|
||||
},
|
||||
"Doubao-1.5-vision-pro-32k": {
|
||||
"description": "Doubao-1.5-vision-pro is een nieuw geüpgraded multimodaal groot model, dat ondersteuning biedt voor beeldherkenning met willekeurige resoluties en extreme beeldverhoudingen, en de visuele redenering, documentherkenning, begrip van gedetailleerde informatie en het volgen van instructies verbetert."
|
||||
},
|
||||
"Doubao-lite-128k": {
|
||||
"description": "Doubao-lite beschikt over een uitstekende responssnelheid en een goede prijs-kwaliteitverhouding, en biedt klanten flexibele keuzes voor verschillende scenario's. Ondersteunt inferentie en fine-tuning met een contextvenster van 128k."
|
||||
"description": "Doubao-lite biedt een ultieme responssnelheid en een betere prijs-kwaliteitverhouding, waardoor het flexibele keuzes biedt voor verschillende klantenscenario's. Ondersteunt redeneren en fijn afstemmen met een contextvenster van 128k."
|
||||
},
|
||||
"Doubao-lite-32k": {
|
||||
"description": "Doubao-lite beschikt over een uitstekende responssnelheid en een goede prijs-kwaliteitverhouding, en biedt klanten flexibele keuzes voor verschillende scenario's. Ondersteunt inferentie en fine-tuning met een contextvenster van 32k."
|
||||
"description": "Doubao-lite biedt een ultieme responssnelheid en een betere prijs-kwaliteitverhouding, waardoor het flexibele keuzes biedt voor verschillende klantenscenario's. Ondersteunt redeneren en fijn afstemmen met een contextvenster van 32k."
|
||||
},
|
||||
"Doubao-lite-4k": {
|
||||
"description": "Doubao-lite beschikt over een uitstekende responssnelheid en een goede prijs-kwaliteitverhouding, en biedt klanten flexibele keuzes voor verschillende scenario's. Ondersteunt inferentie en fine-tuning met een contextvenster van 4k."
|
||||
"description": "Doubao-lite biedt een ultieme responssnelheid en een betere prijs-kwaliteitverhouding, waardoor het flexibele keuzes biedt voor verschillende klantenscenario's. Ondersteunt redeneren en fijn afstemmen met een contextvenster van 4k."
|
||||
},
|
||||
"Doubao-pro-128k": {
|
||||
"description": "Het meest effectieve hoofmodel, geschikt voor het verwerken van complexe taken, met goede resultaten in referentievraag, samenvattingen, creatie, tekstclassificatie, rollenspellen en meer. Ondersteunt inferentie en fine-tuning met een contextvenster van 128k."
|
||||
},
|
||||
"Doubao-pro-256k": {
|
||||
"description": "Het beste hoofdmachine model, geschikt voor het verwerken van complexe taken, met goede prestaties in referentievraag- en antwoordsituaties, samenvattingen, creatie, tekstclassificatie, rollenspellen, enz. Ondersteunt redenering en fine-tuning met een contextvenster van 256k."
|
||||
"description": "Het beste hoofdmodel, geschikt voor het verwerken van complexe taken, met uitstekende prestaties in scenario's zoals referentievragen, samenvattingen, creatief schrijven, tekstclassificatie en rollenspellen. Ondersteunt redeneren en fijn afstemmen met een contextvenster van 128k."
|
||||
},
|
||||
"Doubao-pro-32k": {
|
||||
"description": "Het meest effectieve hoofmodel, geschikt voor het verwerken van complexe taken, met goede resultaten in referentievraag, samenvattingen, creatie, tekstclassificatie, rollenspellen en meer. Ondersteunt inferentie en fine-tuning met een contextvenster van 32k."
|
||||
"description": "Het beste hoofdmodel, geschikt voor het verwerken van complexe taken, met uitstekende prestaties in scenario's zoals referentievragen, samenvattingen, creatief schrijven, tekstclassificatie en rollenspellen. Ondersteunt redeneren en fijn afstemmen met een contextvenster van 32k."
|
||||
},
|
||||
"Doubao-pro-4k": {
|
||||
"description": "Het meest effectieve hoofmodel, geschikt voor het verwerken van complexe taken, met goede resultaten in referentievraag, samenvattingen, creatie, tekstclassificatie, rollenspellen en meer. Ondersteunt inferentie en fine-tuning met een contextvenster van 4k."
|
||||
},
|
||||
"Doubao-vision-lite-32k": {
|
||||
"description": "Het Doubao-vision model is een multimodaal groot model dat door Doubao is geïntroduceerd, met krachtige mogelijkheden voor beeldbegrip en redenering, evenals nauwkeurige instructiebegrip. Het model heeft sterke prestaties getoond in het extraheren van tekstinformatie uit afbeeldingen en op afbeeldingen gebaseerde redeneringstaken, en kan worden toegepast op complexere en bredere visuele vraag- en antwoordsituaties."
|
||||
},
|
||||
"Doubao-vision-pro-32k": {
|
||||
"description": "Het Doubao-vision model is een multimodaal groot model dat door Doubao is geïntroduceerd, met krachtige mogelijkheden voor beeldbegrip en redenering, evenals nauwkeurige instructiebegrip. Het model heeft sterke prestaties getoond in het extraheren van tekstinformatie uit afbeeldingen en op afbeeldingen gebaseerde redeneringstaken, en kan worden toegepast op complexere en bredere visuele vraag- en antwoordsituaties."
|
||||
"description": "Het beste hoofdmodel, geschikt voor het verwerken van complexe taken, met uitstekende prestaties in scenario's zoals referentievragen, samenvattingen, creatief schrijven, tekstclassificatie en rollenspellen. Ondersteunt redeneren en fijn afstemmen met een contextvenster van 4k."
|
||||
},
|
||||
"ERNIE-3.5-128K": {
|
||||
"description": "De door Baidu ontwikkelde vlaggenschip grote taalmodel, dat een enorme hoeveelheid Chinese en Engelse gegevens dekt, met krachtige algemene capaciteiten die voldoen aan de meeste eisen voor dialoogvragen, creatieve generatie en plug-in toepassingsscenario's; ondersteunt automatische integratie met de Baidu zoekplug-in, wat de actualiteit van vraag- en antwoordinformatie waarborgt."
|
||||
@@ -224,24 +203,21 @@
|
||||
"Pro/Qwen/Qwen2.5-VL-7B-Instruct": {
|
||||
"description": "Qwen2.5-VL is een nieuw lid van de Qwen-serie, met krachtige visuele inzichtscapaciteiten. Het kan tekst, grafieken en lay-outs in afbeeldingen analyseren en langere video's begrijpen en gebeurtenissen vastleggen. Het kan redeneren en tools bedienen, ondersteunt multi-formaat objectlocalisatie en structuuroutput genereren. De video-begripstraining is geoptimaliseerd voor dynamische resolutie en framesnelheid, en de efficiëntie van de visuele encoder is verbeterd."
|
||||
},
|
||||
"Pro/THUDM/GLM-4.1V-9B-Thinking": {
|
||||
"description": "GLM-4.1V-9B-Thinking is een open source visueel-taalmodel (VLM) dat gezamenlijk is uitgebracht door Zhipu AI en het KEG-laboratorium van de Tsinghua Universiteit. Het is speciaal ontworpen voor het verwerken van complexe multimodale cognitieve taken. Dit model is gebaseerd op het GLM-4-9B-0414 basismodel en verbetert aanzienlijk de crossmodale redeneercapaciteiten en stabiliteit door de introductie van een 'Chain-of-Thought' redeneermethode en het gebruik van versterkend leren."
|
||||
},
|
||||
"Pro/THUDM/glm-4-9b-chat": {
|
||||
"description": "GLM-4-9B-Chat is de open-source versie van het GLM-4-serie voorgetrainde model, gelanceerd door Zhipu AI. Dit model presteert uitstekend in semantiek, wiskunde, redenering, code en kennis. Naast ondersteuning voor meerdaagse gesprekken, beschikt GLM-4-9B-Chat ook over geavanceerde functies zoals webbrowser, code-uitvoering, aangepaste tool-aanroepen (Function Call) en lange tekstredenering. Het model ondersteunt 26 talen, waaronder Chinees, Engels, Japans, Koreaans en Duits. In verschillende benchmarktests toont GLM-4-9B-Chat uitstekende prestaties, zoals AlignBench-v2, MT-Bench, MMLU en C-Eval. Dit model ondersteunt een maximale contextlengte van 128K, geschikt voor academisch onderzoek en commerciële toepassingen."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1": {
|
||||
"description": "DeepSeek-R1 is een inferentiemodel aangedreven door versterkend leren (RL), dat de problemen van herhaling en leesbaarheid in modellen aanpakt. Voor RL introduceert DeepSeek-R1 koude startdata, wat de inferentieprestaties verder optimaliseert. Het presteert vergelijkbaar met OpenAI-o1 in wiskunde, code en inferentietaken, en verbetert de algehele effectiviteit door zorgvuldig ontworpen trainingsmethoden."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1-0120": {
|
||||
"description": "DeepSeek-R1 is een door versterkend leren (RL) aangedreven redeneermodel dat problemen met herhaling en leesbaarheid in modellen aanpakt. Voor RL introduceert DeepSeek-R1 cold-start data om de redeneerprestaties verder te optimaliseren. Het presteert vergelijkbaar met OpenAI-o1 in wiskunde, code en redeneertaken en verbetert de algehele effectiviteit door zorgvuldig ontworpen trainingsmethoden."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B": {
|
||||
"description": "DeepSeek-R1-Distill-Qwen-7B is een model dat is afgeleid van Qwen2.5-Math-7B door middel van kennisdistillatie. Dit model is fijn afgesteld met 800.000 zorgvuldig geselecteerde voorbeelden die zijn gegenereerd door DeepSeek-R1, waardoor het uitstekende inferentiecapaciteiten vertoont. Het presteert goed op verschillende benchmarks, met een nauwkeurigheid van 92,8% op MATH-500, een doorlooptarief van 55,5% op AIME 2024 en een score van 1189 op CodeForces. Als een model van 7B schaal toont het sterke wiskundige en programmeringvaardigheden."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-V3": {
|
||||
"description": "DeepSeek-V3 is een hybride expert (MoE) taalmodel met 6710 miljard parameters, dat gebruikmaakt van multi-head latent attention (MLA) en de DeepSeekMoE-architectuur, gecombineerd met een load balancing-strategie zonder extra verlies, om de inferentie- en trainingsefficiëntie te optimaliseren. Door voorgetraind te worden op 14,8 biljoen hoogwaardige tokens en vervolgens te worden fijngesteld met supervisie en versterkend leren, overtreft DeepSeek-V3 andere open-source modellen in prestaties en komt het dicht in de buurt van toonaangevende gesloten modellen."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-V3-1226": {
|
||||
"description": "DeepSeek-V3 is een hybride expert (MoE) taalmodel met 6710 miljard parameters, dat gebruikmaakt van multi-head latent attention (MLA) en de DeepSeekMoE-architectuur, gecombineerd met een load balancing strategie zonder extra verlies, om de efficiëntie van inferentie en training te optimaliseren. Door voorgetraind te worden op 14,8 biljoen hoogwaardige tokens en vervolgens te worden verfijnd met supervisie en versterkend leren, overtreft DeepSeek-V3 andere open-source modellen in prestaties en benadert het de toonaangevende gesloten-source modellen."
|
||||
},
|
||||
"QwQ-32B-Preview": {
|
||||
"description": "QwQ-32B-Preview is een innovatief natuurlijk taalverwerkingsmodel dat efficiënt complexe dialooggeneratie en contextbegripstaken kan verwerken."
|
||||
},
|
||||
@@ -404,6 +380,9 @@
|
||||
"THUDM/GLM-4-9B-0414": {
|
||||
"description": "GLM-4-9B-0414 is een klein model uit de GLM-serie met 9 miljard parameters. Dit model erft de technische kenmerken van de GLM-4-32B-serie, maar biedt een lichtere implementatieoptie. Ondanks de kleinere schaal toont GLM-4-9B-0414 nog steeds uitstekende capaciteiten in taken zoals codegeneratie, webdesign, SVG-graphics generatie en op zoek gebaseerde schrijfopdrachten."
|
||||
},
|
||||
"THUDM/GLM-4.1V-9B-Thinking": {
|
||||
"description": "GLM-4.1V-9B-Thinking is een open source visueel-taalmodel (VLM) dat gezamenlijk is uitgebracht door Zhipu AI en het KEG-laboratorium van de Tsinghua Universiteit. Het is speciaal ontworpen voor het verwerken van complexe multimodale cognitieve taken. Dit model is gebaseerd op het GLM-4-9B-0414 basismodel en verbetert aanzienlijk de crossmodale redeneercapaciteiten en stabiliteit door de introductie van een 'Chain-of-Thought' redeneermethode en het gebruik van versterkend leren."
|
||||
},
|
||||
"THUDM/GLM-Z1-32B-0414": {
|
||||
"description": "GLM-Z1-32B-0414 is een redeneringsmodel met diep denkvermogen. Dit model is ontwikkeld op basis van GLM-4-32B-0414 door middel van koude start en versterkend leren, en is verder getraind op wiskunde, code en logische taken. In vergelijking met het basismodel heeft GLM-Z1-32B-0414 aanzienlijke verbeteringen in wiskundige vaardigheden en het oplossen van complexe taken."
|
||||
},
|
||||
@@ -560,6 +539,9 @@
|
||||
"anthropic/claude-sonnet-4": {
|
||||
"description": "Claude Sonnet 4 kan bijna onmiddellijke reacties genereren of uitgebreide stapsgewijze overwegingen, waarbij gebruikers deze processen duidelijk kunnen volgen. API-gebruikers kunnen ook de denktijd van het model nauwkeurig regelen."
|
||||
},
|
||||
"ascend-tribe/pangu-pro-moe": {
|
||||
"description": "Pangu-Pro-MoE 72B-A16B is een sparsely activated groot taalmodel met 72 miljard parameters en 16 miljard geactiveerde parameters. Het is gebaseerd op de Group Mixture of Experts (MoGE) architectuur, waarbij experts worden gegroepeerd tijdens de selectie en tokens binnen elke groep een gelijk aantal experts activeren, wat zorgt voor een gebalanceerde expertbelasting en de efficiëntie van modelimplementatie op het Ascend-platform aanzienlijk verbetert."
|
||||
},
|
||||
"aya": {
|
||||
"description": "Aya 23 is een meertalig model van Cohere, ondersteunt 23 talen en biedt gemak voor diverse taaltoepassingen."
|
||||
},
|
||||
@@ -569,6 +551,9 @@
|
||||
"baichuan/baichuan2-13b-chat": {
|
||||
"description": "Baichuan-13B is een open-source, commercieel bruikbaar groot taalmodel ontwikkeld door Baichuan Intelligent, met 13 miljard parameters, dat de beste prestaties in zijn klasse heeft behaald op gezaghebbende Chinese en Engelse benchmarks."
|
||||
},
|
||||
"baidu/ERNIE-4.5-300B-A47B": {
|
||||
"description": "ERNIE-4.5-300B-A47B is een groot taalmodel ontwikkeld door Baidu, gebaseerd op een hybride expert (MoE) architectuur. Het model heeft in totaal 300 miljard parameters, maar activeert slechts 47 miljard parameters per token tijdens inferentie, wat krachtige prestaties combineert met rekenefficiëntie. Als een kernmodel van de ERNIE 4.5-serie toont het uitstekende capaciteiten in tekstbegrip, generatie, redenering en programmeren. Het model gebruikt een innovatieve multimodale heterogene MoE pre-trainingsmethode, waarbij tekst- en visuele modaliteiten gezamenlijk worden getraind, wat de algehele prestaties verbetert, vooral in instructienaleving en wereldkennis."
|
||||
},
|
||||
"c4ai-aya-expanse-32b": {
|
||||
"description": "Aya Expanse is een hoogwaardig 32B meertalig model, ontworpen om de prestaties van eentalige modellen uit te dagen door middel van instructietuning, data-arbitrage, voorkeurstraining en modelintegratie. Het ondersteunt 23 talen."
|
||||
},
|
||||
@@ -666,7 +651,7 @@
|
||||
"description": "Codestral is een geavanceerd generatief model dat zich richt op codegeneratie, geoptimaliseerd voor tussentijdse invulling en code-aanvultaken."
|
||||
},
|
||||
"codex-mini-latest": {
|
||||
"description": "codex-mini-latest is een verfijnde versie van o4-mini, speciaal ontworpen voor Codex CLI. Voor direct gebruik via de API raden we aan te beginnen met gpt-4.1."
|
||||
"description": "codex-mini-latest is een fijn afgestemde versie van o4-mini, speciaal ontworpen voor Codex CLI. Voor direct gebruik via de API raden we aan te beginnen met gpt-4.1."
|
||||
},
|
||||
"cognitivecomputations/dolphin-mixtral-8x22b": {
|
||||
"description": "Dolphin Mixtral 8x22B is een model ontworpen voor instructievolging, gesprekken en programmeren."
|
||||
@@ -914,9 +899,39 @@
|
||||
"doubao-1.5-thinking-pro": {
|
||||
"description": "Doubao-1.5 is een gloednieuw diepdenkend model dat uitblinkt in professionele gebieden zoals wiskunde, programmeren en wetenschappelijk redeneren, evenals in algemene taken zoals creatief schrijven. Het heeft op verschillende prestigieuze benchmarks zoals AIME 2024, Codeforces en GPQA niveaus bereikt die gelijk zijn aan of dicht bij de top van de industrie liggen. Ondersteunt een contextvenster van 128k en een output van 16k."
|
||||
},
|
||||
"doubao-1.5-thinking-pro-m": {
|
||||
"description": "Doubao-1.5 is een gloednieuw diepdenkend model (m-versie met native multimodale diepe redeneercapaciteiten), dat uitblinkt in vakgebieden zoals wiskunde, programmeren, wetenschappelijke redenering en creatieve schrijfopdrachten. Het behaalt of benadert de top van de industrie op gerenommeerde benchmarks zoals AIME 2024, Codeforces en GPQA. Ondersteunt een contextvenster van 128k en output van 16k."
|
||||
},
|
||||
"doubao-1.5-thinking-vision-pro": {
|
||||
"description": "Een nieuw visueel diepdenkend model met sterkere algemene multimodale begrip- en redeneercapaciteiten, dat op 37 van de 59 openbare benchmarktests SOTA-prestaties behaalt."
|
||||
},
|
||||
"doubao-1.5-ui-tars": {
|
||||
"description": "Doubao-1.5-UI-TARS is een native agentmodel gericht op grafische gebruikersinterface (GUI) interactie. Het biedt mensachtige capaciteiten zoals waarnemen, redeneren en handelen voor naadloze interactie met GUI's."
|
||||
},
|
||||
"doubao-1.5-vision-lite": {
|
||||
"description": "Doubao-1.5-vision-lite is een nieuw geüpgradede multimodale groot model, dat ondersteuning biedt voor beeldherkenning met willekeurige resoluties en extreme beeldverhoudingen, en de visuele redenering, documentherkenning, begrip van gedetailleerde informatie en het volgen van instructies verbetert. Ondersteunt een contextvenster van 128k en een maximale outputlengte van 16k tokens."
|
||||
},
|
||||
"doubao-1.5-vision-pro": {
|
||||
"description": "Doubao-1.5-vision-pro is een nieuw geüpgraded multimodaal groot model dat beeldherkenning ondersteunt met elke resolutie en extreme beeldverhoudingen, en verbeterde visuele redenering, documentherkenning, detailbegrip en instructienaleving biedt."
|
||||
},
|
||||
"doubao-1.5-vision-pro-32k": {
|
||||
"description": "Doubao-1.5-vision-pro is een nieuw geüpgraded multimodaal groot model dat beeldherkenning ondersteunt met elke resolutie en extreme beeldverhoudingen, en verbeterde visuele redenering, documentherkenning, detailbegrip en instructienaleving biedt."
|
||||
},
|
||||
"doubao-lite-128k": {
|
||||
"description": "Biedt ultieme responssnelheid en een betere prijs-kwaliteitverhouding, met flexibele keuzes voor verschillende klantenscenario's. Ondersteunt redeneren en fijn afstemmen met een contextvenster van 128k."
|
||||
},
|
||||
"doubao-lite-32k": {
|
||||
"description": "Biedt ultieme responssnelheid en een betere prijs-kwaliteitverhouding, met flexibele keuzes voor verschillende klantenscenario's. Ondersteunt redeneren en fijn afstemmen met een contextvenster van 32k."
|
||||
},
|
||||
"doubao-lite-4k": {
|
||||
"description": "Biedt ultieme responssnelheid en een betere prijs-kwaliteitverhouding, met flexibele keuzes voor verschillende klantenscenario's. Ondersteunt redeneren en fijn afstemmen met een contextvenster van 4k."
|
||||
},
|
||||
"doubao-pro-256k": {
|
||||
"description": "Het beste hoofdmodel, geschikt voor het verwerken van complexe taken, met uitstekende prestaties in scenario's zoals referentievragen, samenvattingen, creatief schrijven, tekstclassificatie en rollenspellen. Ondersteunt redeneren en fijn afstemmen met een contextvenster van 256k."
|
||||
},
|
||||
"doubao-pro-32k": {
|
||||
"description": "Het beste hoofdmodel, geschikt voor het verwerken van complexe taken, met uitstekende prestaties in scenario's zoals referentievragen, samenvattingen, creatief schrijven, tekstclassificatie en rollenspellen. Ondersteunt redeneren en fijn afstemmen met een contextvenster van 32k."
|
||||
},
|
||||
"doubao-seed-1.6": {
|
||||
"description": "Doubao-Seed-1.6 is een gloednieuw multimodaal diepdenkend model dat drie denkwijzen ondersteunt: auto, thinking en non-thinking. In de non-thinking modus is de modelprestatie aanzienlijk verbeterd ten opzichte van Doubao-1.5-pro/250115. Ondersteunt een contextvenster van 256k en een maximale uitvoerlengte van 16k tokens."
|
||||
},
|
||||
@@ -924,7 +939,13 @@
|
||||
"description": "Doubao-Seed-1.6-flash is een multimodaal diepdenkend model met extreem snelle inferentiesnelheid, TPOT slechts 10ms; ondersteunt zowel tekst- als visueel begrip, met tekstbegrip dat beter is dan de vorige lite-generatie en visueel begrip dat vergelijkbaar is met concurrerende pro-serie modellen. Ondersteunt een contextvenster van 256k en een maximale uitvoerlengte van 16k tokens."
|
||||
},
|
||||
"doubao-seed-1.6-thinking": {
|
||||
"description": "Doubao-Seed-1.6-thinking model heeft sterk verbeterde denkvermogens. Vergeleken met Doubao-1.5-thinking-pro zijn de basisvaardigheden in coderen, wiskunde en logisch redeneren verder verbeterd, met ondersteuning voor visueel begrip. Ondersteunt een contextvenster van 256k en een maximale uitvoerlengte van 16k tokens."
|
||||
"description": "Doubao-Seed-1.6-thinking model heeft sterk verbeterde denkvermogens, met verdere verbeteringen in basisvaardigheden zoals coderen, wiskunde en logisch redeneren ten opzichte van Doubao-1.5-thinking-pro, en ondersteunt visueel begrip. Ondersteunt een contextvenster van 256k en een maximale uitvoerlengte van 16k tokens."
|
||||
},
|
||||
"doubao-vision-lite-32k": {
|
||||
"description": "Het Doubao-vision model is een multimodaal groot model van Doubao met krachtige beeldbegrip- en redeneercapaciteiten, evenals nauwkeurige instructiebegrip. Het model presteert sterk bij het extraheren van beeld- en tekstinformatie en bij beeldgebaseerde redeneertaken, en is toepasbaar op complexere en bredere visuele vraag-en-antwoord scenario's."
|
||||
},
|
||||
"doubao-vision-pro-32k": {
|
||||
"description": "Het Doubao-vision model is een multimodaal groot model van Doubao met krachtige beeldbegrip- en redeneercapaciteiten, evenals nauwkeurige instructiebegrip. Het model presteert sterk bij het extraheren van beeld- en tekstinformatie en bij beeldgebaseerde redeneertaken, en is toepasbaar op complexere en bredere visuele vraag-en-antwoord scenario's."
|
||||
},
|
||||
"emohaa": {
|
||||
"description": "Emohaa is een psychologisch model met professionele adviescapaciteiten, dat gebruikers helpt emotionele problemen te begrijpen."
|
||||
@@ -1082,9 +1103,6 @@
|
||||
"gemini-2.5-pro": {
|
||||
"description": "Gemini 2.5 Pro is het meest geavanceerde denkmodel van Google, in staat om complexe problemen op het gebied van code, wiskunde en STEM te redeneren, en grote datasets, codebases en documenten te analyseren met lange context."
|
||||
},
|
||||
"gemini-2.5-pro-exp-03-25": {
|
||||
"description": "Gemini 2.5 Pro Experimental is Google's meest geavanceerde denkmodel, dat in staat is om te redeneren over complexe problemen in code, wiskunde en STEM-gebieden, en bovendien gebruik maakt van lange contexten om grote datasets, codebases en documenten te analyseren."
|
||||
},
|
||||
"gemini-2.5-pro-preview-03-25": {
|
||||
"description": "Gemini 2.5 Pro Preview is Google's meest geavanceerde denkmodel, dat in staat is om te redeneren over complexe problemen in code, wiskunde en STEM-gebieden, en grote datasets, codebases en documenten te analyseren met behulp van lange context."
|
||||
},
|
||||
@@ -1151,6 +1169,12 @@
|
||||
"glm-4-plus": {
|
||||
"description": "GLM-4-Plus, als vlaggenschip van hoge intelligentie, heeft krachtige capaciteiten voor het verwerken van lange teksten en complexe taken, met algehele prestatieverbeteringen."
|
||||
},
|
||||
"glm-4.1v-thinking-flash": {
|
||||
"description": "De GLM-4.1V-Thinking serie modellen zijn momenteel de krachtigste visuele modellen binnen de bekende 10 miljard parameter VLM's. Ze integreren state-of-the-art visuele-taaltaakprestaties op hetzelfde niveau, waaronder videoverwerking, beeldvraag-antwoordsystemen, vakinhoudelijke probleemoplossing, OCR-tekstherkenning, document- en grafiekanalyse, GUI-agenten, frontend webcodering en grounding. De capaciteiten van meerdere taken overtreffen zelfs die van Qwen2.5-VL-72B met acht keer zoveel parameters. Door geavanceerde versterkend leren technologie beheerst het model chain-of-thought redenering om de nauwkeurigheid en rijkdom van antwoorden te verbeteren, wat resulteert in aanzienlijk betere eindresultaten en interpretatie dan traditionele niet-thinking modellen."
|
||||
},
|
||||
"glm-4.1v-thinking-flashx": {
|
||||
"description": "De GLM-4.1V-Thinking serie modellen zijn momenteel de krachtigste visuele modellen binnen de bekende 10 miljard parameter VLM's. Ze integreren state-of-the-art visuele-taaltaakprestaties op hetzelfde niveau, waaronder videoverwerking, beeldvraag-antwoordsystemen, vakinhoudelijke probleemoplossing, OCR-tekstherkenning, document- en grafiekanalyse, GUI-agenten, frontend webcodering en grounding. De capaciteiten van meerdere taken overtreffen zelfs die van Qwen2.5-VL-72B met acht keer zoveel parameters. Door geavanceerde versterkend leren technologie beheerst het model chain-of-thought redenering om de nauwkeurigheid en rijkdom van antwoorden te verbeteren, wat resulteert in aanzienlijk betere eindresultaten en interpretatie dan traditionele niet-thinking modellen."
|
||||
},
|
||||
"glm-4v": {
|
||||
"description": "GLM-4V biedt krachtige beeldbegrip- en redeneercapaciteiten, ondersteunt verschillende visuele taken."
|
||||
},
|
||||
@@ -1172,6 +1196,9 @@
|
||||
"glm-z1-flash": {
|
||||
"description": "De GLM-Z1 serie beschikt over krachtige complexe redeneringscapaciteiten en presteert uitstekend in logische redenering, wiskunde en programmeren. De maximale contextlengte is 32K."
|
||||
},
|
||||
"glm-z1-flashx": {
|
||||
"description": "Snel en betaalbaar: Flash verbeterde versie met ultrahoge inferentiesnelheid en snellere gelijktijdige verwerking."
|
||||
},
|
||||
"glm-zero-preview": {
|
||||
"description": "GLM-Zero-Preview heeft krachtige complexe redeneercapaciteiten en presteert uitstekend in logische redenering, wiskunde en programmeren."
|
||||
},
|
||||
@@ -1223,6 +1250,9 @@
|
||||
"google/gemma-2b-it": {
|
||||
"description": "Gemma Instruct (2B) biedt basis instructieverwerkingscapaciteiten, geschikt voor lichte toepassingen."
|
||||
},
|
||||
"google/gemma-3-1b-it": {
|
||||
"description": "Gemma 3 1B is een open source taalmodel van Google dat nieuwe standaarden zet op het gebied van efficiëntie en prestaties."
|
||||
},
|
||||
"google/gemma-3-27b-it": {
|
||||
"description": "Gemma 3 27B is een open-source taalmodel van Google dat nieuwe normen heeft gesteld op het gebied van efficiëntie en prestaties."
|
||||
},
|
||||
@@ -1313,6 +1343,9 @@
|
||||
"gpt-4o-mini-search-preview": {
|
||||
"description": "GPT-4o mini zoekpreview is een model dat speciaal is getraind om webzoekopdrachten te begrijpen en uit te voeren, gebruikmakend van de Chat Completions API. Naast tokenkosten worden webzoekopdrachten ook per toolaanroep in rekening gebracht."
|
||||
},
|
||||
"gpt-4o-mini-transcribe": {
|
||||
"description": "GPT-4o Mini Transcribe is een spraak-naar-tekstmodel dat GPT-4o gebruikt voor audiotranscriptie. Vergeleken met het originele Whisper-model verbetert het de woordfoutpercentage en verhoogt het de taalherkenning en nauwkeurigheid. Gebruik het voor nauwkeurigere transcripties."
|
||||
},
|
||||
"gpt-4o-mini-tts": {
|
||||
"description": "GPT-4o mini TTS is een tekst-naar-spraak model dat is gebaseerd op GPT-4o mini, en biedt hoge kwaliteit spraakgeneratie tegen een lagere prijs."
|
||||
},
|
||||
@@ -1322,12 +1355,15 @@
|
||||
"gpt-4o-realtime-preview-2024-10-01": {
|
||||
"description": "GPT-4o realtime versie, ondersteunt audio en tekst realtime invoer en uitvoer."
|
||||
},
|
||||
"gpt-4o-realtime-preview-2024-12-17": {
|
||||
"description": "GPT-4o realtime versie, ondersteunt audio en tekst realtime invoer en uitvoer."
|
||||
"gpt-4o-realtime-preview-2025-06-03": {
|
||||
"description": "GPT-4o realtime versie, ondersteunt realtime audio- en tekstinvoer en -uitvoer."
|
||||
},
|
||||
"gpt-4o-search-preview": {
|
||||
"description": "GPT-4o zoekpreview is een model dat speciaal is getraind om webzoekopdrachten te begrijpen en uit te voeren, gebruikmakend van de Chat Completions API. Naast tokenkosten worden webzoekopdrachten ook per toolaanroep in rekening gebracht."
|
||||
},
|
||||
"gpt-4o-transcribe": {
|
||||
"description": "GPT-4o Transcribe is een spraak-naar-tekstmodel dat GPT-4o gebruikt voor audiotranscriptie. Vergeleken met het originele Whisper-model verbetert het de woordfoutpercentage en verhoogt het de taalherkenning en nauwkeurigheid. Gebruik het voor nauwkeurigere transcripties."
|
||||
},
|
||||
"grok-2-1212": {
|
||||
"description": "Dit model heeft verbeteringen aangebracht in nauwkeurigheid, instructievolging en meertalige capaciteiten."
|
||||
},
|
||||
@@ -1346,9 +1382,15 @@
|
||||
"grok-3-mini-fast": {
|
||||
"description": "Lichtgewicht model dat eerst nadenkt voor het reageren. Snel en intelligent, geschikt voor logische taken zonder diepgaande domeinkennis en kan de oorspronkelijke denkprocessen vastleggen."
|
||||
},
|
||||
"grok-4": {
|
||||
"description": "Ons nieuwste en krachtigste vlaggenschipmodel, uitmuntend in natuurlijke taalverwerking, wiskundige berekeningen en redeneren — een perfecte allrounder."
|
||||
},
|
||||
"gryphe/mythomax-l2-13b": {
|
||||
"description": "MythoMax l2 13B is een taalmodel dat creativiteit en intelligentie combineert door meerdere topmodellen te integreren."
|
||||
},
|
||||
"hunyuan-a13b": {
|
||||
"description": "Hunyuan's eerste hybride redeneermodel, een upgrade van hun hunyuan-standard-256K, met in totaal 80 miljard parameters en 13 miljard geactiveerde parameters. Standaard werkt het in een langzame denkwijze, maar ondersteunt schakeling tussen snelle en langzame denkwijzen via parameters of instructies, waarbij de snelle/langzame wisseling wordt geactiveerd door het toevoegen van 'query' of 'no_think' vooraf. De algehele capaciteiten zijn aanzienlijk verbeterd ten opzichte van de vorige generatie, vooral op het gebied van wiskunde, wetenschap, lange tekstbegrip en agentfunctionaliteit."
|
||||
},
|
||||
"hunyuan-code": {
|
||||
"description": "Het nieuwste codegeneratiemodel van Hunyuan, getraind op 200B hoogwaardige codegegevens, met een half jaar training op hoogwaardige SFT-gegevens, met een vergroot contextvenster van 8K, en staat bovenaan de automatische evaluatie-indicatoren voor codegeneratie in vijf grote programmeertalen; presteert in de eerste divisie op basis van handmatige kwaliteitsbeoordelingen van 10 aspecten van code-taken in vijf grote talen."
|
||||
},
|
||||
@@ -1400,6 +1442,9 @@
|
||||
"hunyuan-t1-vision": {
|
||||
"description": "Hunyuan multimodaal begrip en diepdenkend model, ondersteunt native multimodale lange-denk-ketens, excelleert in diverse beeldredeneerscenario's en verbetert aanzienlijk ten opzichte van snelle denkers bij exacte wetenschappen."
|
||||
},
|
||||
"hunyuan-t1-vision-20250619": {
|
||||
"description": "De nieuwste versie van Hunyuan's t1-vision multimodale diepdenkende model, ondersteunt native lange chain-of-thought in multimodale contexten en biedt een algehele verbetering ten opzichte van de vorige standaardversie."
|
||||
},
|
||||
"hunyuan-turbo": {
|
||||
"description": "Een previewversie van het nieuwe generatie grote taalmodel van Hunyuan, met een nieuwe hybride expertmodel (MoE) structuur, die sneller inferentie-efficiëntie biedt en betere prestaties levert dan hunyan-pro."
|
||||
},
|
||||
@@ -1430,6 +1475,12 @@
|
||||
"hunyuan-turbos-role-plus": {
|
||||
"description": "De nieuwste versie van het Hunyuan rollenspelmodel, officieel fijngetuned door Hunyuan, getraind met datasets voor rollenspelscenario's, biedt betere basisprestaties in rollenspelsituaties."
|
||||
},
|
||||
"hunyuan-turbos-vision": {
|
||||
"description": "Dit model is geschikt voor beeld- en tekstbegripsscenario's en is gebaseerd op Hunyuan's nieuwste turbos, een nieuwe generatie vlaggenschip visueel-taalmodel dat zich richt op taken zoals entiteitsherkenning op basis van afbeeldingen, kennisvraag-antwoordsystemen, copywriting en foto-gebaseerde probleemoplossing. Het biedt een algehele verbetering ten opzichte van de vorige generatie modellen."
|
||||
},
|
||||
"hunyuan-turbos-vision-20250619": {
|
||||
"description": "De nieuwste versie van Hunyuan's turbos-vision vlaggenschip visueel-taalmodel, met algehele verbeteringen in taken gerelateerd aan beeld- en tekstbegrip, waaronder entiteitsherkenning op basis van afbeeldingen, kennisvraag-antwoordsystemen, copywriting en foto-gebaseerde probleemoplossing, vergeleken met de vorige standaardversie."
|
||||
},
|
||||
"hunyuan-vision": {
|
||||
"description": "Het nieuwste multimodale model van Hunyuan, ondersteunt het genereren van tekstinhoud op basis van afbeelding + tekstinvoer."
|
||||
},
|
||||
@@ -1457,6 +1508,9 @@
|
||||
"jina-deepsearch-v1": {
|
||||
"description": "Diepe zoekopdrachten combineren webzoekopdrachten, lezen en redeneren voor een uitgebreide verkenning. Je kunt het beschouwen als een agent die jouw onderzoeksopdracht aanneemt - het zal een uitgebreide zoektocht uitvoeren en meerdere iteraties doorlopen voordat het een antwoord geeft. Dit proces omvat voortdurende onderzoek, redeneren en het oplossen van problemen vanuit verschillende invalshoeken. Dit is fundamenteel anders dan het rechtstreeks genereren van antwoorden uit voorgetrainde gegevens door standaard grote modellen en het vertrouwen op eenmalige oppervlakkige zoekopdrachten van traditionele RAG-systemen."
|
||||
},
|
||||
"kimi-k2-0711-preview": {
|
||||
"description": "kimi-k2 is een MoE-architectuurbasis model met krachtige codeer- en agentcapaciteiten, met in totaal 1 biljoen parameters en 32 miljard geactiveerde parameters. In benchmarktests voor algemene kennisredenering, programmeren, wiskunde en agenttaken overtreft het K2-model andere toonaangevende open-source modellen."
|
||||
},
|
||||
"kimi-latest": {
|
||||
"description": "Kimi slimme assistent product maakt gebruik van het nieuwste Kimi grote model, dat mogelijk nog niet stabiele functies bevat. Ondersteunt beeldbegrip en kiest automatisch het 8k/32k/128k model als factureringsmodel op basis van de lengte van de context van het verzoek."
|
||||
},
|
||||
@@ -1881,7 +1935,7 @@
|
||||
"description": "o3-mini is ons nieuwste kleine inferentiemodel dat hoge intelligentie biedt met dezelfde kosten- en vertragingdoelen als o1-mini."
|
||||
},
|
||||
"o3-pro": {
|
||||
"description": "Het o3-pro model gebruikt meer rekenkracht om dieper na te denken en altijd betere antwoorden te bieden, alleen ondersteund onder de Responses API."
|
||||
"description": "Het o3-pro model gebruikt meer rekenkracht om dieper na te denken en altijd betere antwoorden te bieden, alleen te gebruiken onder de Responses API."
|
||||
},
|
||||
"o4-mini": {
|
||||
"description": "o4-mini is ons nieuwste compacte model uit de o-serie. Het is geoptimaliseerd voor snelle en efficiënte inferentie, met een hoge efficiëntie en prestaties in codering en visuele taken."
|
||||
|
||||
@@ -520,6 +520,7 @@
|
||||
"hotkey": "Sneltoetsen",
|
||||
"llm": "Taalmodel",
|
||||
"provider": "AI-dienstverlener",
|
||||
"proxy": "Netwerkproxy",
|
||||
"storage": "Gegevensopslag",
|
||||
"sync": "Cloudsynchronisatie",
|
||||
"system-agent": "Systeemassistent",
|
||||
|
||||
@@ -46,6 +46,9 @@
|
||||
"reasoningEffort": {
|
||||
"title": "Intensywność rozumowania"
|
||||
},
|
||||
"thinking": {
|
||||
"title": "Przełącznik głębokiego myślenia"
|
||||
},
|
||||
"title": "Funkcje rozszerzenia modelu"
|
||||
},
|
||||
"history": {
|
||||
|
||||
@@ -1,4 +1,43 @@
|
||||
{
|
||||
"proxy": {
|
||||
"auth": "Wymagana autoryzacja",
|
||||
"authDesc": "Jeśli serwer proxy wymaga nazwy użytkownika i hasła",
|
||||
"authSettings": "Ustawienia uwierzytelniania",
|
||||
"basicSettings": "Ustawienia proxy",
|
||||
"basicSettingsDesc": "Konfiguracja parametrów połączenia serwera proxy",
|
||||
"bypass": "Adresy, które nie używają proxy",
|
||||
"connectionTest": "Test połączenia",
|
||||
"enable": "Włącz proxy",
|
||||
"enableDesc": "Po włączeniu dostęp do sieci będzie realizowany przez serwer proxy",
|
||||
"password": "Hasło",
|
||||
"password_placeholder": "Wprowadź hasło",
|
||||
"port": "Port",
|
||||
"resetButton": "Resetuj",
|
||||
"saveButton": "Zapisz",
|
||||
"saveFailed": "Zapis nie powiódł się: {{error}}",
|
||||
"saveSuccess": "Ustawienia proxy zostały pomyślnie zapisane",
|
||||
"server": "Adres serwera",
|
||||
"testButton": "Testuj połączenie",
|
||||
"testDescription": "Testuj połączenie za pomocą bieżącej konfiguracji proxy, aby zweryfikować poprawność ustawień",
|
||||
"testFailed": "Połączenie nie powiodło się",
|
||||
"testSuccessWithTime": "Test połączenia zakończony sukcesem, czas trwania {{time}} ms",
|
||||
"testUrl": "Adres testowy",
|
||||
"testUrlPlaceholder": "Wprowadź adres URL do przetestowania",
|
||||
"testing": "Testowanie połączenia...",
|
||||
"type": "Typ proxy",
|
||||
"unsavedChanges": "Masz niezapisane zmiany",
|
||||
"username": "Nazwa użytkownika",
|
||||
"username_placeholder": "Wprowadź nazwę użytkownika",
|
||||
"validation": {
|
||||
"passwordRequired": "Hasło jest wymagane, gdy uwierzytelnianie jest włączone",
|
||||
"portInvalid": "Port musi być liczbą z zakresu od 1 do 65535",
|
||||
"portRequired": "Port jest wymagany, gdy proxy jest włączone",
|
||||
"serverInvalid": "Wprowadź poprawny adres serwera (IP lub nazwa domeny)",
|
||||
"serverRequired": "Adres serwera jest wymagany, gdy proxy jest włączone",
|
||||
"typeRequired": "Typ proxy jest wymagany, gdy proxy jest włączone",
|
||||
"usernameRequired": "Nazwa użytkownika jest wymagana, gdy uwierzytelnianie jest włączone"
|
||||
}
|
||||
},
|
||||
"remoteServer": {
|
||||
"authError": "Błąd autoryzacji: {{error}}",
|
||||
"authPending": "Proszę zakończyć autoryzację w przeglądarce",
|
||||
|
||||
+98
-44
@@ -71,44 +71,23 @@
|
||||
"DeepSeek-V3": {
|
||||
"description": "DeepSeek-V3 to model MoE opracowany przez firmę DeepSeek. Wyniki DeepSeek-V3 w wielu testach przewyższają inne modele open source, takie jak Qwen2.5-72B i Llama-3.1-405B, a jego wydajność jest porównywalna z najlepszymi zamkniętymi modelami na świecie, takimi jak GPT-4o i Claude-3.5-Sonnet."
|
||||
},
|
||||
"Doubao-1.5-thinking-pro-m": {
|
||||
"description": "Doubao-1.5 to nowy model głębokiego myślenia (wersja m z wbudowaną natywną zdolnością do wielomodalnego wnioskowania), który wyróżnia się w dziedzinach takich jak matematyka, programowanie, wnioskowanie naukowe oraz twórcze pisanie, osiągając poziom bliski pierwszej ligi w wielu uznawanych benchmarkach, takich jak AIME 2024, Codeforces, GPQA. Wspiera okno kontekstowe 128k oraz 16k wyjścia."
|
||||
},
|
||||
"Doubao-1.5-thinking-vision-pro": {
|
||||
"description": "Nowy model głębokiego myślenia wizualnego, który ma silniejsze ogólne zdolności rozumienia multimodalnego i rozumowania, osiągając wyniki SOTA w 37 z 59 publicznych benchmarków."
|
||||
},
|
||||
"Doubao-1.5-vision-pro": {
|
||||
"description": "Doubao-1.5-vision-pro to nowo zaktualizowany model multimodalny, który obsługuje rozpoznawanie obrazów o dowolnej rozdzielczości i ekstremalnych proporcjach, wzmacniając zdolności wnioskowania wizualnego, rozpoznawania dokumentów, rozumienia szczegółowych informacji i przestrzegania instrukcji."
|
||||
},
|
||||
"Doubao-1.5-vision-pro-32k": {
|
||||
"description": "Doubao-1.5-vision-pro to nowa wersja ulepszonego modelu multimodalnego, który obsługuje rozpoznawanie obrazów o dowolnej rozdzielczości i ekstremalnych proporcjach, wzmacniając zdolności wnioskowania wizualnego, rozpoznawania dokumentów, rozumienia szczegółowych informacji oraz przestrzegania instrukcji."
|
||||
},
|
||||
"Doubao-lite-128k": {
|
||||
"description": "Doubao-lite cechuje się ekstremalną szybkością reakcji i lepszym stosunkiem jakości do ceny, oferując klientom elastyczność w różnych scenariuszach. Obsługuje wnioskowanie i dostosowywanie z kontekstem 128k."
|
||||
"description": "Doubao-lite oferuje niezwykle szybkie reakcje i lepszy stosunek jakości do ceny, zapewniając klientom elastyczne opcje dla różnych scenariuszy. Obsługuje wnioskowanie i dostrajanie z kontekstem do 128k."
|
||||
},
|
||||
"Doubao-lite-32k": {
|
||||
"description": "Doubao-lite cechuje się ekstremalną szybkością reakcji i lepszym stosunkiem jakości do ceny, oferując klientom elastyczność w różnych scenariuszach. Obsługuje wnioskowanie i dostosowywanie z kontekstem 32k."
|
||||
"description": "Doubao-lite oferuje niezwykle szybkie reakcje i lepszy stosunek jakości do ceny, zapewniając klientom elastyczne opcje dla różnych scenariuszy. Obsługuje wnioskowanie i dostrajanie z kontekstem do 32k."
|
||||
},
|
||||
"Doubao-lite-4k": {
|
||||
"description": "Doubao-lite cechuje się ekstremalną szybkością reakcji i lepszym stosunkiem jakości do ceny, oferując klientom elastyczność w różnych scenariuszach. Obsługuje wnioskowanie i dostosowywanie z kontekstem 4k."
|
||||
"description": "Doubao-lite oferuje niezwykle szybkie reakcje i lepszy stosunek jakości do ceny, zapewniając klientom elastyczne opcje dla różnych scenariuszy. Obsługuje wnioskowanie i dostrajanie z kontekstem do 4k."
|
||||
},
|
||||
"Doubao-pro-128k": {
|
||||
"description": "Model o najlepszych wynikach, odpowiedni do złożonych zadań, z doskonałymi wynikami w scenariuszach takich jak odpowiedzi referencyjne, podsumowania, twórczość, klasyfikacja tekstu i odgrywanie ról. Obsługuje wnioskowanie i dostosowywanie z kontekstem 128k."
|
||||
},
|
||||
"Doubao-pro-256k": {
|
||||
"description": "Najlepszy model główny, odpowiedni do obsługi złożonych zadań, osiągający dobre wyniki w scenariuszach takich jak pytania i odpowiedzi, podsumowania, twórczość, klasyfikacja tekstu, odgrywanie ról itp. Obsługuje wnioskowanie i dostrajanie w kontekście 256k."
|
||||
"description": "Najlepszy model główny, odpowiedni do złożonych zadań, osiągający doskonałe wyniki w scenariuszach takich jak pytania i odpowiedzi, streszczenia, twórczość, klasyfikacja tekstu i odgrywanie ról. Obsługuje wnioskowanie i dostrajanie z kontekstem do 128k."
|
||||
},
|
||||
"Doubao-pro-32k": {
|
||||
"description": "Model o najlepszych wynikach, odpowiedni do złożonych zadań, z doskonałymi wynikami w scenariuszach takich jak odpowiedzi referencyjne, podsumowania, twórczość, klasyfikacja tekstu i odgrywanie ról. Obsługuje wnioskowanie i dostosowywanie z kontekstem 32k."
|
||||
"description": "Najlepszy model główny, odpowiedni do złożonych zadań, osiągający doskonałe wyniki w scenariuszach takich jak pytania i odpowiedzi, streszczenia, twórczość, klasyfikacja tekstu i odgrywanie ról. Obsługuje wnioskowanie i dostrajanie z kontekstem do 32k."
|
||||
},
|
||||
"Doubao-pro-4k": {
|
||||
"description": "Model o najlepszych wynikach, odpowiedni do złożonych zadań, z doskonałymi wynikami w scenariuszach takich jak odpowiedzi referencyjne, podsumowania, twórczość, klasyfikacja tekstu i odgrywanie ról. Obsługuje wnioskowanie i dostosowywanie z kontekstem 4k."
|
||||
},
|
||||
"Doubao-vision-lite-32k": {
|
||||
"description": "Model Doubao-vision to multimodalny model stworzony przez Doubao, który dysponuje potężnymi zdolnościami rozumienia i wnioskowania obrazów oraz precyzyjnym rozumieniem instrukcji. Model wykazuje silną wydajność w zakresie ekstrakcji informacji tekstowych z obrazów oraz zadań wnioskowania opartych na obrazach, co pozwala na zastosowanie w bardziej złożonych i szerszych zadaniach wizualnych."
|
||||
},
|
||||
"Doubao-vision-pro-32k": {
|
||||
"description": "Model Doubao-vision to multimodalny model stworzony przez Doubao, który dysponuje potężnymi zdolnościami rozumienia i wnioskowania obrazów oraz precyzyjnym rozumieniem instrukcji. Model wykazuje silną wydajność w zakresie ekstrakcji informacji tekstowych z obrazów oraz zadań wnioskowania opartych na obrazach, co pozwala na zastosowanie w bardziej złożonych i szerszych zadaniach wizualnych."
|
||||
"description": "Najlepszy model główny, odpowiedni do złożonych zadań, osiągający doskonałe wyniki w scenariuszach takich jak pytania i odpowiedzi, streszczenia, twórczość, klasyfikacja tekstu i odgrywanie ról. Obsługuje wnioskowanie i dostrajanie z kontekstem do 4k."
|
||||
},
|
||||
"ERNIE-3.5-128K": {
|
||||
"description": "Flagowy model dużego języka opracowany przez Baidu, obejmujący ogromne zbiory danych w języku chińskim i angielskim, charakteryzujący się silnymi zdolnościami ogólnymi, zdolny do spełnienia wymagań w większości scenariuszy związanych z pytaniami i odpowiedziami, generowaniem treści oraz aplikacjami wtyczek; wspiera automatyczne połączenie z wtyczką wyszukiwania Baidu, zapewniając aktualność informacji w odpowiedziach."
|
||||
@@ -224,24 +203,21 @@
|
||||
"Pro/Qwen/Qwen2.5-VL-7B-Instruct": {
|
||||
"description": "Qwen2.5-VL to nowa wersja serii Qwen, posiadająca zaawansowane zdolności zrozumienia wizualnego. Potrafi analizować tekst, wykresy i układ w obrazach, a także zrozumieć długie filmy i wykrywać zdarzenia. Jest zdolny do przeprowadzania wnioskowania, operowania narzędziami, obsługuje lokalizację obiektów w różnych formatach i generowanie wyjścia strukturalnego. Optymalizuje trening rozdzielczości i klatki wideo, a także zwiększa efektywność kodera wizualnego."
|
||||
},
|
||||
"Pro/THUDM/GLM-4.1V-9B-Thinking": {
|
||||
"description": "GLM-4.1V-9B-Thinking to otwarty model wizualno-językowy (VLM) opracowany wspólnie przez Zhipu AI i Laboratorium KEG Uniwersytetu Tsinghua, zaprojektowany do obsługi złożonych zadań poznawczych wielomodalnych. Model opiera się na bazowym modelu GLM-4-9B-0414 i znacząco poprawia zdolności wnioskowania międzymodalnego oraz stabilność dzięki wprowadzeniu mechanizmu rozumowania „łańcucha myślowego” (Chain-of-Thought) oraz zastosowaniu strategii uczenia ze wzmocnieniem."
|
||||
},
|
||||
"Pro/THUDM/glm-4-9b-chat": {
|
||||
"description": "GLM-4-9B-Chat to otwarta wersja modelu pretrenowanego z serii GLM-4, wydana przez Zhipu AI. Model ten wykazuje doskonałe wyniki w zakresie semantyki, matematyki, wnioskowania, kodu i wiedzy. Oprócz wsparcia dla wieloetapowych rozmów, GLM-4-9B-Chat oferuje również zaawansowane funkcje, takie jak przeglądanie stron internetowych, wykonywanie kodu, wywoływanie niestandardowych narzędzi (Function Call) oraz wnioskowanie z długich tekstów. Model obsługuje 26 języków, w tym chiński, angielski, japoński, koreański i niemiecki. W wielu testach benchmarkowych, takich jak AlignBench-v2, MT-Bench, MMLU i C-Eval, GLM-4-9B-Chat wykazuje doskonałą wydajność. Model obsługuje maksymalną długość kontekstu 128K, co czyni go odpowiednim do badań akademickich i zastosowań komercyjnych."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1": {
|
||||
"description": "DeepSeek-R1 to model wnioskowania napędzany uczeniem ze wzmocnieniem (RL), który rozwiązuje problemy z powtarzalnością i czytelnością modeli. Przed RL, DeepSeek-R1 wprowadził dane do zimnego startu, co dodatkowo zoptymalizowało wydajność wnioskowania. W zadaniach matematycznych, kodowych i wnioskowania, osiąga wyniki porównywalne z OpenAI-o1, a dzięki starannie zaprojektowanym metodom treningowym poprawia ogólne wyniki."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1-0120": {
|
||||
"description": "DeepSeek-R1 to model wnioskowania napędzany uczeniem ze wzmocnieniem (RL), rozwiązujący problemy powtarzalności i czytelności w modelach. Przed zastosowaniem RL wprowadzono dane cold start, co dodatkowo zoptymalizowało wydajność wnioskowania. Model osiąga wyniki porównywalne z OpenAI-o1 w zadaniach matematycznych, kodowania i wnioskowania, a dzięki starannie zaprojektowanym metodom treningowym poprawia ogólną efektywność."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B": {
|
||||
"description": "DeepSeek-R1-Distill-Qwen-7B to model stworzony na podstawie Qwen2.5-Math-7B poprzez proces wiedzy distylacji. Model ten został wytrenowany na 800 000 wybrukowanych próbkach wygenerowanych przez DeepSeek-R1, co pozwoliło mu wykazać się doskonałymi zdolnościami wnioskowania. W wielu testach referencyjnych osiągnął znakomite wyniki, w tym 92,8% dokładności na MATH-500, 55,5% sukcesów na AIME 2024 oraz 1189 punktów na CodeForces, co potwierdza jego silne umiejętności matematyczne i programistyczne jako modelu o rozmiarze 7B."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-V3": {
|
||||
"description": "DeepSeek-V3 to model językowy z 6710 miliardami parametrów, oparty na architekturze mieszanych ekspertów (MoE), wykorzystujący wielogłowicową potencjalną uwagę (MLA) oraz strategię równoważenia obciążenia bez dodatkowych strat, co optymalizuje wydajność wnioskowania i treningu. Dzięki wstępnemu treningowi na 14,8 bilionach wysokiej jakości tokenów oraz nadzorowanemu dostrajaniu i uczeniu ze wzmocnieniem, DeepSeek-V3 przewyższa inne modele open source, zbliżając się do wiodących modeli zamkniętych."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-V3-1226": {
|
||||
"description": "DeepSeek-V3 to model językowy z 671 miliardami parametrów, oparty na architekturze mieszanych ekspertów (MoE), wykorzystujący wielogłowicową uwagę (MLA) oraz strategię równoważenia obciążenia bez dodatkowych strat, co optymalizuje efektywność wnioskowania i treningu. Model został wstępnie wytrenowany na 14,8 bilionach wysokiej jakości tokenów, a następnie poddany nadzorowanemu dostrajaniu i uczeniu przez wzmocnienie, co pozwala mu przewyższać inne modele open-source i zbliżać się do wiodących modeli zamkniętych."
|
||||
},
|
||||
"QwQ-32B-Preview": {
|
||||
"description": "QwQ-32B-Preview to innowacyjny model przetwarzania języka naturalnego, który efektywnie radzi sobie z złożonymi zadaniami generowania dialogów i rozumienia kontekstu."
|
||||
},
|
||||
@@ -404,6 +380,9 @@
|
||||
"THUDM/GLM-4-9B-0414": {
|
||||
"description": "GLM-4-9B-0414 to mały model z serii GLM, mający 9 miliardów parametrów. Model ten dziedziczy cechy technologiczne serii GLM-4-32B, ale oferuje lżejsze opcje wdrożeniowe. Mimo mniejszych rozmiarów, GLM-4-9B-0414 nadal wykazuje doskonałe zdolności w generowaniu kodu, projektowaniu stron internetowych, generowaniu grafiki SVG i pisaniu opartym na wyszukiwaniu."
|
||||
},
|
||||
"THUDM/GLM-4.1V-9B-Thinking": {
|
||||
"description": "GLM-4.1V-9B-Thinking to otwarty model wizualno-językowy (VLM) opracowany wspólnie przez Zhipu AI i Laboratorium KEG Uniwersytetu Tsinghua, zaprojektowany do obsługi złożonych zadań poznawczych wielomodalnych. Model opiera się na bazowym modelu GLM-4-9B-0414 i znacząco poprawia zdolności wnioskowania międzymodalnego oraz stabilność dzięki wprowadzeniu mechanizmu rozumowania „łańcucha myślowego” (Chain-of-Thought) oraz zastosowaniu strategii uczenia ze wzmocnieniem."
|
||||
},
|
||||
"THUDM/GLM-Z1-32B-0414": {
|
||||
"description": "GLM-Z1-32B-0414 to model wnioskowania z głęboką zdolnością myślenia. Model ten oparty jest na GLM-4-32B-0414, rozwinięty poprzez zimny start i rozszerzone uczenie przez wzmocnienie, a także przeszedł dalsze szkolenie w zadaniach matematycznych, kodowania i logiki. W porównaniu do modelu bazowego, GLM-Z1-32B-0414 znacznie poprawił zdolności matematyczne i umiejętność rozwiązywania złożonych zadań."
|
||||
},
|
||||
@@ -560,6 +539,9 @@
|
||||
"anthropic/claude-sonnet-4": {
|
||||
"description": "Claude Sonnet 4 potrafi generować niemal natychmiastowe odpowiedzi lub wydłużone, stopniowe rozumowanie, które użytkownicy mogą wyraźnie obserwować. Użytkownicy API mają również precyzyjną kontrolę nad czasem rozmyślania modelu."
|
||||
},
|
||||
"ascend-tribe/pangu-pro-moe": {
|
||||
"description": "Pangu-Pro-MoE 72B-A16B to rzadki, duży model językowy o 72 miliardach parametrów i 16 miliardach aktywowanych parametrów, oparty na architekturze grupowanych ekspertów (MoGE). W fazie wyboru ekspertów model grupuje ekspertów i ogranicza aktywację tokenów do równej liczby ekspertów w każdej grupie, co zapewnia równomierne obciążenie ekspertów i znacznie poprawia efektywność wdrożenia modelu na platformie Ascend."
|
||||
},
|
||||
"aya": {
|
||||
"description": "Aya 23 to model wielojęzyczny wydany przez Cohere, wspierający 23 języki, ułatwiający różnorodne zastosowania językowe."
|
||||
},
|
||||
@@ -569,6 +551,9 @@
|
||||
"baichuan/baichuan2-13b-chat": {
|
||||
"description": "Baichuan-13B to otwarty model językowy stworzony przez Baichuan Intelligence, zawierający 13 miliardów parametrów, który osiągnął najlepsze wyniki w swojej klasie w autorytatywnych benchmarkach w języku chińskim i angielskim."
|
||||
},
|
||||
"baidu/ERNIE-4.5-300B-A47B": {
|
||||
"description": "ERNIE-4.5-300B-A47B to duży model językowy opracowany przez firmę Baidu, oparty na hybrydowej architekturze ekspertów (MoE). Model ma 300 miliardów parametrów, ale podczas inferencji aktywuje tylko 47 miliardów parametrów na token, co zapewnia doskonałą wydajność przy efektywności obliczeniowej. Jako jeden z kluczowych modeli serii ERNIE 4.5, wykazuje znakomite zdolności w rozumieniu tekstu, generowaniu, wnioskowaniu i programowaniu. Model wykorzystuje innowacyjną metodę pretrenowania multimodalnego heterogenicznego MoE, łącząc trening tekstu i wizji, co skutecznie zwiększa jego zdolności, zwłaszcza w zakresie przestrzegania instrukcji i pamięci wiedzy o świecie."
|
||||
},
|
||||
"c4ai-aya-expanse-32b": {
|
||||
"description": "Aya Expanse to model wielojęzyczny o wysokiej wydajności 32B, zaprojektowany w celu wyzwania wydajności modeli jednolanguage poprzez innowacje w zakresie dostosowywania instrukcji, arbitrażu danych, treningu preferencji i łączenia modeli. Obsługuje 23 języki."
|
||||
},
|
||||
@@ -914,17 +899,53 @@
|
||||
"doubao-1.5-thinking-pro": {
|
||||
"description": "Model głębokiego myślenia Doubao-1.5, nowa generacja, wyróżnia się w dziedzinach takich jak matematyka, programowanie, rozumowanie naukowe oraz w zadaniach ogólnych, takich jak twórcze pisanie. Osiąga lub zbliża się do poziomu czołowych graczy w branży w wielu uznawanych benchmarkach, takich jak AIME 2024, Codeforces, GPQA. Obsługuje okno kontekstowe o wielkości 128k oraz 16k wyjścia."
|
||||
},
|
||||
"doubao-1.5-thinking-pro-m": {
|
||||
"description": "Doubao-1.5 to nowy model głębokiego myślenia (wersja m z natywną wielomodalną zdolnością głębokiego wnioskowania), wyróżniający się w dziedzinach takich jak matematyka, programowanie, rozumowanie naukowe oraz twórcze pisanie. Osiąga lub zbliża się do czołówki branży na wielu prestiżowych benchmarkach, takich jak AIME 2024, Codeforces, GPQA. Obsługuje kontekst do 128k i wyjście do 16k."
|
||||
},
|
||||
"doubao-1.5-thinking-vision-pro": {
|
||||
"description": "Nowy model głębokiego myślenia wizualnego, oferujący zaawansowane zdolności uniwersalnego wielomodalnego rozumienia i wnioskowania, osiągając SOTA w 37 z 59 publicznych benchmarków."
|
||||
},
|
||||
"doubao-1.5-ui-tars": {
|
||||
"description": "Doubao-1.5-UI-TARS to natywny model agenta zaprojektowany do interakcji z graficznym interfejsem użytkownika (GUI). Dzięki zdolnościom percepcji, wnioskowania i działania na poziomie ludzkim umożliwia płynną interakcję z GUI."
|
||||
},
|
||||
"doubao-1.5-vision-lite": {
|
||||
"description": "Doubao-1.5-vision-lite to nowo zaktualizowany model multimodalny, który obsługuje rozpoznawanie obrazów o dowolnej rozdzielczości i ekstremalnych proporcjach, wzmacniając zdolności wnioskowania wizualnego, rozpoznawania dokumentów, rozumienia szczegółowych informacji i przestrzegania instrukcji. Obsługuje okno kontekstowe 128k, maksymalna długość wyjścia to 16k tokenów."
|
||||
},
|
||||
"doubao-1.5-vision-pro": {
|
||||
"description": "Doubao-1.5-vision-pro to nowo ulepszony wielomodalny model dużej skali, obsługujący rozpoznawanie obrazów o dowolnej rozdzielczości i ekstremalnych proporcjach, wzmacniający zdolności wizualnego wnioskowania, rozpoznawania dokumentów, rozumienia szczegółów i przestrzegania instrukcji."
|
||||
},
|
||||
"doubao-1.5-vision-pro-32k": {
|
||||
"description": "Doubao-1.5-vision-pro to nowo ulepszony wielomodalny model dużej skali, obsługujący rozpoznawanie obrazów o dowolnej rozdzielczości i ekstremalnych proporcjach, wzmacniający zdolności wizualnego wnioskowania, rozpoznawania dokumentów, rozumienia szczegółów i przestrzegania instrukcji."
|
||||
},
|
||||
"doubao-lite-128k": {
|
||||
"description": "Oferuje niezwykle szybkie reakcje i lepszy stosunek jakości do ceny, zapewniając klientom elastyczne opcje dla różnych scenariuszy. Obsługuje wnioskowanie i dostrajanie z kontekstem do 128k."
|
||||
},
|
||||
"doubao-lite-32k": {
|
||||
"description": "Oferuje niezwykle szybkie reakcje i lepszy stosunek jakości do ceny, zapewniając klientom elastyczne opcje dla różnych scenariuszy. Obsługuje wnioskowanie i dostrajanie z kontekstem do 32k."
|
||||
},
|
||||
"doubao-lite-4k": {
|
||||
"description": "Oferuje niezwykle szybkie reakcje i lepszy stosunek jakości do ceny, zapewniając klientom elastyczne opcje dla różnych scenariuszy. Obsługuje wnioskowanie i dostrajanie z kontekstem do 4k."
|
||||
},
|
||||
"doubao-pro-256k": {
|
||||
"description": "Najlepszy model główny, odpowiedni do złożonych zadań, osiągający doskonałe wyniki w scenariuszach takich jak pytania i odpowiedzi, streszczenia, twórczość, klasyfikacja tekstu i odgrywanie ról. Obsługuje wnioskowanie i dostrajanie z kontekstem do 256k."
|
||||
},
|
||||
"doubao-pro-32k": {
|
||||
"description": "Najlepszy model główny, odpowiedni do złożonych zadań, osiągający doskonałe wyniki w scenariuszach takich jak pytania i odpowiedzi, streszczenia, twórczość, klasyfikacja tekstu i odgrywanie ról. Obsługuje wnioskowanie i dostrajanie z kontekstem do 32k."
|
||||
},
|
||||
"doubao-seed-1.6": {
|
||||
"description": "Doubao-Seed-1.6 to nowy, multimodalny model głębokiego myślenia, obsługujący trzy tryby myślenia: auto, thinking i non-thinking. W trybie non-thinking model osiąga znacznie lepsze wyniki w porównaniu z Doubao-1.5-pro/250115. Obsługuje kontekst do 256k oraz maksymalną długość wyjścia do 16k tokenów."
|
||||
"description": "Doubao-Seed-1.6 to nowy, wielomodalny model głębokiego myślenia, obsługujący trzy tryby myślenia: auto, thinking i non-thinking. W trybie non-thinking model osiąga znacznie lepsze wyniki w porównaniu do Doubao-1.5-pro/250115. Obsługuje kontekst do 256k oraz maksymalną długość wyjścia do 16k tokenów."
|
||||
},
|
||||
"doubao-seed-1.6-flash": {
|
||||
"description": "Doubao-Seed-1.6-flash to ultraszybki multimodalny model głębokiego myślenia, z czasem TPOT wynoszącym zaledwie 10 ms; obsługuje zarówno rozumienie tekstu, jak i obrazu, z lepszymi zdolnościami tekstowymi niż poprzednia generacja lite oraz wizualnymi porównywalnymi do modeli pro konkurencji. Obsługuje kontekst do 256k oraz maksymalną długość wyjścia do 16k tokenów."
|
||||
"description": "Doubao-Seed-1.6-flash to ultraszybki model wielomodalnego głębokiego myślenia, z czasem TPOT zaledwie 10 ms; obsługuje zarówno rozumienie tekstu, jak i obrazu, z lepszymi zdolnościami tekstowymi niż poprzednia generacja lite oraz wizualnymi porównywalnymi do modeli pro konkurencji. Obsługuje kontekst do 256k oraz maksymalną długość wyjścia do 16k tokenów."
|
||||
},
|
||||
"doubao-seed-1.6-thinking": {
|
||||
"description": "Model Doubao-Seed-1.6-thinking ma znacznie wzmocnione zdolności myślenia, w porównaniu z Doubao-1.5-thinking-pro osiąga dalsze ulepszenia w podstawowych umiejętnościach takich jak kodowanie, matematyka i rozumowanie logiczne, wspiera również rozumienie wizualne. Obsługuje kontekst do 256k oraz maksymalną długość wyjścia do 16k tokenów."
|
||||
"description": "Model Doubao-Seed-1.6-thinking ma znacznie wzmocnione zdolności myślenia, w porównaniu do Doubao-1.5-thinking-pro osiąga dalsze ulepszenia w podstawowych umiejętnościach takich jak kodowanie, matematyka i rozumowanie logiczne, wspiera również rozumienie wizualne. Obsługuje kontekst do 256k oraz maksymalną długość wyjścia do 16k tokenów."
|
||||
},
|
||||
"doubao-vision-lite-32k": {
|
||||
"description": "Model Doubao-vision to wielomodalny model dużej skali opracowany przez Doubao, oferujący potężne zdolności rozumienia i wnioskowania obrazów oraz precyzyjne rozumienie poleceń. Model wykazuje silne wyniki w ekstrakcji informacji z obrazów i tekstu oraz w zadaniach wnioskowania opartych na obrazach, umożliwiając zastosowanie w bardziej złożonych i szerokich zadaniach wizualnych pytań i odpowiedzi."
|
||||
},
|
||||
"doubao-vision-pro-32k": {
|
||||
"description": "Model Doubao-vision to wielomodalny model dużej skali opracowany przez Doubao, oferujący potężne zdolności rozumienia i wnioskowania obrazów oraz precyzyjne rozumienie poleceń. Model wykazuje silne wyniki w ekstrakcji informacji z obrazów i tekstu oraz w zadaniach wnioskowania opartych na obrazach, umożliwiając zastosowanie w bardziej złożonych i szerokich zadaniach wizualnych pytań i odpowiedzi."
|
||||
},
|
||||
"emohaa": {
|
||||
"description": "Emohaa to model psychologiczny, posiadający profesjonalne umiejętności doradcze, pomagający użytkownikom zrozumieć problemy emocjonalne."
|
||||
@@ -1082,9 +1103,6 @@
|
||||
"gemini-2.5-pro": {
|
||||
"description": "Gemini 2.5 Pro to najnowocześniejszy model myślowy Google, zdolny do rozumowania nad złożonymi problemami w dziedzinach kodowania, matematyki i STEM oraz analizowania dużych zbiorów danych, repozytoriów kodu i dokumentacji przy użyciu długiego kontekstu."
|
||||
},
|
||||
"gemini-2.5-pro-exp-03-25": {
|
||||
"description": "Gemini 2.5 Pro Experimental to najnowocześniejszy model myślenia Google, zdolny do wnioskowania w zakresie kodu, matematyki i złożonych problemów w dziedzinie STEM, a także do analizy dużych zbiorów danych, repozytoriów kodu i dokumentów, wykorzystując długi kontekst."
|
||||
},
|
||||
"gemini-2.5-pro-preview-03-25": {
|
||||
"description": "Gemini 2.5 Pro Preview to najnowocześniejszy model myślenia Google, zdolny do wnioskowania w zakresie kodu, matematyki i złożonych problemów w dziedzinie STEM, a także do analizy dużych zbiorów danych, repozytoriów kodu i dokumentów przy użyciu długiego kontekstu."
|
||||
},
|
||||
@@ -1151,6 +1169,12 @@
|
||||
"glm-4-plus": {
|
||||
"description": "GLM-4-Plus jako flagowy model o wysokiej inteligencji, posiada potężne zdolności przetwarzania długich tekstów i złożonych zadań, z ogólnym wzrostem wydajności."
|
||||
},
|
||||
"glm-4.1v-thinking-flash": {
|
||||
"description": "Seria modeli GLM-4.1V-Thinking to najsilniejsze znane modele wizualno-językowe (VLM) na poziomie 10 miliardów parametrów, integrujące najnowocześniejsze zadania wizualno-językowe na tym poziomie, w tym rozumienie wideo, pytania i odpowiedzi na obrazach, rozwiązywanie problemów naukowych, rozpoznawanie tekstu OCR, interpretację dokumentów i wykresów, agenta GUI, kodowanie front-endowe stron internetowych, grounding i inne. Wiele z tych zadań przewyższa możliwości modelu Qwen2.5-VL-72B, który ma ponad 8 razy więcej parametrów. Dzięki zaawansowanym technikom uczenia ze wzmocnieniem model opanował rozumowanie łańcuchowe, co znacząco poprawia dokładność i bogactwo odpowiedzi, przewyższając tradycyjne modele bez mechanizmu thinking pod względem końcowych rezultatów i interpretowalności."
|
||||
},
|
||||
"glm-4.1v-thinking-flashx": {
|
||||
"description": "Seria modeli GLM-4.1V-Thinking to najsilniejsze znane modele wizualno-językowe (VLM) na poziomie 10 miliardów parametrów, integrujące najnowocześniejsze zadania wizualno-językowe na tym poziomie, w tym rozumienie wideo, pytania i odpowiedzi na obrazach, rozwiązywanie problemów naukowych, rozpoznawanie tekstu OCR, interpretację dokumentów i wykresów, agenta GUI, kodowanie front-endowe stron internetowych, grounding i inne. Wiele z tych zadań przewyższa możliwości modelu Qwen2.5-VL-72B, który ma ponad 8 razy więcej parametrów. Dzięki zaawansowanym technikom uczenia ze wzmocnieniem model opanował rozumowanie łańcuchowe, co znacząco poprawia dokładność i bogactwo odpowiedzi, przewyższając tradycyjne modele bez mechanizmu thinking pod względem końcowych rezultatów i interpretowalności."
|
||||
},
|
||||
"glm-4v": {
|
||||
"description": "GLM-4V oferuje potężne zdolności rozumienia i wnioskowania obrazów, obsługując różne zadania wizualne."
|
||||
},
|
||||
@@ -1172,6 +1196,9 @@
|
||||
"glm-z1-flash": {
|
||||
"description": "Seria GLM-Z1 posiada silne zdolności wnioskowania złożonego, osiągając doskonałe wyniki w dziedzinach takich jak wnioskowanie logiczne, matematyka i programowanie. Maksymalna długość kontekstu wynosi 32K."
|
||||
},
|
||||
"glm-z1-flashx": {
|
||||
"description": "Wysoka prędkość i niska cena: wersja wzbogacona Flash, ultra szybkie tempo inferencji i lepsza obsługa współbieżności."
|
||||
},
|
||||
"glm-zero-preview": {
|
||||
"description": "GLM-Zero-Preview posiada silne zdolności do złożonego wnioskowania, wyróżniając się w dziedzinach takich jak wnioskowanie logiczne, matematyka i programowanie."
|
||||
},
|
||||
@@ -1223,6 +1250,9 @@
|
||||
"google/gemma-2b-it": {
|
||||
"description": "Gemma Instruct (2B) oferuje podstawowe możliwości przetwarzania poleceń, idealne do lekkich aplikacji."
|
||||
},
|
||||
"google/gemma-3-1b-it": {
|
||||
"description": "Gemma 3 1B to otwarty model językowy Google, ustanawiający nowe standardy w zakresie efektywności i wydajności."
|
||||
},
|
||||
"google/gemma-3-27b-it": {
|
||||
"description": "Gemma 3 27B to otwarty model językowy stworzony przez Google, który ustanowił nowe standardy w zakresie wydajności i efektywności."
|
||||
},
|
||||
@@ -1313,6 +1343,9 @@
|
||||
"gpt-4o-mini-search-preview": {
|
||||
"description": "GPT-4o mini wersja podglądowa do wyszukiwania to model specjalnie wytrenowany do rozumienia i realizacji zapytań wyszukiwania internetowego, korzystający z API Chat Completions. Poza opłatami za tokeny, zapytania wyszukiwania internetowego są dodatkowo obciążane opłatą za każde wywołanie narzędzia."
|
||||
},
|
||||
"gpt-4o-mini-transcribe": {
|
||||
"description": "GPT-4o Mini Transcribe to model konwersji mowy na tekst wykorzystujący GPT-4o do transkrypcji audio. W porównaniu z oryginalnym modelem Whisper poprawia wskaźnik błędów słów oraz rozpoznawanie i dokładność językową. Użyj go, aby uzyskać dokładniejsze transkrypcje."
|
||||
},
|
||||
"gpt-4o-mini-tts": {
|
||||
"description": "GPT-4o mini TTS to model tekstu na mowę oparty na GPT-4o mini, oferujący wysokiej jakości generowanie mowy przy niższych kosztach."
|
||||
},
|
||||
@@ -1322,12 +1355,15 @@
|
||||
"gpt-4o-realtime-preview-2024-10-01": {
|
||||
"description": "Wersja na żywo GPT-4o, obsługująca wejście i wyjście audio oraz tekstowe w czasie rzeczywistym."
|
||||
},
|
||||
"gpt-4o-realtime-preview-2024-12-17": {
|
||||
"description": "Wersja na żywo GPT-4o, obsługująca wejście i wyjście audio oraz tekstowe w czasie rzeczywistym."
|
||||
"gpt-4o-realtime-preview-2025-06-03": {
|
||||
"description": "Wersja GPT-4o w czasie rzeczywistym, obsługująca jednoczesne wejście i wyjście audio oraz tekstu."
|
||||
},
|
||||
"gpt-4o-search-preview": {
|
||||
"description": "GPT-4o wersja podglądowa do wyszukiwania to model specjalnie wytrenowany do rozumienia i realizacji zapytań wyszukiwania internetowego, korzystający z API Chat Completions. Poza opłatami za tokeny, zapytania wyszukiwania internetowego są dodatkowo obciążane opłatą za każde wywołanie narzędzia."
|
||||
},
|
||||
"gpt-4o-transcribe": {
|
||||
"description": "GPT-4o Transcribe to model konwersji mowy na tekst wykorzystujący GPT-4o do transkrypcji audio. W porównaniu z oryginalnym modelem Whisper poprawia wskaźnik błędów słów oraz rozpoznawanie i dokładność językową. Użyj go, aby uzyskać dokładniejsze transkrypcje."
|
||||
},
|
||||
"grok-2-1212": {
|
||||
"description": "Model ten poprawił dokładność, przestrzeganie instrukcji oraz zdolności wielojęzyczne."
|
||||
},
|
||||
@@ -1346,9 +1382,15 @@
|
||||
"grok-3-mini-fast": {
|
||||
"description": "Lekki model, który najpierw analizuje przed rozmową. Działa szybko i inteligentnie, odpowiedni do zadań logicznych nie wymagających głębokiej wiedzy dziedzinowej, z możliwością śledzenia pierwotnego toku myślenia."
|
||||
},
|
||||
"grok-4": {
|
||||
"description": "Nasz najnowszy i najpotężniejszy model flagowy, który wyróżnia się doskonałymi wynikami w przetwarzaniu języka naturalnego, obliczeniach matematycznych i rozumowaniu — to idealny wszechstronny zawodnik."
|
||||
},
|
||||
"gryphe/mythomax-l2-13b": {
|
||||
"description": "MythoMax l2 13B to model językowy łączący kreatywność i inteligencję, zintegrowany z wieloma wiodącymi modelami."
|
||||
},
|
||||
"hunyuan-a13b": {
|
||||
"description": "Hunyuan to pierwszy hybrydowy model rozumowania, będący ulepszoną wersją hunyuan-standard-256K, z 80 miliardami parametrów i 13 miliardami aktywowanych. Domyślnie działa w trybie wolnego myślenia, ale obsługuje przełączanie między trybami szybkiego i wolnego myślenia za pomocą parametrów lub instrukcji; przełączanie odbywa się przez dodanie / no_think przed zapytaniem. Ogólne zdolności modelu znacznie przewyższają poprzednią generację, zwłaszcza w matematyce, naukach ścisłych, rozumieniu długich tekstów i zdolnościach agenta."
|
||||
},
|
||||
"hunyuan-code": {
|
||||
"description": "Najnowocześniejszy model generowania kodu Hunyuan, przeszkolony na bazie 200B wysokiej jakości danych kodu, z półrocznym treningiem na wysokiej jakości danych SFT, z wydłużonym oknem kontekstowym do 8K, zajmującym czołowe miejsca w automatycznych wskaźnikach oceny generowania kodu w pięciu językach; w ocenie jakościowej zadań kodowych w pięciu językach, osiąga wyniki w pierwszej lidze."
|
||||
},
|
||||
@@ -1400,6 +1442,9 @@
|
||||
"hunyuan-t1-vision": {
|
||||
"description": "Model głębokiego myślenia multimodalnego Hunyuan, obsługujący natywne łańcuchy myślowe multimodalne, doskonały w różnych scenariuszach wnioskowania obrazowego, z wyraźną przewagą nad modelami szybkiego myślenia w rozwiązywaniu problemów ścisłych."
|
||||
},
|
||||
"hunyuan-t1-vision-20250619": {
|
||||
"description": "Najnowszy model wielomodalny t1-vision Hunyuan z głębokim rozumowaniem, obsługujący natywne łańcuchy myślowe wielomodalne, z kompleksową poprawą w stosunku do poprzedniej domyślnej wersji modelu."
|
||||
},
|
||||
"hunyuan-turbo": {
|
||||
"description": "Hunyuan to nowa generacja dużego modelu językowego w wersji próbnej, wykorzystująca nową strukturę modelu mieszanych ekspertów (MoE), która w porównaniu do hunyuan-pro charakteryzuje się szybszą efektywnością wnioskowania i lepszymi wynikami."
|
||||
},
|
||||
@@ -1430,6 +1475,12 @@
|
||||
"hunyuan-turbos-role-plus": {
|
||||
"description": "Najnowsza wersja modelu do odgrywania ról Hunyuan, oficjalnie dostrojona przez Hunyuan, oparta na modelu Hunyuan i wzbogacona o dane scenariuszy odgrywania ról, zapewniająca lepsze podstawowe efekty w tych scenariuszach."
|
||||
},
|
||||
"hunyuan-turbos-vision": {
|
||||
"description": "Model przeznaczony do zadań rozumienia obrazów i tekstu, oparty na najnowszym modelu turbos Hunyuan, będący nową generacją flagowego modelu wizualno-językowego. Skupia się na zadaniach związanych z rozpoznawaniem obiektów na obrazach, pytaniami i odpowiedziami opartymi na wiedzy, tworzeniem tekstów reklamowych, rozwiązywaniem problemów na podstawie zdjęć i innych, z kompleksową poprawą w stosunku do poprzedniej generacji."
|
||||
},
|
||||
"hunyuan-turbos-vision-20250619": {
|
||||
"description": "Najnowszy flagowy model wizualno-językowy turbos-vision Hunyuan, z kompleksową poprawą w zadaniach związanych z rozumieniem obrazów i tekstu, w tym rozpoznawaniem obiektów na obrazach, pytaniami i odpowiedziami opartymi na wiedzy, tworzeniem tekstów reklamowych, rozwiązywaniem problemów na podstawie zdjęć, w porównaniu do poprzedniej domyślnej wersji modelu."
|
||||
},
|
||||
"hunyuan-vision": {
|
||||
"description": "Najnowocześniejszy model multimodalny Hunyuan, wspierający generowanie treści tekstowych na podstawie obrazów i tekstu."
|
||||
},
|
||||
@@ -1457,6 +1508,9 @@
|
||||
"jina-deepsearch-v1": {
|
||||
"description": "Głębokie wyszukiwanie łączy wyszukiwanie w sieci, czytanie i wnioskowanie, umożliwiając kompleksowe badania. Możesz to traktować jako agenta, który przyjmuje Twoje zadania badawcze - przeprowadza szerokie poszukiwania i wielokrotne iteracje, zanim poda odpowiedź. Proces ten obejmuje ciągłe badania, wnioskowanie i rozwiązywanie problemów z różnych perspektyw. To zasadniczo różni się od standardowych dużych modeli, które generują odpowiedzi bezpośrednio z wstępnie wytrenowanych danych oraz od tradycyjnych systemów RAG, które polegają na jednorazowym powierzchownym wyszukiwaniu."
|
||||
},
|
||||
"kimi-k2-0711-preview": {
|
||||
"description": "kimi-k2 to podstawowy model architektury MoE o potężnych zdolnościach kodowania i agenta, z łączną liczbą parametrów 1T i 32B aktywowanych parametrów. W testach wydajności na benchmarkach obejmujących ogólne rozumowanie, programowanie, matematykę i agentów model K2 przewyższa inne popularne modele open source."
|
||||
},
|
||||
"kimi-latest": {
|
||||
"description": "Produkt Kimi Smart Assistant korzysta z najnowszego modelu Kimi, który może zawierać cechy jeszcze niestabilne. Obsługuje zrozumienie obrazów i automatycznie wybiera model 8k/32k/128k jako model rozliczeniowy w zależności od długości kontekstu żądania."
|
||||
},
|
||||
@@ -1869,7 +1923,7 @@
|
||||
"description": "o1 to nowy model wnioskowania OpenAI, odpowiedni do złożonych zadań wymagających szerokiej wiedzy ogólnej. Model ten ma kontekst 128K i datę graniczną wiedzy z października 2023 roku."
|
||||
},
|
||||
"o1-pro": {
|
||||
"description": "Modele serii o1 są trenowane z wykorzystaniem uczenia ze wzmocnieniem, potrafią myśleć przed udzieleniem odpowiedzi i wykonywać złożone zadania rozumowania. Model o1-pro wykorzystuje więcej zasobów obliczeniowych do głębszego myślenia, co pozwala na ciągłe dostarczanie lepszych odpowiedzi."
|
||||
"description": "Modele z serii o1 są trenowane z wykorzystaniem uczenia ze wzmocnieniem, potrafią myśleć przed udzieleniem odpowiedzi i wykonywać złożone zadania rozumowania. Model o1-pro wykorzystuje więcej zasobów obliczeniowych, aby prowadzić głębsze rozważania i stale dostarczać lepsze odpowiedzi."
|
||||
},
|
||||
"o3": {
|
||||
"description": "o3 to wszechstronny i potężny model, który doskonale sprawdza się w wielu dziedzinach. Ustanawia nowe standardy w zadaniach matematycznych, naukowych, programistycznych i wizualnych. Jest również biegły w pisaniu technicznym i przestrzeganiu instrukcji. Użytkownicy mogą go wykorzystać do analizy tekstów, kodów i obrazów, rozwiązując złożone problemy wieloetapowe."
|
||||
@@ -1881,7 +1935,7 @@
|
||||
"description": "o3-mini to nasz najnowszy mały model wnioskowania, który oferuje wysoką inteligencję przy tych samych kosztach i celach opóźnienia co o1-mini."
|
||||
},
|
||||
"o3-pro": {
|
||||
"description": "Model o3-pro wykorzystuje większą moc obliczeniową do głębszego myślenia i zawsze dostarcza lepsze odpowiedzi, jest dostępny wyłącznie przez API Responses."
|
||||
"description": "Model o3-pro wykorzystuje większą moc obliczeniową do głębszego myślenia i zawsze dostarcza lepsze odpowiedzi, dostępny wyłącznie przez API Responses."
|
||||
},
|
||||
"o4-mini": {
|
||||
"description": "o4-mini to nasz najnowszy mały model z serii o. Został zoptymalizowany do szybkiego i efektywnego wnioskowania, osiągając wysoką wydajność i efektywność w zadaniach kodowania i wizualnych."
|
||||
@@ -2349,7 +2403,7 @@
|
||||
"description": "Model v0-1.5-md jest odpowiedni do codziennych zadań i generowania interfejsu użytkownika (UI)"
|
||||
},
|
||||
"whisper-1": {
|
||||
"description": "Uniwersalny model rozpoznawania mowy, obsługujący rozpoznawanie mowy w wielu językach, tłumaczenie mowy i rozpoznawanie języków."
|
||||
"description": "Uniwersalny model rozpoznawania mowy, obsługujący wielojęzyczne rozpoznawanie mowy, tłumaczenie mowy oraz identyfikację języka."
|
||||
},
|
||||
"wizardlm2": {
|
||||
"description": "WizardLM 2 to model językowy dostarczany przez Microsoft AI, który wyróżnia się w złożonych dialogach, wielojęzyczności, wnioskowaniu i inteligentnych asystentach."
|
||||
|
||||
@@ -520,6 +520,7 @@
|
||||
"hotkey": "Skróty klawiszowe",
|
||||
"llm": "Model językowy",
|
||||
"provider": "Dostawca usług AI",
|
||||
"proxy": "Proxy sieciowy",
|
||||
"storage": "Przechowywanie danych",
|
||||
"sync": "Synchronizacja w chmurze",
|
||||
"system-agent": "System Agent",
|
||||
|
||||
@@ -46,6 +46,9 @@
|
||||
"reasoningEffort": {
|
||||
"title": "Intensidade de Raciocínio"
|
||||
},
|
||||
"thinking": {
|
||||
"title": "Interruptor de Pensamento Profundo"
|
||||
},
|
||||
"title": "Funcionalidade de Extensão do Modelo"
|
||||
},
|
||||
"history": {
|
||||
|
||||
@@ -1,4 +1,43 @@
|
||||
{
|
||||
"proxy": {
|
||||
"auth": "Autenticação necessária",
|
||||
"authDesc": "Se o servidor proxy requer nome de usuário e senha",
|
||||
"authSettings": "Configurações de autenticação",
|
||||
"basicSettings": "Configurações do proxy",
|
||||
"basicSettingsDesc": "Configure os parâmetros de conexão do servidor proxy",
|
||||
"bypass": "Endereços que não usam proxy",
|
||||
"connectionTest": "Teste de conexão",
|
||||
"enable": "Ativar proxy",
|
||||
"enableDesc": "Quando ativado, o acesso à rede será feito através do servidor proxy",
|
||||
"password": "Senha",
|
||||
"password_placeholder": "Digite a senha",
|
||||
"port": "Porta",
|
||||
"resetButton": "Redefinir",
|
||||
"saveButton": "Salvar",
|
||||
"saveFailed": "Falha ao salvar: {{error}}",
|
||||
"saveSuccess": "Configurações do proxy salvas com sucesso",
|
||||
"server": "Endereço do servidor",
|
||||
"testButton": "Testar conexão",
|
||||
"testDescription": "Teste a conexão usando a configuração atual do proxy para verificar se está funcionando corretamente",
|
||||
"testFailed": "Falha na conexão",
|
||||
"testSuccessWithTime": "Conexão testada com sucesso, tempo gasto {{time}} ms",
|
||||
"testUrl": "URL de teste",
|
||||
"testUrlPlaceholder": "Digite a URL a ser testada",
|
||||
"testing": "Testando conexão...",
|
||||
"type": "Tipo de proxy",
|
||||
"unsavedChanges": "Você tem alterações não salvas",
|
||||
"username": "Nome de usuário",
|
||||
"username_placeholder": "Digite o nome de usuário",
|
||||
"validation": {
|
||||
"passwordRequired": "Senha é obrigatória quando a autenticação está ativada",
|
||||
"portInvalid": "A porta deve ser um número entre 1 e 65535",
|
||||
"portRequired": "Porta é obrigatória quando o proxy está ativado",
|
||||
"serverInvalid": "Por favor, insira um endereço de servidor válido (IP ou domínio)",
|
||||
"serverRequired": "Endereço do servidor é obrigatório quando o proxy está ativado",
|
||||
"typeRequired": "Tipo de proxy é obrigatório quando o proxy está ativado",
|
||||
"usernameRequired": "Nome de usuário é obrigatório quando a autenticação está ativada"
|
||||
}
|
||||
},
|
||||
"remoteServer": {
|
||||
"authError": "Erro de autorização: {{error}}",
|
||||
"authPending": "Por favor, complete a autorização no navegador",
|
||||
|
||||
+99
-45
@@ -71,44 +71,23 @@
|
||||
"DeepSeek-V3": {
|
||||
"description": "DeepSeek-V3 é um modelo MoE desenvolvido internamente pela DeepSeek. Os resultados de várias avaliações do DeepSeek-V3 superaram outros modelos de código aberto, como Qwen2.5-72B e Llama-3.1-405B, e seu desempenho é comparável aos melhores modelos fechados do mundo, como GPT-4o e Claude-3.5-Sonnet."
|
||||
},
|
||||
"Doubao-1.5-thinking-pro-m": {
|
||||
"description": "O Doubao-1.5 é um novo modelo de pensamento profundo (a versão m possui capacidade nativa de raciocínio multimodal), destacando-se em áreas profissionais como matemática, programação, raciocínio científico e tarefas gerais como escrita criativa, alcançando ou se aproximando do nível de elite em várias referências de prestígio como AIME 2024, Codeforces, GPQA."
|
||||
},
|
||||
"Doubao-1.5-thinking-vision-pro": {
|
||||
"description": "Modelo de pensamento profundo visual totalmente novo, com habilidades aprimoradas de compreensão e raciocínio multimodal geral, alcançando desempenho SOTA em 37 dos 59 benchmarks públicos."
|
||||
},
|
||||
"Doubao-1.5-vision-pro": {
|
||||
"description": "Doubao-1.5-vision-pro é um modelo multimodal atualizado, suportando reconhecimento de imagens de qualquer resolução e proporções extremas, melhorando a capacidade de raciocínio visual, reconhecimento de documentos, compreensão de informações detalhadas e seguimento de instruções."
|
||||
},
|
||||
"Doubao-1.5-vision-pro-32k": {
|
||||
"description": "Doubao-1.5-vision-pro é um modelo multimodal de grande porte totalmente atualizado, que suporta reconhecimento de imagens em qualquer resolução e proporções extremas, melhorando a capacidade de raciocínio visual, reconhecimento de documentos, compreensão de informações detalhadas e seguimento de instruções."
|
||||
},
|
||||
"Doubao-lite-128k": {
|
||||
"description": "Doubao-lite possui uma velocidade de resposta excepcional e uma melhor relação custo-benefício, oferecendo opções mais flexíveis para diferentes cenários dos clientes. Suporta raciocínio e ajuste fino em janelas de contexto de 128k."
|
||||
"description": "Doubao-lite oferece velocidade de resposta extrema e melhor custo-benefício, proporcionando opções mais flexíveis para diferentes cenários dos clientes. Suporta inferência e fine-tuning com janela de contexto de 128k."
|
||||
},
|
||||
"Doubao-lite-32k": {
|
||||
"description": "Doubao-lite possui uma velocidade de resposta excepcional e uma melhor relação custo-benefício, oferecendo opções mais flexíveis para diferentes cenários dos clientes. Suporta raciocínio e ajuste fino em janelas de contexto de 32k."
|
||||
"description": "Doubao-lite oferece velocidade de resposta extrema e melhor custo-benefício, proporcionando opções mais flexíveis para diferentes cenários dos clientes. Suporta inferência e fine-tuning com janela de contexto de 32k."
|
||||
},
|
||||
"Doubao-lite-4k": {
|
||||
"description": "Doubao-lite possui uma velocidade de resposta excepcional e uma melhor relação custo-benefício, oferecendo opções mais flexíveis para diferentes cenários dos clientes. Suporta raciocínio e ajuste fino em janelas de contexto de 4k."
|
||||
"description": "Doubao-lite oferece velocidade de resposta extrema e melhor custo-benefício, proporcionando opções mais flexíveis para diferentes cenários dos clientes. Suporta inferência e fine-tuning com janela de contexto de 4k."
|
||||
},
|
||||
"Doubao-pro-128k": {
|
||||
"description": "O modelo principal com o melhor desempenho, adequado para tarefas complexas, apresentando excelentes resultados em cenários como perguntas e respostas, resumos, criação, classificação de texto e interpretação de papéis. Suporta raciocínio e ajuste fino em janelas de contexto de 128k."
|
||||
},
|
||||
"Doubao-pro-256k": {
|
||||
"description": "O modelo principal com o melhor desempenho, adequado para lidar com tarefas complexas, apresentando bons resultados em cenários como perguntas e respostas de referência, resumos, criação, classificação de texto e interpretação de papéis. Suporta raciocínio e ajuste fino com janelas de contexto de 256k."
|
||||
"description": "Modelo principal com melhor desempenho, adequado para tarefas complexas, apresentando ótimos resultados em perguntas de referência, resumos, criação, classificação de texto, interpretação de papéis e outros cenários. Suporta inferência e fine-tuning com janela de contexto de 128k."
|
||||
},
|
||||
"Doubao-pro-32k": {
|
||||
"description": "O modelo principal com o melhor desempenho, adequado para tarefas complexas, apresentando excelentes resultados em cenários como perguntas e respostas, resumos, criação, classificação de texto e interpretação de papéis. Suporta raciocínio e ajuste fino em janelas de contexto de 32k."
|
||||
"description": "Modelo principal com melhor desempenho, adequado para tarefas complexas, apresentando ótimos resultados em perguntas de referência, resumos, criação, classificação de texto, interpretação de papéis e outros cenários. Suporta inferência e fine-tuning com janela de contexto de 32k."
|
||||
},
|
||||
"Doubao-pro-4k": {
|
||||
"description": "O modelo principal com o melhor desempenho, adequado para tarefas complexas, apresentando excelentes resultados em cenários como perguntas e respostas, resumos, criação, classificação de texto e interpretação de papéis. Suporta raciocínio e ajuste fino em janelas de contexto de 4k."
|
||||
},
|
||||
"Doubao-vision-lite-32k": {
|
||||
"description": "O modelo Doubao-vision é um modelo multimodal de grande porte lançado pela Doubao, com poderosas capacidades de compreensão e raciocínio de imagens, além de uma compreensão precisa de instruções. O modelo demonstrou um desempenho robusto em extração de informações textuais de imagens e tarefas de raciocínio baseadas em imagens, podendo ser aplicado em tarefas de perguntas e respostas visuais mais complexas e abrangentes."
|
||||
},
|
||||
"Doubao-vision-pro-32k": {
|
||||
"description": "O modelo Doubao-vision é um modelo multimodal de grande porte lançado pela Doubao, com poderosas capacidades de compreensão e raciocínio de imagens, além de uma compreensão precisa de instruções. O modelo demonstrou um desempenho robusto em extração de informações textuais de imagens e tarefas de raciocínio baseadas em imagens, podendo ser aplicado em tarefas de perguntas e respostas visuais mais complexas e abrangentes."
|
||||
"description": "Modelo principal com melhor desempenho, adequado para tarefas complexas, apresentando ótimos resultados em perguntas de referência, resumos, criação, classificação de texto, interpretação de papéis e outros cenários. Suporta inferência e fine-tuning com janela de contexto de 4k."
|
||||
},
|
||||
"ERNIE-3.5-128K": {
|
||||
"description": "Modelo de linguagem de grande escala desenvolvido pela Baidu, cobrindo uma vasta quantidade de dados em chinês e inglês, com poderosas capacidades gerais, capaz de atender à maioria das demandas de perguntas e respostas em diálogos, geração de conteúdo e aplicações de plugins; suporta integração automática com o plugin de busca da Baidu, garantindo a atualidade das informações nas respostas."
|
||||
@@ -224,24 +203,21 @@
|
||||
"Pro/Qwen/Qwen2.5-VL-7B-Instruct": {
|
||||
"description": "Qwen2.5-VL é o novo membro da série Qwen, com capacidades avançadas de compreensão visual. Ele pode analisar textos, gráficos e layouts em imagens, compreender vídeos longos e capturar eventos. Capaz de realizar raciocínios, manipular ferramentas, suporta localização de objetos em múltiplos formatos e geração de saídas estruturadas. Otimiza a compreensão de vídeos através de treinamento com resolução dinâmica e taxa de quadros, além de melhorar a eficiência do codificador visual."
|
||||
},
|
||||
"Pro/THUDM/GLM-4.1V-9B-Thinking": {
|
||||
"description": "GLM-4.1V-9B-Thinking é um modelo de linguagem visual (VLM) de código aberto lançado em conjunto pela Zhipu AI e pelo Laboratório KEG da Universidade de Tsinghua, projetado para lidar com tarefas cognitivas multimodais complexas. Este modelo é baseado no modelo base GLM-4-9B-0414 e melhora significativamente sua capacidade e estabilidade de raciocínio multimodal ao introduzir o mecanismo de raciocínio \"Chain-of-Thought\" (Cadeia de Pensamento) e adotar estratégias de aprendizado por reforço."
|
||||
},
|
||||
"Pro/THUDM/glm-4-9b-chat": {
|
||||
"description": "GLM-4-9B-Chat é a versão de código aberto da série de modelos pré-treinados GLM-4 lançada pela Zhipu AI. Este modelo se destaca em semântica, matemática, raciocínio, código e conhecimento. Além de suportar diálogos de múltiplas rodadas, o GLM-4-9B-Chat também possui recursos avançados como navegação na web, execução de código, chamadas de ferramentas personalizadas (Function Call) e raciocínio de longo texto. O modelo suporta 26 idiomas, incluindo chinês, inglês, japonês, coreano e alemão. Em vários benchmarks, o GLM-4-9B-Chat demonstrou desempenho excepcional, como AlignBench-v2, MT-Bench, MMLU e C-Eval. O modelo suporta um comprimento de contexto máximo de 128K, adequado para pesquisa acadêmica e aplicações comerciais."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1": {
|
||||
"description": "DeepSeek-R1 é um modelo de inferência impulsionado por aprendizado por reforço (RL), que resolve problemas de repetitividade e legibilidade no modelo. Antes do RL, o DeepSeek-R1 introduziu dados de inicialização a frio, otimizando ainda mais o desempenho de inferência. Ele se compara ao OpenAI-o1 em tarefas matemáticas, de código e de inferência, e melhora o desempenho geral por meio de métodos de treinamento cuidadosamente projetados."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1-0120": {
|
||||
"description": "DeepSeek-R1 é um modelo de raciocínio impulsionado por aprendizado por reforço (RL), que resolve problemas de repetição e legibilidade no modelo. Antes do RL, DeepSeek-R1 introduziu dados de cold start para otimizar ainda mais o desempenho do raciocínio. Ele apresenta desempenho comparável ao OpenAI-o1 em tarefas de matemática, código e raciocínio, e melhora o desempenho geral por meio de métodos de treinamento cuidadosamente projetados."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B": {
|
||||
"description": "DeepSeek-R1-Distill-Qwen-7B é um modelo obtido por destilação de conhecimento baseado no Qwen2.5-Math-7B. Este modelo foi refinado usando 800 mil amostras selecionadas geradas pelo DeepSeek-R1, demonstrando excelente capacidade de raciocínio. Apresenta desempenho destacado em diversos benchmarks, alcançando 92,8% de precisão no MATH-500, 55,5% de taxa de aprovação no AIME 2024 e uma pontuação de 1189 no CodeForces, mostrando forte competência em matemática e programação para um modelo de escala 7B."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-V3": {
|
||||
"description": "DeepSeek-V3 é um modelo de linguagem com 671 bilhões de parâmetros, utilizando uma arquitetura de especialistas mistos (MoE) com atenção potencial de múltiplas cabeças (MLA) e uma estratégia de balanceamento de carga sem perda auxiliar, otimizando a eficiência de inferência e treinamento. Pré-treinado em 14,8 trilhões de tokens de alta qualidade, e ajustado por supervisão e aprendizado por reforço, o DeepSeek-V3 supera outros modelos de código aberto, aproximando-se de modelos fechados líderes."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-V3-1226": {
|
||||
"description": "DeepSeek-V3 é um modelo de linguagem híbrido de especialistas (MoE) com 671 bilhões de parâmetros, utilizando atenção latente multi-cabeça (MLA) e a arquitetura DeepSeekMoE, combinando uma estratégia de balanceamento de carga sem perda auxiliar para otimizar a eficiência de inferência e treinamento. Pré-treinado em 14,8 trilhões de tokens de alta qualidade, e passando por ajuste fino supervisionado e aprendizado por reforço, o DeepSeek-V3 supera outros modelos de código aberto em desempenho, aproximando-se de modelos fechados líderes."
|
||||
},
|
||||
"QwQ-32B-Preview": {
|
||||
"description": "O QwQ-32B-Preview é um modelo de processamento de linguagem natural inovador, capaz de lidar eficientemente com tarefas complexas de geração de diálogos e compreensão de contexto."
|
||||
},
|
||||
@@ -404,6 +380,9 @@
|
||||
"THUDM/GLM-4-9B-0414": {
|
||||
"description": "GLM-4-9B-0414 é um modelo compacto da série GLM, com 9 bilhões de parâmetros. Este modelo herda as características técnicas da série GLM-4-32B, mas oferece uma opção de implantação mais leve. Apesar de seu tamanho menor, o GLM-4-9B-0414 ainda demonstra habilidades excepcionais em tarefas de geração de código, design de páginas da web, geração de gráficos SVG e redação baseada em pesquisa."
|
||||
},
|
||||
"THUDM/GLM-4.1V-9B-Thinking": {
|
||||
"description": "GLM-4.1V-9B-Thinking é um modelo de linguagem visual (VLM) de código aberto lançado em conjunto pela Zhipu AI e pelo Laboratório KEG da Universidade de Tsinghua, projetado para lidar com tarefas cognitivas multimodais complexas. Este modelo é baseado no modelo base GLM-4-9B-0414 e melhora significativamente sua capacidade e estabilidade de raciocínio multimodal ao introduzir o mecanismo de raciocínio \"Chain-of-Thought\" (Cadeia de Pensamento) e adotar estratégias de aprendizado por reforço."
|
||||
},
|
||||
"THUDM/GLM-Z1-32B-0414": {
|
||||
"description": "GLM-Z1-32B-0414 é um modelo de inferência com capacidade de pensamento profundo. Este modelo é baseado no GLM-4-32B-0414, desenvolvido através de inicialização a frio e aprendizado por reforço expandido, e foi treinado adicionalmente em tarefas de matemática, código e lógica. Em comparação com o modelo base, o GLM-Z1-32B-0414 melhorou significativamente suas habilidades matemáticas e capacidade de resolver tarefas complexas."
|
||||
},
|
||||
@@ -560,6 +539,9 @@
|
||||
"anthropic/claude-sonnet-4": {
|
||||
"description": "Claude Sonnet 4 pode gerar respostas quase instantâneas ou um pensamento gradual prolongado, permitindo que os usuários vejam claramente esses processos. Usuários da API também podem controlar detalhadamente o tempo de raciocínio do modelo."
|
||||
},
|
||||
"ascend-tribe/pangu-pro-moe": {
|
||||
"description": "Pangu-Pro-MoE 72B-A16B é um modelo de linguagem grande esparso com 72 bilhões de parâmetros e 16 bilhões de parâmetros ativados, baseado na arquitetura Mixture of Experts em grupos (MoGE). Ele agrupa especialistas na fase de seleção e restringe a ativação de um número igual de especialistas dentro de cada grupo para cada token, alcançando equilíbrio na carga dos especialistas e melhorando significativamente a eficiência de implantação do modelo na plataforma Ascend."
|
||||
},
|
||||
"aya": {
|
||||
"description": "Aya 23 é um modelo multilíngue lançado pela Cohere, suportando 23 idiomas, facilitando aplicações linguísticas diversificadas."
|
||||
},
|
||||
@@ -569,6 +551,9 @@
|
||||
"baichuan/baichuan2-13b-chat": {
|
||||
"description": "Baichuan-13B é um modelo de linguagem de código aberto e comercializável desenvolvido pela Baichuan Intelligence, contendo 13 bilhões de parâmetros, alcançando os melhores resultados em benchmarks de chinês e inglês na mesma dimensão."
|
||||
},
|
||||
"baidu/ERNIE-4.5-300B-A47B": {
|
||||
"description": "ERNIE-4.5-300B-A47B é um modelo de linguagem grande baseado na arquitetura Mixture of Experts (MoE), desenvolvido pela Baidu. Com um total de 300 bilhões de parâmetros, ativa apenas 47 bilhões por token durante a inferência, equilibrando desempenho robusto e eficiência computacional. Como um dos modelos centrais da série ERNIE 4.5, demonstra capacidades excepcionais em compreensão, geração, raciocínio textual e programação. O modelo utiliza um método inovador de pré-treinamento multimodal heterogêneo MoE, treinando conjuntamente texto e visão, o que melhora significativamente suas habilidades gerais, especialmente em seguir instruções e memória de conhecimento mundial."
|
||||
},
|
||||
"c4ai-aya-expanse-32b": {
|
||||
"description": "Aya Expanse é um modelo multilíngue de alto desempenho com 32B, projetado para desafiar o desempenho de modelos monolíngues por meio de inovações em ajuste por instrução, arbitragem de dados, treinamento de preferências e fusão de modelos. Ele suporta 23 idiomas."
|
||||
},
|
||||
@@ -666,7 +651,7 @@
|
||||
"description": "Codestral é um modelo gerador de ponta focado em geração de código, otimizado para preenchimento intermediário e tarefas de conclusão de código."
|
||||
},
|
||||
"codex-mini-latest": {
|
||||
"description": "codex-mini-latest é uma versão ajustada do o4-mini, especialmente para o Codex CLI. Para uso direto via API, recomendamos começar com o gpt-4.1."
|
||||
"description": "codex-mini-latest é uma versão ajustada do o4-mini, especialmente para Codex CLI. Para uso direto via API, recomendamos começar pelo gpt-4.1."
|
||||
},
|
||||
"cognitivecomputations/dolphin-mixtral-8x22b": {
|
||||
"description": "Dolphin Mixtral 8x22B é um modelo projetado para seguir instruções, diálogos e programação."
|
||||
@@ -914,17 +899,53 @@
|
||||
"doubao-1.5-thinking-pro": {
|
||||
"description": "O modelo de pensamento profundo Doubao-1.5 apresenta um desempenho excepcional em áreas especializadas como matemática, programação e raciocínio científico, além de tarefas gerais como escrita criativa. Ele alcançou ou se aproximou do nível de elite da indústria em várias referências respeitáveis, como AIME 2024, Codeforces e GPQA. Suporta uma janela de contexto de 128k e uma saída de 16k."
|
||||
},
|
||||
"doubao-1.5-thinking-pro-m": {
|
||||
"description": "Doubao-1.5 é um novo modelo de pensamento profundo (versão m com capacidade nativa de inferência multimodal profunda), destacando-se em matemática, programação, raciocínio científico e tarefas gerais como escrita criativa. Alcança ou se aproxima do topo da indústria em benchmarks como AIME 2024, Codeforces e GPQA. Suporta janela de contexto de 128k e saída de 16k."
|
||||
},
|
||||
"doubao-1.5-thinking-vision-pro": {
|
||||
"description": "Novo modelo de pensamento profundo visual, com capacidades avançadas de compreensão e inferência multimodal geral, alcançando desempenho SOTA em 37 dos 59 benchmarks públicos."
|
||||
},
|
||||
"doubao-1.5-ui-tars": {
|
||||
"description": "Doubao-1.5-UI-TARS é um modelo Agent nativo para interação com interfaces gráficas (GUI). Possui habilidades humanas de percepção, raciocínio e ação para interação fluida com GUIs."
|
||||
},
|
||||
"doubao-1.5-vision-lite": {
|
||||
"description": "Doubao-1.5-vision-lite é um modelo multimodal atualizado, suportando reconhecimento de imagens de qualquer resolução e proporções extremas, melhorando a capacidade de raciocínio visual, reconhecimento de documentos, compreensão de informações detalhadas e seguimento de instruções. Suporta uma janela de contexto de 128k, com comprimento de saída de até 16k tokens."
|
||||
},
|
||||
"doubao-1.5-vision-pro": {
|
||||
"description": "Doubao-1.5-vision-pro é um modelo multimodal avançado, suportando reconhecimento de imagens em qualquer resolução e proporção extrema, com capacidades aprimoradas de raciocínio visual, reconhecimento de documentos, compreensão de detalhes e seguimento de instruções."
|
||||
},
|
||||
"doubao-1.5-vision-pro-32k": {
|
||||
"description": "Doubao-1.5-vision-pro é um modelo multimodal avançado, suportando reconhecimento de imagens em qualquer resolução e proporção extrema, com capacidades aprimoradas de raciocínio visual, reconhecimento de documentos, compreensão de detalhes e seguimento de instruções."
|
||||
},
|
||||
"doubao-lite-128k": {
|
||||
"description": "Oferece velocidade de resposta extrema e melhor custo-benefício, proporcionando opções mais flexíveis para diferentes cenários dos clientes. Suporta inferência e fine-tuning com janela de contexto de 128k."
|
||||
},
|
||||
"doubao-lite-32k": {
|
||||
"description": "Oferece velocidade de resposta extrema e melhor custo-benefício, proporcionando opções mais flexíveis para diferentes cenários dos clientes. Suporta inferência e fine-tuning com janela de contexto de 32k."
|
||||
},
|
||||
"doubao-lite-4k": {
|
||||
"description": "Oferece velocidade de resposta extrema e melhor custo-benefício, proporcionando opções mais flexíveis para diferentes cenários dos clientes. Suporta inferência e fine-tuning com janela de contexto de 4k."
|
||||
},
|
||||
"doubao-pro-256k": {
|
||||
"description": "Modelo principal com melhor desempenho, adequado para tarefas complexas, apresentando ótimos resultados em perguntas de referência, resumos, criação, classificação de texto, interpretação de papéis e outros cenários. Suporta inferência e fine-tuning com janela de contexto de 256k."
|
||||
},
|
||||
"doubao-pro-32k": {
|
||||
"description": "Modelo principal com melhor desempenho, adequado para tarefas complexas, apresentando ótimos resultados em perguntas de referência, resumos, criação, classificação de texto, interpretação de papéis e outros cenários. Suporta inferência e fine-tuning com janela de contexto de 32k."
|
||||
},
|
||||
"doubao-seed-1.6": {
|
||||
"description": "Doubao-Seed-1.6 é um novo modelo multimodal de pensamento profundo, suportando três modos de pensamento: auto, thinking e non-thinking. No modo non-thinking, o desempenho do modelo melhora significativamente em comparação com Doubao-1.5-pro/250115. Suporta janela de contexto de 256k e comprimento máximo de saída de 16k tokens."
|
||||
"description": "Doubao-Seed-1.6 é um novo modelo multimodal de pensamento profundo, suportando três modos de pensamento: auto, thinking e non-thinking. No modo non-thinking, o desempenho supera significativamente o Doubao-1.5-pro/250115. Suporta janela de contexto de 256k e saída de até 16k tokens."
|
||||
},
|
||||
"doubao-seed-1.6-flash": {
|
||||
"description": "Doubao-Seed-1.6-flash é um modelo multimodal de pensamento profundo com velocidade de inferência extrema, TPOT de apenas 10ms; suporta compreensão de texto e visual, com capacidade de compreensão textual superior à geração lite anterior e compreensão visual comparável aos modelos pro da concorrência. Suporta janela de contexto de 256k e comprimento máximo de saída de 16k tokens."
|
||||
"description": "Doubao-Seed-1.6-flash é um modelo multimodal de pensamento profundo com velocidade de inferência extrema, TPOT de apenas 10ms; suporta compreensão textual e visual, com capacidade textual superior à geração lite anterior e compreensão visual comparável à série pro dos concorrentes. Suporta janela de contexto de 256k e saída de até 16k tokens."
|
||||
},
|
||||
"doubao-seed-1.6-thinking": {
|
||||
"description": "O modelo Doubao-Seed-1.6-thinking tem capacidade de pensamento significativamente reforçada, melhorando ainda mais as habilidades básicas em Coding, Matemática e raciocínio lógico em comparação com Doubao-1.5-thinking-pro, além de suportar compreensão visual. Suporta janela de contexto de 256k e comprimento máximo de saída de 16k tokens."
|
||||
"description": "Doubao-Seed-1.6-thinking tem capacidade de pensamento significativamente reforçada, melhorando ainda mais habilidades básicas como codificação, matemática e raciocínio lógico em comparação com Doubao-1.5-thinking-pro, além de suportar compreensão visual. Suporta janela de contexto de 256k e saída de até 16k tokens."
|
||||
},
|
||||
"doubao-vision-lite-32k": {
|
||||
"description": "O modelo Doubao-vision é um grande modelo multimodal lançado pela Doubao, com forte capacidade de compreensão e inferência de imagens, além de compreensão precisa de instruções. O modelo demonstra desempenho robusto em extração de informações de texto em imagens e tarefas de inferência baseadas em imagens, podendo ser aplicado a tarefas visuais de perguntas e respostas mais complexas e amplas."
|
||||
},
|
||||
"doubao-vision-pro-32k": {
|
||||
"description": "O modelo Doubao-vision é um grande modelo multimodal lançado pela Doubao, com forte capacidade de compreensão e inferência de imagens, além de compreensão precisa de instruções. O modelo demonstra desempenho robusto em extração de informações de texto em imagens e tarefas de inferência baseadas em imagens, podendo ser aplicado a tarefas visuais de perguntas e respostas mais complexas e amplas."
|
||||
},
|
||||
"emohaa": {
|
||||
"description": "O Emohaa é um modelo psicológico com capacidade de consultoria profissional, ajudando os usuários a entender questões emocionais."
|
||||
@@ -1082,9 +1103,6 @@
|
||||
"gemini-2.5-pro": {
|
||||
"description": "Gemini 2.5 Pro é o modelo de pensamento mais avançado do Google, capaz de raciocinar sobre código, matemática e problemas complexos nas áreas de STEM, além de analisar grandes conjuntos de dados, bases de código e documentos usando contextos longos."
|
||||
},
|
||||
"gemini-2.5-pro-exp-03-25": {
|
||||
"description": "O Gemini 2.5 Pro Experimental é o modelo de pensamento mais avançado do Google, capaz de raciocinar sobre problemas complexos em código, matemática e áreas STEM, além de analisar grandes conjuntos de dados, repositórios de código e documentos utilizando contextos longos."
|
||||
},
|
||||
"gemini-2.5-pro-preview-03-25": {
|
||||
"description": "O Gemini 2.5 Pro Preview é o modelo de pensamento mais avançado do Google, capaz de raciocinar sobre problemas complexos em código, matemática e áreas STEM, além de analisar grandes conjuntos de dados, bibliotecas de código e documentos usando longos contextos."
|
||||
},
|
||||
@@ -1151,6 +1169,12 @@
|
||||
"glm-4-plus": {
|
||||
"description": "O GLM-4-Plus, como um modelo de alta inteligência, possui uma forte capacidade de lidar com textos longos e tarefas complexas, com desempenho amplamente aprimorado."
|
||||
},
|
||||
"glm-4.1v-thinking-flash": {
|
||||
"description": "A série GLM-4.1V-Thinking é atualmente o modelo visual mais potente conhecido na categoria de VLMs de 10 bilhões de parâmetros, integrando tarefas de linguagem visual de ponta no mesmo nível, incluindo compreensão de vídeo, perguntas e respostas sobre imagens, resolução de problemas acadêmicos, reconhecimento óptico de caracteres (OCR), interpretação de documentos e gráficos, agentes GUI, codificação front-end para web, grounding, entre outros. Suas capacidades em várias tarefas superam até modelos com 8 vezes mais parâmetros, como o Qwen2.5-VL-72B. Por meio de técnicas avançadas de aprendizado por reforço, o modelo domina o raciocínio em cadeia para melhorar a precisão e riqueza das respostas, superando significativamente modelos tradicionais sem o mecanismo thinking em termos de resultados finais e interpretabilidade."
|
||||
},
|
||||
"glm-4.1v-thinking-flashx": {
|
||||
"description": "A série GLM-4.1V-Thinking é atualmente o modelo visual mais potente conhecido na categoria de VLMs de 10 bilhões de parâmetros, integrando tarefas de linguagem visual de ponta no mesmo nível, incluindo compreensão de vídeo, perguntas e respostas sobre imagens, resolução de problemas acadêmicos, reconhecimento óptico de caracteres (OCR), interpretação de documentos e gráficos, agentes GUI, codificação front-end para web, grounding, entre outros. Suas capacidades em várias tarefas superam até modelos com 8 vezes mais parâmetros, como o Qwen2.5-VL-72B. Por meio de técnicas avançadas de aprendizado por reforço, o modelo domina o raciocínio em cadeia para melhorar a precisão e riqueza das respostas, superando significativamente modelos tradicionais sem o mecanismo thinking em termos de resultados finais e interpretabilidade."
|
||||
},
|
||||
"glm-4v": {
|
||||
"description": "O GLM-4V oferece uma forte capacidade de compreensão e raciocínio de imagens, suportando várias tarefas visuais."
|
||||
},
|
||||
@@ -1172,6 +1196,9 @@
|
||||
"glm-z1-flash": {
|
||||
"description": "A série GLM-Z1 possui forte capacidade de raciocínio complexo, destacando-se em raciocínio lógico, matemática e programação. O comprimento máximo do contexto é de 32K."
|
||||
},
|
||||
"glm-z1-flashx": {
|
||||
"description": "Alta velocidade e baixo custo: versão aprimorada Flash, com inferência ultrarrápida e garantia de concorrência mais rápida."
|
||||
},
|
||||
"glm-zero-preview": {
|
||||
"description": "O GLM-Zero-Preview possui uma poderosa capacidade de raciocínio complexo, destacando-se em áreas como raciocínio lógico, matemática e programação."
|
||||
},
|
||||
@@ -1223,6 +1250,9 @@
|
||||
"google/gemma-2b-it": {
|
||||
"description": "Gemma Instruct (2B) oferece capacidade básica de processamento de instruções, adequada para aplicações leves."
|
||||
},
|
||||
"google/gemma-3-1b-it": {
|
||||
"description": "Gemma 3 1B é um modelo de linguagem de código aberto do Google que estabelece novos padrões em eficiência e desempenho."
|
||||
},
|
||||
"google/gemma-3-27b-it": {
|
||||
"description": "Gemma 3 27B é um modelo de linguagem de código aberto do Google, que estabelece novos padrões em eficiência e desempenho."
|
||||
},
|
||||
@@ -1313,6 +1343,9 @@
|
||||
"gpt-4o-mini-search-preview": {
|
||||
"description": "A versão prévia do GPT-4o mini para busca é um modelo treinado especificamente para compreender e executar consultas de busca na web, utilizando a API Chat Completions. Além dos custos por token, as consultas de busca na web são cobradas por chamada da ferramenta."
|
||||
},
|
||||
"gpt-4o-mini-transcribe": {
|
||||
"description": "GPT-4o Mini Transcribe é um modelo de transcrição de áudio para texto que utiliza GPT-4o. Em comparação com o modelo Whisper original, melhora a taxa de erro de palavras, além do reconhecimento e precisão linguística. Use-o para obter transcrições mais precisas."
|
||||
},
|
||||
"gpt-4o-mini-tts": {
|
||||
"description": "GPT-4o mini TTS é um modelo de texto para fala baseado em GPT-4o mini, oferecendo uma geração de voz de alta qualidade a um custo mais baixo."
|
||||
},
|
||||
@@ -1322,12 +1355,15 @@
|
||||
"gpt-4o-realtime-preview-2024-10-01": {
|
||||
"description": "Versão em tempo real do GPT-4o, suporta entrada e saída de áudio e texto em tempo real."
|
||||
},
|
||||
"gpt-4o-realtime-preview-2024-12-17": {
|
||||
"description": "Versão em tempo real do GPT-4o, suporta entrada e saída de áudio e texto em tempo real."
|
||||
"gpt-4o-realtime-preview-2025-06-03": {
|
||||
"description": "Versão em tempo real do GPT-4o, suportando entrada e saída de áudio e texto em tempo real."
|
||||
},
|
||||
"gpt-4o-search-preview": {
|
||||
"description": "A versão prévia do GPT-4o para busca é um modelo treinado especificamente para compreender e executar consultas de busca na web, utilizando a API Chat Completions. Além dos custos por token, as consultas de busca na web são cobradas por chamada da ferramenta."
|
||||
},
|
||||
"gpt-4o-transcribe": {
|
||||
"description": "GPT-4o Transcribe é um modelo de transcrição de áudio para texto que utiliza GPT-4o. Em comparação com o modelo Whisper original, melhora a taxa de erro de palavras, além do reconhecimento e precisão linguística. Use-o para obter transcrições mais precisas."
|
||||
},
|
||||
"grok-2-1212": {
|
||||
"description": "Este modelo apresenta melhorias em precisão, conformidade com instruções e capacidade multilíngue."
|
||||
},
|
||||
@@ -1346,9 +1382,15 @@
|
||||
"grok-3-mini-fast": {
|
||||
"description": "Modelo leve que pensa antes de responder. Rápido e inteligente, adequado para tarefas lógicas que não exigem conhecimento profundo de domínio, e capaz de fornecer o rastro original do pensamento."
|
||||
},
|
||||
"grok-4": {
|
||||
"description": "Nosso mais recente e poderoso modelo principal, com desempenho excepcional em processamento de linguagem natural, cálculo matemático e raciocínio — um competidor versátil perfeito."
|
||||
},
|
||||
"gryphe/mythomax-l2-13b": {
|
||||
"description": "MythoMax l2 13B é um modelo de linguagem que combina criatividade e inteligência, integrando vários modelos de ponta."
|
||||
},
|
||||
"hunyuan-a13b": {
|
||||
"description": "O primeiro modelo de raciocínio híbrido da Hunyuan, uma versão aprimorada do hunyuan-standard-256K, com 80 bilhões de parâmetros totais e 13 bilhões ativados. O modo padrão é o modo de pensamento lento, com suporte para alternância entre modos rápido e lento via parâmetros ou instruções, usando prefixos query / no_think para alternar. A capacidade geral foi amplamente melhorada em relação à geração anterior, especialmente em matemática, ciências, compreensão de textos longos e habilidades de agente."
|
||||
},
|
||||
"hunyuan-code": {
|
||||
"description": "O mais recente modelo de geração de código Hunyuan, treinado com 200B de dados de código de alta qualidade, com seis meses de treinamento de dados SFT de alta qualidade, aumentando o comprimento da janela de contexto para 8K, destacando-se em métricas automáticas de geração de código em cinco linguagens; em avaliações de qualidade de código em dez aspectos em cinco linguagens, o desempenho está na primeira divisão."
|
||||
},
|
||||
@@ -1400,6 +1442,9 @@
|
||||
"hunyuan-t1-vision": {
|
||||
"description": "Modelo de pensamento profundo multimodal Hunyuan, suporta cadeias de pensamento nativas multimodais de longo alcance, excelente em diversos cenários de raciocínio com imagens, com melhorias significativas em problemas científicos em comparação com modelos de pensamento rápido."
|
||||
},
|
||||
"hunyuan-t1-vision-20250619": {
|
||||
"description": "A versão mais recente do modelo de pensamento profundo multimodal t1-vision da Hunyuan, que suporta cadeias de pensamento nativas multimodais, com melhorias abrangentes em relação à versão padrão anterior."
|
||||
},
|
||||
"hunyuan-turbo": {
|
||||
"description": "Versão de pré-visualização do novo modelo de linguagem de próxima geração Hunyuan, utilizando uma nova estrutura de modelo de especialistas mistos (MoE), com eficiência de inferência mais rápida e desempenho superior em comparação ao Hunyuan-Pro."
|
||||
},
|
||||
@@ -1430,6 +1475,12 @@
|
||||
"hunyuan-turbos-role-plus": {
|
||||
"description": "Modelo de interpretação de papéis da versão mais recente do Hunyuan, ajustado finamente pela equipe oficial Hunyuan. Baseado no modelo Hunyuan e treinado adicionalmente com conjuntos de dados de cenários de interpretação de papéis, oferecendo melhores resultados básicos nesses contextos."
|
||||
},
|
||||
"hunyuan-turbos-vision": {
|
||||
"description": "Este modelo é adequado para cenários de compreensão de imagens e texto, baseado na mais recente geração turbos da Hunyuan, um modelo de linguagem visual flagship focado em tarefas relacionadas à compreensão de imagens e texto, incluindo reconhecimento de entidades em imagens, perguntas e respostas baseadas em conhecimento, criação de textos e resolução de problemas por foto, com melhorias abrangentes em relação à geração anterior."
|
||||
},
|
||||
"hunyuan-turbos-vision-20250619": {
|
||||
"description": "A versão mais recente do modelo flagship de linguagem visual turbos-vision da Hunyuan, com melhorias abrangentes em tarefas relacionadas à compreensão de imagens e texto, incluindo reconhecimento de entidades em imagens, perguntas e respostas baseadas em conhecimento, criação de textos e resolução de problemas por foto, em comparação com a versão padrão anterior."
|
||||
},
|
||||
"hunyuan-vision": {
|
||||
"description": "O mais recente modelo multimodal Hunyuan, que suporta a entrada de imagens e texto para gerar conteúdo textual."
|
||||
},
|
||||
@@ -1457,6 +1508,9 @@
|
||||
"jina-deepsearch-v1": {
|
||||
"description": "A busca profunda combina pesquisa na web, leitura e raciocínio para realizar investigações abrangentes. Você pode vê-la como um agente que aceita suas tarefas de pesquisa - ela realizará uma busca extensa e passará por várias iterações antes de fornecer uma resposta. Esse processo envolve pesquisa contínua, raciocínio e resolução de problemas sob diferentes ângulos. Isso é fundamentalmente diferente de gerar respostas diretamente a partir de dados pré-treinados de grandes modelos padrão e de sistemas RAG tradicionais que dependem de buscas superficiais únicas."
|
||||
},
|
||||
"kimi-k2-0711-preview": {
|
||||
"description": "kimi-k2 é um modelo base com arquitetura MoE, com capacidades excepcionais em código e agentes, totalizando 1T de parâmetros e 32B de parâmetros ativados. Nos principais benchmarks de raciocínio de conhecimento geral, programação, matemática e agentes, o modelo K2 supera outros modelos open source populares."
|
||||
},
|
||||
"kimi-latest": {
|
||||
"description": "O produto assistente inteligente Kimi utiliza o mais recente modelo Kimi, que pode conter recursos ainda não estáveis. Suporta compreensão de imagens e seleciona automaticamente o modelo de cobrança de 8k/32k/128k com base no comprimento do contexto da solicitação."
|
||||
},
|
||||
@@ -1869,7 +1923,7 @@
|
||||
"description": "o1 é o novo modelo de raciocínio da OpenAI, adequado para tarefas complexas que exigem amplo conhecimento geral. Este modelo possui um contexto de 128K e uma data limite de conhecimento em outubro de 2023."
|
||||
},
|
||||
"o1-pro": {
|
||||
"description": "A série de modelos o1 é treinada com aprendizado por reforço, capaz de pensar antes de responder e executar tarefas complexas de raciocínio. O modelo o1-pro utiliza mais recursos computacionais para um pensamento mais profundo, oferecendo respostas de qualidade superior de forma contínua."
|
||||
"description": "A série o1 é treinada com aprendizado por reforço, capaz de pensar antes de responder e executar tarefas complexas de raciocínio. O modelo o1-pro utiliza mais recursos computacionais para um pensamento mais profundo, oferecendo respostas de qualidade superior continuamente."
|
||||
},
|
||||
"o3": {
|
||||
"description": "o3 é um modelo versátil e poderoso, com excelente desempenho em várias áreas. Ele estabelece novos padrões para tarefas de matemática, ciência, programação e raciocínio visual. Também é bom em redação técnica e seguimento de instruções. Os usuários podem utilizá-lo para analisar textos, códigos e imagens, resolvendo problemas complexos em múltiplas etapas."
|
||||
@@ -1881,7 +1935,7 @@
|
||||
"description": "o3-mini é nosso mais recente modelo de inferência em miniatura, oferecendo alta inteligência com os mesmos custos e metas de latência que o o1-mini."
|
||||
},
|
||||
"o3-pro": {
|
||||
"description": "O modelo o3-pro utiliza mais computação para pensar mais profundamente e sempre fornecer melhores respostas, suportado apenas para uso via Responses API."
|
||||
"description": "O modelo o3-pro utiliza mais computação para pensar mais profundamente e sempre fornecer respostas melhores, suportado apenas via API Responses."
|
||||
},
|
||||
"o4-mini": {
|
||||
"description": "o4-mini é nosso mais recente modelo compacto da série o. Ele é otimizado para inferência rápida e eficaz, apresentando alta eficiência e desempenho em tarefas de codificação e visuais."
|
||||
@@ -2349,7 +2403,7 @@
|
||||
"description": "O modelo v0-1.5-md é adequado para tarefas diárias e geração de interfaces de usuário (UI)"
|
||||
},
|
||||
"whisper-1": {
|
||||
"description": "Modelo de reconhecimento de voz universal, suporta reconhecimento de voz multilíngue, tradução de voz e identificação de idiomas."
|
||||
"description": "Modelo universal de reconhecimento de voz, suportando reconhecimento de voz multilíngue, tradução de voz e identificação de idioma."
|
||||
},
|
||||
"wizardlm2": {
|
||||
"description": "WizardLM 2 é um modelo de linguagem fornecido pela Microsoft AI, destacando-se em diálogos complexos, multilíngue, raciocínio e assistentes inteligentes."
|
||||
|
||||
@@ -520,6 +520,7 @@
|
||||
"hotkey": "Atalhos",
|
||||
"llm": "Modelo de Linguagem",
|
||||
"provider": "Fornecedor de IA",
|
||||
"proxy": "Proxy de Rede",
|
||||
"storage": "Armazenamento de Dados",
|
||||
"sync": "Sincronização na nuvem",
|
||||
"system-agent": "Assistente do Sistema",
|
||||
|
||||
@@ -46,6 +46,9 @@
|
||||
"reasoningEffort": {
|
||||
"title": "Интенсивность рассуждений"
|
||||
},
|
||||
"thinking": {
|
||||
"title": "Переключатель глубокого мышления"
|
||||
},
|
||||
"title": "Расширенные функции модели"
|
||||
},
|
||||
"history": {
|
||||
|
||||
@@ -1,4 +1,43 @@
|
||||
{
|
||||
"proxy": {
|
||||
"auth": "Требуется аутентификация",
|
||||
"authDesc": "Если прокси-сервер требует имя пользователя и пароль",
|
||||
"authSettings": "Настройки аутентификации",
|
||||
"basicSettings": "Настройки прокси",
|
||||
"basicSettingsDesc": "Настройка параметров подключения к прокси-серверу",
|
||||
"bypass": "Адреса без прокси",
|
||||
"connectionTest": "Тест подключения",
|
||||
"enable": "Включить прокси",
|
||||
"enableDesc": "При включении доступ в интернет будет осуществляться через прокси-сервер",
|
||||
"password": "Пароль",
|
||||
"password_placeholder": "Введите пароль",
|
||||
"port": "Порт",
|
||||
"resetButton": "Сбросить",
|
||||
"saveButton": "Сохранить",
|
||||
"saveFailed": "Ошибка сохранения: {{error}}",
|
||||
"saveSuccess": "Настройки прокси успешно сохранены",
|
||||
"server": "Адрес сервера",
|
||||
"testButton": "Проверить соединение",
|
||||
"testDescription": "Тестирование подключения с использованием текущих настроек прокси для проверки корректности конфигурации",
|
||||
"testFailed": "Подключение не удалось",
|
||||
"testSuccessWithTime": "Подключение успешно, время выполнения {{time}} мс",
|
||||
"testUrl": "Тестовый адрес",
|
||||
"testUrlPlaceholder": "Введите URL для тестирования",
|
||||
"testing": "Проверка соединения...",
|
||||
"type": "Тип прокси",
|
||||
"unsavedChanges": "У вас есть несохранённые изменения",
|
||||
"username": "Имя пользователя",
|
||||
"username_placeholder": "Введите имя пользователя",
|
||||
"validation": {
|
||||
"passwordRequired": "Пароль обязателен при включенной аутентификации",
|
||||
"portInvalid": "Порт должен быть числом от 1 до 65535",
|
||||
"portRequired": "Порт обязателен при включенном прокси",
|
||||
"serverInvalid": "Пожалуйста, введите корректный адрес сервера (IP или доменное имя)",
|
||||
"serverRequired": "Адрес сервера обязателен при включенном прокси",
|
||||
"typeRequired": "Тип прокси обязателен при включенном прокси",
|
||||
"usernameRequired": "Имя пользователя обязательно при включенной аутентификации"
|
||||
}
|
||||
},
|
||||
"remoteServer": {
|
||||
"authError": "Ошибка авторизации: {{error}}",
|
||||
"authPending": "Пожалуйста, завершите авторизацию в браузере",
|
||||
|
||||
+96
-42
@@ -71,44 +71,23 @@
|
||||
"DeepSeek-V3": {
|
||||
"description": "DeepSeek-V3 — это модель MoE, разработанная компанией DeepSeek. Результаты DeepSeek-V3 в нескольких оценках превосходят другие открытые модели, такие как Qwen2.5-72B и Llama-3.1-405B, и по производительности не уступают мировым ведущим закрытым моделям GPT-4o и Claude-3.5-Sonnet."
|
||||
},
|
||||
"Doubao-1.5-thinking-pro-m": {
|
||||
"description": "Doubao-1.5 — это новая модель глубокого размышления (версия m с встроенной многомодальной способностью глубокого рассуждения), которая демонстрирует выдающиеся результаты в профессиональных областях, таких как математика, программирование, научное рассуждение, а также в общих задачах, таких как креативное письмо, достигая или приближаясь к уровню первой группы в нескольких авторитетных бенчмарках, таких как AIME 2024, Codeforces, GPQA. Поддерживает контекстное окно 128k и вывод 16k."
|
||||
},
|
||||
"Doubao-1.5-thinking-vision-pro": {
|
||||
"description": "Совершенно новая модель глубокого визуального мышления, обладающая более сильными универсальными многомодальными способностями к пониманию и рассуждению, достигшая SOTA результатов в 37 из 59 открытых оценочных стандартов."
|
||||
},
|
||||
"Doubao-1.5-vision-pro": {
|
||||
"description": "Doubao-1.5-vision-pro — это новая усовершенствованная мультимодальная модель, поддерживающая распознавание изображений с любым разрешением и экстремальным соотношением сторон, улучшая способности к визуальному выводу, распознаванию документов, пониманию детальной информации и соблюдению инструкций."
|
||||
},
|
||||
"Doubao-1.5-vision-pro-32k": {
|
||||
"description": "Doubao-1.5-vision-pro - совершенно обновленная многомодальная большая модель, поддерживающая распознавание изображений с любым разрешением и экстремальными соотношениями сторон, улучшенная способность визуального вывода, распознавания документов, понимания деталей и соблюдения инструкций."
|
||||
},
|
||||
"Doubao-lite-128k": {
|
||||
"description": "Doubao-lite обеспечивает выдающуюся скорость отклика и лучшее соотношение цены и качества, предлагая клиентам больше гибкости в различных сценариях. Поддерживает вывод и настройку с 128k контекстным окном."
|
||||
"description": "Doubao-lite обладает исключительной скоростью отклика и лучшим соотношением цена-качество, предоставляя клиентам более гибкие варианты для различных сценариев. Поддерживает вывод и дообучение с контекстным окном в 128k."
|
||||
},
|
||||
"Doubao-lite-32k": {
|
||||
"description": "Doubao-lite обеспечивает выдающуюся скорость отклика и лучшее соотношение цены и качества, предлагая клиентам больше гибкости в различных сценариях. Поддерживает вывод и настройку с 32k контекстным окном."
|
||||
"description": "Doubao-lite обладает исключительной скоростью отклика и лучшим соотношением цена-качество, предоставляя клиентам более гибкие варианты для различных сценариев. Поддерживает вывод и дообучение с контекстным окном в 32k."
|
||||
},
|
||||
"Doubao-lite-4k": {
|
||||
"description": "Doubao-lite обеспечивает выдающуюся скорость отклика и лучшее соотношение цены и качества, предлагая клиентам больше гибкости в различных сценариях. Поддерживает вывод и настройку с 4k контекстным окном."
|
||||
"description": "Doubao-lite обладает исключительной скоростью отклика и лучшим соотношением цена-качество, предоставляя клиентам более гибкие варианты для различных сценариев. Поддерживает вывод и дообучение с контекстным окном в 4k."
|
||||
},
|
||||
"Doubao-pro-128k": {
|
||||
"description": "Модель основных характеристик с лучшими показателями, подходит для обработки сложных задач. Хорошо справляется с задачами референсного ответа, резюмирования, творчества, классификации текста, ролевого взаимодействия и т.д. Поддерживает вывод и настройку с 128k контекстным окном."
|
||||
},
|
||||
"Doubao-pro-256k": {
|
||||
"description": "Лучшая модель для основных задач, подходит для обработки сложных задач, демонстрирует отличные результаты в таких сценариях, как ответ на вопросы, резюмирование, творчество, классификация текста и ролевые игры. Поддерживает вывод на 256k контекстных окнах и тонкую настройку."
|
||||
"description": "Основная модель с наилучшей производительностью, подходящая для решения сложных задач. Отлично справляется с вопросами-ответами, резюмированием, творческим написанием, классификацией текста, ролевыми играми и другими сценариями. Поддерживает вывод и дообучение с контекстным окном в 128k."
|
||||
},
|
||||
"Doubao-pro-32k": {
|
||||
"description": "Модель основных характеристик с лучшими показателями, подходит для обработки сложных задач. Хорошо справляется с задачами референсного ответа, резюмирования, творчества, классификации текста, ролевого взаимодействия и т.д. Поддерживает вывод и настройку с 32k контекстным окном."
|
||||
"description": "Основная модель с наилучшей производительностью, подходящая для решения сложных задач. Отлично справляется с вопросами-ответами, резюмированием, творческим написанием, классификацией текста, ролевыми играми и другими сценариями. Поддерживает вывод и дообучение с контекстным окном в 32k."
|
||||
},
|
||||
"Doubao-pro-4k": {
|
||||
"description": "Модель основных характеристик с лучшими показателями, подходит для обработки сложных задач. Хорошо справляется с задачами референсного ответа, резюмирования, творчества, классификации текста, ролевого взаимодействия и т.д. Поддерживает вывод и настройку с 4k контекстным окном."
|
||||
},
|
||||
"Doubao-vision-lite-32k": {
|
||||
"description": "Модель Doubao-vision - это многомодальная большая модель, представленная Doubao, обладающая мощными способностями понимания и вывода изображений, а также точным пониманием инструкций. Модель демонстрирует выдающуюся производительность в извлечении текстовой информации из изображений и задачах вывода на основе изображений, что позволяет применять ее в более сложных и широких задачах визуального вопроса и ответа."
|
||||
},
|
||||
"Doubao-vision-pro-32k": {
|
||||
"description": "Модель Doubao-vision - это многомодальная большая модель, представленная Doubao, обладающая мощными способностями понимания и вывода изображений, а также точным пониманием инструкций. Модель демонстрирует выдающуюся производительность в извлечении текстовой информации из изображений и задачах вывода на основе изображений, что позволяет применять ее в более сложных и широких задачах визуального вопроса и ответа."
|
||||
"description": "Основная модель с наилучшей производительностью, подходящая для решения сложных задач. Отлично справляется с вопросами-ответами, резюмированием, творческим написанием, классификацией текста, ролевыми играми и другими сценариями. Поддерживает вывод и дообучение с контекстным окном в 4k."
|
||||
},
|
||||
"ERNIE-3.5-128K": {
|
||||
"description": "Флагманская крупномасштабная языковая модель, разработанная Baidu, охватывающая огромные объемы китайских и английских текстов, обладающая мощными универсальными возможностями, способная удовлетворить большинство требований к диалоговым ответам, генерации контента и сценариям использования плагинов; поддерживает автоматическую интеграцию с плагином поиска Baidu, обеспечивая актуальность информации в ответах."
|
||||
@@ -224,24 +203,21 @@
|
||||
"Pro/Qwen/Qwen2.5-VL-7B-Instruct": {
|
||||
"description": "Qwen2.5-VL — это новый член семейства Qwen, обладающий мощными возможностями визуального понимания. Может анализировать текст, диаграммы и компоновку в изображениях, понимать длинные видео и фиксировать события. Способен к логическим рассуждениям, работе с инструментами, поддерживает локализацию объектов в различных форматах и генерацию структурированных выводов. Оптимизирован для понимания видео с динамическим разрешением и частотой кадров, а также улучшена эффективность визуального кодировщика."
|
||||
},
|
||||
"Pro/THUDM/GLM-4.1V-9B-Thinking": {
|
||||
"description": "GLM-4.1V-9B-Thinking — это открытая визуально-языковая модель (VLM), совместно выпущенная Zhipu AI и лабораторией KEG Университета Цинхуа, специально разработанная для решения сложных мультимодальных когнитивных задач. Модель основана на базовой модели GLM-4-9B-0414 и значительно улучшает межмодальные способности рассуждения и стабильность за счёт внедрения механизма рассуждения «цепочка мышления» (Chain-of-Thought) и использования методов обучения с подкреплением."
|
||||
},
|
||||
"Pro/THUDM/glm-4-9b-chat": {
|
||||
"description": "GLM-4-9B-Chat — это открытая версия предобученной модели из серии GLM-4, выпущенная Zhizhu AI. Эта модель показывает отличные результаты в семантике, математике, выводах, коде и знаниях. Кроме поддержки многократных диалогов, GLM-4-9B-Chat также обладает продвинутыми функциями, такими как веб-браузинг, выполнение кода, вызов пользовательских инструментов (Function Call) и вывод длинных текстов. Модель поддерживает 26 языков, включая китайский, английский, японский, корейский и немецкий. В нескольких бенчмарках GLM-4-9B-Chat демонстрирует отличные результаты, такие как AlignBench-v2, MT-Bench, MMLU и C-Eval. Эта модель поддерживает максимальную длину контекста 128K и подходит для академических исследований и коммерческих приложений."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1": {
|
||||
"description": "DeepSeek-R1 — это модель вывода, управляемая обучением с подкреплением (RL), которая решает проблемы повторяемости и читаемости в модели. Перед RL DeepSeek-R1 вводит данные холодного старта, что дополнительно оптимизирует производительность вывода. Она показывает сопоставимые результаты с OpenAI-o1 в математических, кодовых и задачах вывода и улучшает общую эффективность благодаря тщательно продуманным методам обучения."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1-0120": {
|
||||
"description": "DeepSeek-R1 — модель рассуждений, управляемая обучением с подкреплением (RL), решающая проблемы повторяемости и читаемости в моделях. Перед RL DeepSeek-R1 использовал данные холодного старта для дальнейшей оптимизации производительности рассуждений. Модель показывает сопоставимые с OpenAI-o1 результаты в математике, программировании и задачах рассуждения, а также улучшает общую эффективность благодаря тщательно разработанным методам обучения."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B": {
|
||||
"description": "DeepSeek-R1-Distill-Qwen-7B — это модель, полученная методом дистилляции знаний на основе Qwen2.5-Math-7B. Модель была доработана с использованием 800 тысяч отобранных образцов, сгенерированных DeepSeek-R1, и демонстрирует выдающиеся способности к логическому рассуждению. Показывает отличные результаты в различных тестах: точность 92,8% на MATH-500, проходной балл 55,5% на AIME 2024 и оценку 1189 на CodeForces, что подтверждает её высокие математические и программистские возможности для модели масштаба 7B."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-V3": {
|
||||
"description": "DeepSeek-V3 — это языковая модель с 6710 миллиардами параметров, использующая архитектуру смешанных экспертов (MoE) и многофункциональное внимание (MLA), в сочетании с стратегией балансировки нагрузки без вспомогательных потерь, оптимизирующая эффективность вывода и обучения. После предобучения на 14.8 триллионах высококачественных токенов и последующей контролируемой донастройки и обучения с подкреплением, DeepSeek-V3 превосходит другие открытые модели и приближается к ведущим закрытым моделям."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-V3-1226": {
|
||||
"description": "DeepSeek-V3 — это языковая модель с 6710 миллиардами параметров, использующая смешанную экспертизу (MoE), многоуровневое внимание (MLA) и архитектуру DeepSeekMoE, в сочетании с стратегией балансировки нагрузки без вспомогательных потерь, оптимизирующей эффективность вывода и обучения. Модель была предварительно обучена на 14,8 триллионах высококачественных токенов и прошла контрольную донастройку и обучение с подкреплением, что позволяет DeepSeek-V3 превосходить другие открытые модели и приближаться к ведущим закрытым моделям."
|
||||
},
|
||||
"QwQ-32B-Preview": {
|
||||
"description": "QwQ-32B-Preview — это инновационная модель обработки естественного языка, способная эффективно обрабатывать сложные задачи генерации диалогов и понимания контекста."
|
||||
},
|
||||
@@ -404,6 +380,9 @@
|
||||
"THUDM/GLM-4-9B-0414": {
|
||||
"description": "GLM-4-9B-0414 — это компактная модель серии GLM с 9 миллиардами параметров. Эта модель унаследовала технические характеристики серии GLM-4-32B, но предлагает более легкие варианты развертывания. Несмотря на меньший размер, GLM-4-9B-0414 все еще демонстрирует отличные способности в задачах генерации кода, веб-дизайна, генерации графики SVG и написания на основе поиска."
|
||||
},
|
||||
"THUDM/GLM-4.1V-9B-Thinking": {
|
||||
"description": "GLM-4.1V-9B-Thinking — это открытая визуально-языковая модель (VLM), совместно выпущенная Zhipu AI и лабораторией KEG Университета Цинхуа, специально разработанная для решения сложных мультимодальных когнитивных задач. Модель основана на базовой модели GLM-4-9B-0414 и значительно улучшает межмодальные способности рассуждения и стабильность за счёт внедрения механизма рассуждения «цепочка мышления» (Chain-of-Thought) и использования методов обучения с подкреплением."
|
||||
},
|
||||
"THUDM/GLM-Z1-32B-0414": {
|
||||
"description": "GLM-Z1-32B-0414 — это модель вывода с глубокими размышлениями. Эта модель основана на GLM-4-32B-0414 и была разработана с помощью холодного старта и расширенного усиленного обучения, а также была дополнительно обучена в задачах математики, кода и логики. По сравнению с базовой моделью, GLM-Z1-32B-0414 значительно улучшила математические способности и способности к решению сложных задач."
|
||||
},
|
||||
@@ -560,6 +539,9 @@
|
||||
"anthropic/claude-sonnet-4": {
|
||||
"description": "Claude Sonnet 4 способен генерировать практически мгновенные ответы или длительные поэтапные размышления, которые пользователи могут ясно отслеживать. API-пользователи также могут точно контролировать время размышлений модели."
|
||||
},
|
||||
"ascend-tribe/pangu-pro-moe": {
|
||||
"description": "Pangu-Pro-MoE 72B-A16B — это разреженная большая языковая модель с 72 миллиардами параметров и 16 миллиардами активных параметров, основанная на архитектуре группового смешанного эксперта (MoGE). В фазе выбора экспертов эксперты группируются, и токен активирует равное количество экспертов в каждой группе, что обеспечивает баланс нагрузки между экспертами и значительно повышает эффективность развертывания модели на платформе Ascend."
|
||||
},
|
||||
"aya": {
|
||||
"description": "Aya 23 — это многоязычная модель, выпущенная Cohere, поддерживающая 23 языка, обеспечивая удобство для многоязычных приложений."
|
||||
},
|
||||
@@ -569,6 +551,9 @@
|
||||
"baichuan/baichuan2-13b-chat": {
|
||||
"description": "Baichuan-13B — это открытая коммерческая крупная языковая модель с 13 миллиардами параметров, разработанная Baichuan Intelligence, которая показала лучшие результаты среди моделей того же размера на авторитетных бенчмарках на китайском и английском языках."
|
||||
},
|
||||
"baidu/ERNIE-4.5-300B-A47B": {
|
||||
"description": "ERNIE-4.5-300B-A47B — большая языковая модель, разработанная компанией Baidu на основе архитектуры смешанных экспертов (MoE). Общий объём параметров модели составляет 300 миллиардов, однако при выводе активируется только 47 миллиардов параметров на токен, что обеспечивает высокую производительность при оптимальной вычислительной эффективности. Как одна из ключевых моделей серии ERNIE 4.5, она демонстрирует выдающиеся способности в задачах понимания текста, генерации, рассуждения и программирования. Модель использует инновационный метод предварительного обучения с мультимодальным гетерогенным MoE, объединяющий текстовые и визуальные модальности, что значительно повышает её универсальные возможности, особенно в следовании инструкциям и запоминании знаний о мире."
|
||||
},
|
||||
"c4ai-aya-expanse-32b": {
|
||||
"description": "Aya Expanse — это высокопроизводительная многоязычная модель 32B, созданная для того, чтобы бросить вызов производительности одноязычных моделей с помощью инноваций в области настройки по инструкциям, арбитража данных, обучения предпочтениям и объединения моделей. Она поддерживает 23 языка."
|
||||
},
|
||||
@@ -914,17 +899,53 @@
|
||||
"doubao-1.5-thinking-pro": {
|
||||
"description": "Doubao-1.5 — это новая модель глубокого мышления, которая демонстрирует выдающиеся результаты в таких профессиональных областях, как математика, программирование, научное мышление, а также в универсальных задачах креативного письма. Она достигает или приближается к уровню первой группы в отрасли на нескольких авторитетных бенчмарках, таких как AIME 2024, Codeforces, GPQA. Поддерживает контекстное окно 128k и вывод 16k."
|
||||
},
|
||||
"doubao-1.5-thinking-pro-m": {
|
||||
"description": "Новая глубокая модель мышления Doubao-1.5 (версия m оснащена нативной мультимодальной глубокой способностью вывода), демонстрирует выдающиеся результаты в профессиональных областях, таких как математика, программирование, научное рассуждение, а также в творческом письме и универсальных задачах. Достигла или приблизилась к первому уровню в отрасли по ряду авторитетных бенчмарков, включая AIME 2024, Codeforces, GPQA. Поддерживает контекстное окно 128k и вывод до 16k."
|
||||
},
|
||||
"doubao-1.5-thinking-vision-pro": {
|
||||
"description": "Новая визуальная модель глубокого мышления с усиленными универсальными мультимодальными возможностями понимания и вывода, достигшая SOTA результатов в 37 из 59 открытых бенчмарков."
|
||||
},
|
||||
"doubao-1.5-ui-tars": {
|
||||
"description": "Doubao-1.5-UI-TARS — нативная модель агента, ориентированная на взаимодействие с графическим интерфейсом пользователя (GUI). Обеспечивает бесшовное взаимодействие с GUI через восприятие, рассуждение и действия, имитируя человеческие способности."
|
||||
},
|
||||
"doubao-1.5-vision-lite": {
|
||||
"description": "Doubao-1.5-vision-lite — это новая усовершенствованная мультимодальная модель, поддерживающая распознавание изображений с любым разрешением и экстремальным соотношением сторон, улучшая способности к визуальному выводу, распознаванию документов, пониманию детальной информации и соблюдению инструкций. Поддерживает контекстное окно 128k, максимальная длина вывода составляет 16k токенов."
|
||||
},
|
||||
"doubao-1.5-vision-pro": {
|
||||
"description": "Полностью обновленная мультимодальная крупная модель Doubao-1.5-vision-pro, поддерживающая распознавание изображений с любым разрешением и экстремальными соотношениями сторон, улучшенная визуальная логика, распознавание документов, понимание деталей и следование инструкциям."
|
||||
},
|
||||
"doubao-1.5-vision-pro-32k": {
|
||||
"description": "Полностью обновленная мультимодальная крупная модель Doubao-1.5-vision-pro, поддерживающая распознавание изображений с любым разрешением и экстремальными соотношениями сторон, улучшенная визуальная логика, распознавание документов, понимание деталей и следование инструкциям."
|
||||
},
|
||||
"doubao-lite-128k": {
|
||||
"description": "Обладает исключительной скоростью отклика и лучшим соотношением цена-качество, предоставляя клиентам более гибкие варианты для различных сценариев. Поддерживает вывод и дообучение с контекстным окном в 128k."
|
||||
},
|
||||
"doubao-lite-32k": {
|
||||
"description": "Обладает исключительной скоростью отклика и лучшим соотношением цена-качество, предоставляя клиентам более гибкие варианты для различных сценариев. Поддерживает вывод и дообучение с контекстным окном в 32k."
|
||||
},
|
||||
"doubao-lite-4k": {
|
||||
"description": "Обладает исключительной скоростью отклика и лучшим соотношением цена-качество, предоставляя клиентам более гибкие варианты для различных сценариев. Поддерживает вывод и дообучение с контекстным окном в 4k."
|
||||
},
|
||||
"doubao-pro-256k": {
|
||||
"description": "Основная модель с наилучшей производительностью, подходящая для решения сложных задач. Отлично справляется с вопросами-ответами, резюмированием, творческим написанием, классификацией текста, ролевыми играми и другими сценариями. Поддерживает вывод и дообучение с контекстным окном в 256k."
|
||||
},
|
||||
"doubao-pro-32k": {
|
||||
"description": "Основная модель с наилучшей производительностью, подходящая для решения сложных задач. Отлично справляется с вопросами-ответами, резюмированием, творческим написанием, классификацией текста, ролевыми играми и другими сценариями. Поддерживает вывод и дообучение с контекстным окном в 32k."
|
||||
},
|
||||
"doubao-seed-1.6": {
|
||||
"description": "Doubao-Seed-1.6 — новая мультимодальная модель глубокого мышления, поддерживающая три режима мышления: auto, thinking и non-thinking. В режиме non-thinking производительность модели значительно выше по сравнению с Doubao-1.5-pro/250115. Поддерживает контекстное окно до 256k и максимальную длину вывода до 16k токенов."
|
||||
"description": "Doubao-Seed-1.6 — новая мультимодальная модель глубокого мышления, поддерживающая три режима мышления: auto, thinking и non-thinking. В режиме non-thinking производительность модели значительно выше по сравнению с Doubao-1.5-pro/250115. Поддерживает контекстное окно размером 256k и максимальную длину вывода до 16k токенов."
|
||||
},
|
||||
"doubao-seed-1.6-flash": {
|
||||
"description": "Doubao-Seed-1.6-flash — мультимодальная модель глубокого мышления с предельной скоростью вывода, TPOT занимает всего 10 мс; поддерживает понимание текста и визуальных данных, текстовое понимание превосходит предыдущую lite-версию, визуальное понимание сопоставимо с pro-серией конкурентов. Поддерживает контекстное окно до 256k и максимальную длину вывода до 16k токенов."
|
||||
"description": "Doubao-Seed-1.6-flash — мультимодальная модель глубокого мышления с экстремально высокой скоростью вывода, TPOT занимает всего 10 мс; поддерживает понимание текста и визуальных данных, текстовое понимание превосходит предыдущую lite-версию, визуальное понимание сопоставимо с pro-серией конкурентов. Поддерживает контекстное окно 256k и максимальную длину вывода до 16k токенов."
|
||||
},
|
||||
"doubao-seed-1.6-thinking": {
|
||||
"description": "Модель Doubao-Seed-1.6-thinking значительно усилена в способности к мышлению, по сравнению с Doubao-1.5-thinking-pro улучшены базовые навыки в программировании, математике и логическом рассуждении, поддерживает визуальное понимание. Поддерживает контекстное окно до 256k и максимальную длину вывода до 16k токенов."
|
||||
"description": "Модель Doubao-Seed-1.6-thinking значительно улучшена в плане мышления, по сравнению с Doubao-1.5-thinking-pro дополнительно повышены базовые способности в программировании, математике и логическом рассуждении, поддерживается визуальное понимание. Поддерживает контекстное окно 256k и максимальную длину вывода до 16k токенов."
|
||||
},
|
||||
"doubao-vision-lite-32k": {
|
||||
"description": "Модель Doubao-vision — мультимодальная крупная модель от Doubao, обладающая мощными возможностями понимания и вывода по изображениям, а также точным пониманием инструкций. Модель демонстрирует высокую производительность в задачах извлечения информации из изображений и текстов, а также в задачах вывода на основе изображений, что позволяет применять её в более сложных и широких визуальных вопросах."
|
||||
},
|
||||
"doubao-vision-pro-32k": {
|
||||
"description": "Модель Doubao-vision — мультимодальная крупная модель от Doubao, обладающая мощными возможностями понимания и вывода по изображениям, а также точным пониманием инструкций. Модель демонстрирует высокую производительность в задачах извлечения информации из изображений и текстов, а также в задачах вывода на основе изображений, что позволяет применять её в более сложных и широких визуальных вопросах."
|
||||
},
|
||||
"emohaa": {
|
||||
"description": "Emohaa — это психологическая модель, обладающая профессиональными консультационными способностями, помогающая пользователям понимать эмоциональные проблемы."
|
||||
@@ -1082,9 +1103,6 @@
|
||||
"gemini-2.5-pro": {
|
||||
"description": "Gemini 2.5 Pro — самая передовая модель мышления Google, способная рассуждать над сложными задачами в области кода, математики и STEM, а также анализировать большие наборы данных, кодовые базы и документы с использованием длинного контекста."
|
||||
},
|
||||
"gemini-2.5-pro-exp-03-25": {
|
||||
"description": "Gemini 2.5 Pro Experimental — это самая современная модель мышления от Google, способная рассуждать о сложных задачах в области кода, математики и STEM, а также анализировать большие наборы данных, кодовые базы и документы, используя длинный контекст."
|
||||
},
|
||||
"gemini-2.5-pro-preview-03-25": {
|
||||
"description": "Gemini 2.5 Pro Preview — это самая современная модель мышления от Google, способная рассуждать о сложных задачах в области кода, математики и STEM, а также анализировать большие наборы данных, кодовые базы и документы с использованием длинного контекста."
|
||||
},
|
||||
@@ -1151,6 +1169,12 @@
|
||||
"glm-4-plus": {
|
||||
"description": "GLM-4-Plus, как флагман с высоким интеллектом, обладает мощными способностями обработки длинных текстов и сложных задач, с полным улучшением производительности."
|
||||
},
|
||||
"glm-4.1v-thinking-flash": {
|
||||
"description": "Серия моделей GLM-4.1V-Thinking является самой производительной визуальной моделью уровня 10B VLM на сегодняшний день, объединяя передовые SOTA возможности в задачах визуально-языкового понимания, включая понимание видео, вопросы по изображениям, решение предметных задач, распознавание текста OCR, интерпретацию документов и графиков, GUI-агентов, фронтенд веб-кодинг, Grounding и другие. Во многих задачах её возможности превосходят Qwen2.5-VL-72B с параметрами в 8 раз больше. Благодаря передовым методам обучения с подкреплением модель овладела рассуждениями через цепочку мышления, что значительно повышает точность и полноту ответов, превосходя традиционные модели без thinking с точки зрения конечных результатов и интерпретируемости."
|
||||
},
|
||||
"glm-4.1v-thinking-flashx": {
|
||||
"description": "Серия моделей GLM-4.1V-Thinking является самой производительной визуальной моделью уровня 10B VLM на сегодняшний день, объединяя передовые SOTA возможности в задачах визуально-языкового понимания, включая понимание видео, вопросы по изображениям, решение предметных задач, распознавание текста OCR, интерпретацию документов и графиков, GUI-агентов, фронтенд веб-кодинг, Grounding и другие. Во многих задачах её возможности превосходят Qwen2.5-VL-72B с параметрами в 8 раз больше. Благодаря передовым методам обучения с подкреплением модель овладела рассуждениями через цепочку мышления, что значительно повышает точность и полноту ответов, превосходя традиционные модели без thinking с точки зрения конечных результатов и интерпретируемости."
|
||||
},
|
||||
"glm-4v": {
|
||||
"description": "GLM-4V предлагает мощные способности понимания и вывода изображений, поддерживает множество визуальных задач."
|
||||
},
|
||||
@@ -1172,6 +1196,9 @@
|
||||
"glm-z1-flash": {
|
||||
"description": "Серия GLM-Z1 обладает мощными способностями к сложному выводу, демонстрируя отличные результаты в логическом выводе, математике и программировании. Максимальная длина контекста составляет 32K."
|
||||
},
|
||||
"glm-z1-flashx": {
|
||||
"description": "Высокая скорость и низкая цена: улучшенная версия Flash с сверхбыстрой скоростью вывода и повышенной поддержкой параллельных запросов."
|
||||
},
|
||||
"glm-zero-preview": {
|
||||
"description": "GLM-Zero-Preview обладает мощными способностями к сложному выводу, демонстрируя отличные результаты в области логического вывода, математики и программирования."
|
||||
},
|
||||
@@ -1223,6 +1250,9 @@
|
||||
"google/gemma-2b-it": {
|
||||
"description": "Gemma Instruct (2B) предлагает базовые возможности обработки команд, подходящие для легковесных приложений."
|
||||
},
|
||||
"google/gemma-3-1b-it": {
|
||||
"description": "Gemma 3 1B — это открытая языковая модель от Google, установившая новые стандарты в эффективности и производительности."
|
||||
},
|
||||
"google/gemma-3-27b-it": {
|
||||
"description": "Gemma 3 27B — это открытая языковая модель от Google, которая установила новые стандарты в области эффективности и производительности."
|
||||
},
|
||||
@@ -1313,6 +1343,9 @@
|
||||
"gpt-4o-mini-search-preview": {
|
||||
"description": "GPT-4o mini — предварительная версия модели для поиска, специально обученная для понимания и выполнения запросов веб-поиска, использующая Chat Completions API. Помимо платы за токены, за каждый вызов инструмента веб-поиска взимается отдельная плата."
|
||||
},
|
||||
"gpt-4o-mini-transcribe": {
|
||||
"description": "GPT-4o Mini Transcribe — модель преобразования речи в текст, использующая GPT-4o для транскрибирования аудио. По сравнению с оригинальной моделью Whisper, она снижает количество ошибок в словах и повышает точность распознавания языка. Используйте её для более точной транскрипции."
|
||||
},
|
||||
"gpt-4o-mini-tts": {
|
||||
"description": "GPT-4o mini TTS — это модель преобразования текста в речь, основанная на GPT-4o mini, обеспечивающая высокое качество синтеза речи при низкой стоимости."
|
||||
},
|
||||
@@ -1322,12 +1355,15 @@
|
||||
"gpt-4o-realtime-preview-2024-10-01": {
|
||||
"description": "Реальная версия GPT-4o, поддерживающая аудио и текстовый ввод и вывод в реальном времени."
|
||||
},
|
||||
"gpt-4o-realtime-preview-2024-12-17": {
|
||||
"description": "Реальная версия GPT-4o, поддерживающая аудио и текстовый ввод и вывод в реальном времени."
|
||||
"gpt-4o-realtime-preview-2025-06-03": {
|
||||
"description": "Реальное время GPT-4o, поддерживает одновременный ввод и вывод аудио и текста."
|
||||
},
|
||||
"gpt-4o-search-preview": {
|
||||
"description": "GPT-4o — предварительная версия модели для поиска, специально обученная для понимания и выполнения запросов веб-поиска, использующая Chat Completions API. Помимо платы за токены, за каждый вызов инструмента веб-поиска взимается отдельная плата."
|
||||
},
|
||||
"gpt-4o-transcribe": {
|
||||
"description": "GPT-4o Transcribe — модель преобразования речи в текст, использующая GPT-4o для транскрибирования аудио. По сравнению с оригинальной моделью Whisper, она снижает количество ошибок в словах и повышает точность распознавания языка. Используйте её для более точной транскрипции."
|
||||
},
|
||||
"grok-2-1212": {
|
||||
"description": "Модель улучшена в точности, соблюдении инструкций и многоязычных возможностях."
|
||||
},
|
||||
@@ -1346,9 +1382,15 @@
|
||||
"grok-3-mini-fast": {
|
||||
"description": "Легковесная модель, которая сначала обдумывает ответ перед разговором. Быстрая и умная, подходит для логических задач без глубоких отраслевых знаний и позволяет проследить исходные размышления."
|
||||
},
|
||||
"grok-4": {
|
||||
"description": "Наша новейшая и самая мощная флагманская модель, демонстрирующая выдающиеся результаты в обработке естественного языка, математических вычислениях и логическом рассуждении — идеальный универсальный инструмент."
|
||||
},
|
||||
"gryphe/mythomax-l2-13b": {
|
||||
"description": "MythoMax l2 13B — это языковая модель, объединяющая креативность и интеллект, основанная на нескольких ведущих моделях."
|
||||
},
|
||||
"hunyuan-a13b": {
|
||||
"description": "Hunyuan — первая гибридная модель рассуждения, обновлённая версия hunyuan-standard-256K с общим числом параметров 80B и 13B активных параметров. По умолчанию работает в режиме медленного мышления, поддерживает переключение между режимами быстрого и медленного мышления через параметры или команды, переключение осуществляется добавлением / no_think перед запросом. Общие возможности значительно улучшены по сравнению с предыдущим поколением, особенно в математике, науке, понимании длинных текстов и агентских функциях."
|
||||
},
|
||||
"hunyuan-code": {
|
||||
"description": "Последняя модель генерации кода Hunyuan, обученная на базе 200B высококачественных данных кода, прошедшая полгода обучения на высококачественных данных SFT, с увеличенной длиной контекстного окна до 8K, занимает ведущие позиции по автоматическим оценочным показателям генерации кода на пяти языках; по десяти критериям оценки кода на пяти языках, производительность находится в первой группе."
|
||||
},
|
||||
@@ -1400,6 +1442,9 @@
|
||||
"hunyuan-t1-vision": {
|
||||
"description": "Глубокая мультимодальная модель понимания Hunyuan с нативной цепочкой размышлений для мультимодальных данных, отлично справляется с различными задачами рассуждения на изображениях, значительно превосходя модели быстрого мышления в решении научных задач."
|
||||
},
|
||||
"hunyuan-t1-vision-20250619": {
|
||||
"description": "Последняя версия модели hunyuan t1-vision для мультимодального понимания с глубокой цепочкой мышления, поддерживающая нативные мультимодальные цепочки рассуждений, с существенным улучшением по сравнению с предыдущей версией по умолчанию."
|
||||
},
|
||||
"hunyuan-turbo": {
|
||||
"description": "Предварительная версия нового поколения языковой модели Hunyuan, использующая совершенно новую структуру смешанной экспертной модели (MoE), которая обеспечивает более быструю эффективность вывода и более сильные результаты по сравнению с hunyuan-pro."
|
||||
},
|
||||
@@ -1430,6 +1475,12 @@
|
||||
"hunyuan-turbos-role-plus": {
|
||||
"description": "Последняя версия модели ролевых игр Hunyuan, официально дообученная модель, основанная на Hunyuan и дополненная данными для ролевых сценариев, обеспечивающая лучшие базовые результаты в ролевых играх."
|
||||
},
|
||||
"hunyuan-turbos-vision": {
|
||||
"description": "Эта модель предназначена для задач понимания изображений и текста, основана на последней версии hunyuan turbos и является новым флагманским визуально-языковым большим моделью, сосредоточенной на задачах распознавания объектов на изображениях, ответах на вопросы, создании текстов и решении задач по фотографиям, с существенным улучшением по сравнению с предыдущим поколением."
|
||||
},
|
||||
"hunyuan-turbos-vision-20250619": {
|
||||
"description": "Последняя версия флагманской визуально-языковой модели hunyuan turbos-vision, значительно улучшенная по сравнению с предыдущей версией по умолчанию в задачах понимания изображений и текста, включая распознавание объектов на изображениях, ответы на вопросы, создание текстов и решение задач по фотографиям."
|
||||
},
|
||||
"hunyuan-vision": {
|
||||
"description": "Последняя многомодальная модель Hunyuan, поддерживающая ввод изображений и текста для генерации текстового контента."
|
||||
},
|
||||
@@ -1457,6 +1508,9 @@
|
||||
"jina-deepsearch-v1": {
|
||||
"description": "Глубокий поиск сочетает в себе сетевой поиск, чтение и рассуждение, позволяя проводить всесторонние исследования. Вы можете рассматривать его как агента, который принимает ваши исследовательские задачи — он проводит обширный поиск и проходит через множество итераций, прежде чем предоставить ответ. Этот процесс включает в себя постоянные исследования, рассуждения и решение проблем с разных точек зрения. Это принципиально отличается от стандартных больших моделей, которые генерируют ответы непосредственно из предобученных данных, и от традиционных систем RAG, полагающихся на одноразовый поверхностный поиск."
|
||||
},
|
||||
"kimi-k2-0711-preview": {
|
||||
"description": "kimi-k2 — базовая модель с архитектурой MoE, обладающая мощными возможностями кода и агента, с общим числом параметров 1 триллион и 32 миллиарда активных параметров. В тестах производительности по основным категориям, таким как универсальное знание, программирование, математика и агенты, модель K2 превосходит другие ведущие открытые модели."
|
||||
},
|
||||
"kimi-latest": {
|
||||
"description": "Продукт Kimi Smart Assistant использует последнюю модель Kimi, которая может содержать нестабильные функции. Поддерживает понимание изображений и автоматически выбирает модель 8k/32k/128k в качестве модели для выставления счетов в зависимости от длины контекста запроса."
|
||||
},
|
||||
@@ -2349,7 +2403,7 @@
|
||||
"description": "Модель v0-1.5-md подходит для повседневных задач и генерации пользовательского интерфейса (UI)"
|
||||
},
|
||||
"whisper-1": {
|
||||
"description": "Универсальная модель распознавания речи, поддерживающая многоязычное распознавание речи, перевод речи и распознавание языка."
|
||||
"description": "Универсальная модель распознавания речи, поддерживающая многоязычное распознавание речи, перевод речи и идентификацию языка."
|
||||
},
|
||||
"wizardlm2": {
|
||||
"description": "WizardLM 2 — это языковая модель, предоставляемая Microsoft AI, которая особенно хорошо проявляет себя в сложных диалогах, многоязычных задачах, выводе и интеллектуальных помощниках."
|
||||
|
||||
@@ -520,6 +520,7 @@
|
||||
"hotkey": "Горячие клавиши",
|
||||
"llm": "Языковая модель",
|
||||
"provider": "Поставщик ИИ услуг",
|
||||
"proxy": "Сетевой прокси",
|
||||
"storage": "Хранение данных",
|
||||
"sync": "Синхронизация с облаком",
|
||||
"system-agent": "Системный агент",
|
||||
|
||||
@@ -46,6 +46,9 @@
|
||||
"reasoningEffort": {
|
||||
"title": "Akıl Yürütme Gücü"
|
||||
},
|
||||
"thinking": {
|
||||
"title": "Derin Düşünme Anahtarı"
|
||||
},
|
||||
"title": "Model Genişletme Özellikleri"
|
||||
},
|
||||
"history": {
|
||||
|
||||
@@ -1,4 +1,43 @@
|
||||
{
|
||||
"proxy": {
|
||||
"auth": "Kimlik doğrulama gerekli",
|
||||
"authDesc": "Eğer proxy sunucusu kullanıcı adı ve şifre gerektiriyorsa",
|
||||
"authSettings": "Kimlik Doğrulama Ayarları",
|
||||
"basicSettings": "Proxy Ayarları",
|
||||
"basicSettingsDesc": "Proxy sunucusunun bağlantı parametrelerini yapılandırın",
|
||||
"bypass": "Proxy kullanılmayacak adresler",
|
||||
"connectionTest": "Bağlantı Testi",
|
||||
"enable": "Proxy'yi etkinleştir",
|
||||
"enableDesc": "Etkinleştirildiğinde, ağ erişimi proxy sunucusu üzerinden yapılacaktır",
|
||||
"password": "Şifre",
|
||||
"password_placeholder": "Şifrenizi girin",
|
||||
"port": "Port",
|
||||
"resetButton": "Sıfırla",
|
||||
"saveButton": "Kaydet",
|
||||
"saveFailed": "Kaydetme başarısız: {{error}}",
|
||||
"saveSuccess": "Proxy ayarları başarıyla kaydedildi",
|
||||
"server": "Sunucu adresi",
|
||||
"testButton": "Bağlantıyı test et",
|
||||
"testDescription": "Mevcut proxy yapılandırmasını kullanarak bağlantıyı test edin, yapılandırmanın düzgün çalıştığını doğrulayın",
|
||||
"testFailed": "Bağlantı başarısız",
|
||||
"testSuccessWithTime": "Bağlantı testi başarılı, geçen süre {{time}} ms",
|
||||
"testUrl": "Test adresi",
|
||||
"testUrlPlaceholder": "Test etmek için URL girin",
|
||||
"testing": "Bağlantı test ediliyor...",
|
||||
"type": "Proxy türü",
|
||||
"unsavedChanges": "Kaydedilmemiş değişiklikleriniz var",
|
||||
"username": "Kullanıcı adı",
|
||||
"username_placeholder": "Kullanıcı adınızı girin",
|
||||
"validation": {
|
||||
"passwordRequired": "Kimlik doğrulama etkinleştirildiğinde şifre zorunludur",
|
||||
"portInvalid": "Port numarası 1 ile 65535 arasında olmalıdır",
|
||||
"portRequired": "Proxy etkinleştirildiğinde port zorunludur",
|
||||
"serverInvalid": "Geçerli bir sunucu adresi (IP veya alan adı) giriniz",
|
||||
"serverRequired": "Proxy etkinleştirildiğinde sunucu adresi zorunludur",
|
||||
"typeRequired": "Proxy etkinleştirildiğinde proxy türü zorunludur",
|
||||
"usernameRequired": "Kimlik doğrulama etkinleştirildiğinde kullanıcı adı zorunludur"
|
||||
}
|
||||
},
|
||||
"remoteServer": {
|
||||
"authError": "Yetkilendirme hatası: {{error}}",
|
||||
"authPending": "Yetkilendirmeyi tarayıcıda tamamlayın",
|
||||
|
||||
+99
-45
@@ -71,44 +71,23 @@
|
||||
"DeepSeek-V3": {
|
||||
"description": "DeepSeek-V3, Derin Arayış şirketi tarafından geliştirilen bir MoE modelidir. DeepSeek-V3, birçok değerlendirmede Qwen2.5-72B ve Llama-3.1-405B gibi diğer açık kaynak modelleri geride bırakmış ve performans açısından dünya çapında en iyi kapalı kaynak model olan GPT-4o ve Claude-3.5-Sonnet ile eşit seviyededir."
|
||||
},
|
||||
"Doubao-1.5-thinking-pro-m": {
|
||||
"description": "Doubao-1.5, yeni derin düşünme modeli (m versiyonu yerel çok modlu derin akıl yürütme yeteneği ile birlikte gelir) ve matematik, programlama, bilimsel akıl yürütme gibi uzmanlık alanlarında ve yaratıcı yazım gibi genel görevlerde mükemmel performans sergilemektedir. AIME 2024, Codeforces, GPQA gibi birçok otoriter benchmarkta endüstri birinciliğine ulaşmakta veya yaklaşmaktadır. 128k bağlam penceresi ve 16k çıktı destekler."
|
||||
},
|
||||
"Doubao-1.5-thinking-vision-pro": {
|
||||
"description": "Tamamen yeni bir görsel derin düşünme modeli, daha güçlü genel çok modlu anlama ve akıl yürütme yeteneğine sahiptir; 59 kamu değerlendirme ölçütünden 37'sinde SOTA performansı elde etmiştir."
|
||||
},
|
||||
"Doubao-1.5-vision-pro": {
|
||||
"description": "Doubao-1.5-vision-pro, yeni güncellenmiş çok modlu büyük modeldir, herhangi bir çözünürlük ve aşırı en-boy oranı görüntü tanıma desteği sunar, görsel çıkarım, belge tanıma, detay bilgisi anlama ve talimat takibi yeteneklerini artırır."
|
||||
},
|
||||
"Doubao-1.5-vision-pro-32k": {
|
||||
"description": "Doubao-1.5-vision-pro, tamamen yenilenen çok modlu büyük modeldir, herhangi bir çözünürlük ve aşırı en-boy oranına sahip görüntü tanıma desteği sunar, görsel akıl yürütme, belge tanıma, detay bilgisi anlama ve talimatları takip etme yeteneklerini artırır."
|
||||
},
|
||||
"Doubao-lite-128k": {
|
||||
"description": "Doubao-lite, mükemmel yanıt hızı ve daha iyi maliyet Performansı ile müşterilere farklı senaryolar için daha esnek seçenekler sunar. 128k bağlam penceresi çıkarım ve ince ayar destekler."
|
||||
"description": "Doubao-lite, son derece hızlı yanıt süresi ve daha iyi fiyat-performans oranı ile müşterilere farklı senaryolar için daha esnek seçenekler sunar. 128k bağlam penceresi ile çıkarım ve ince ayar desteği sağlar."
|
||||
},
|
||||
"Doubao-lite-32k": {
|
||||
"description": "Doubao-lite, mükemmel yanıt hızı ve daha iyi maliyet Performansı ile müşterilere farklı senaryolar için daha esnek seçenekler sunar. 32k bağlam penceresi çıkarım ve ince ayar destekler."
|
||||
"description": "Doubao-lite, son derece hızlı yanıt süresi ve daha iyi fiyat-performans oranı ile müşterilere farklı senaryolar için daha esnek seçenekler sunar. 32k bağlam penceresi ile çıkarım ve ince ayar desteği sağlar."
|
||||
},
|
||||
"Doubao-lite-4k": {
|
||||
"description": "Doubao-lite, mükemmel yanıt hızı ve daha iyi maliyet Performansı ile müşterilere farklı senaryolar için daha esnek seçenekler sunar. 4k bağlam penceresi çıkarım ve ince ayar destekler."
|
||||
"description": "Doubao-lite, son derece hızlı yanıt süresi ve daha iyi fiyat-performans oranı ile müşterilere farklı senaryolar için daha esnek seçenekler sunar. 4k bağlam penceresi ile çıkarım ve ince ayar desteği sağlar."
|
||||
},
|
||||
"Doubao-pro-128k": {
|
||||
"description": "En iyi performans gösteren ana model, karmaşık görevleri işlemek için uygundur; referanslı soru-cevap, özetleme, yaratım, metin sınıflandırma, rol yapma gibi senaryolar için iyi sonuçlar verir. 128k bağlam penceresi çıkarım ve ince ayar destekler."
|
||||
},
|
||||
"Doubao-pro-256k": {
|
||||
"description": "En iyi performansa sahip ana modeldir, karmaşık görevleri işlemek için uygundur, referans cevaplama, özetleme, yaratım, metin sınıflandırma, rol oynama gibi senaryolarda oldukça iyi sonuçlar vermektedir. 256k bağlam penceresi ile akıl yürütme ve ince ayar desteği sunmaktadır."
|
||||
"description": "En etkili ana model olup, karmaşık görevlerin işlenmesi için uygundur. Referans soru-cevap, özet çıkarma, yaratıcı yazım, metin sınıflandırma, rol yapma gibi senaryolarda mükemmel performans gösterir. 128k bağlam penceresi ile çıkarım ve ince ayar desteği sağlar."
|
||||
},
|
||||
"Doubao-pro-32k": {
|
||||
"description": "En iyi performans gösteren ana model, karmaşık görevleri işlemek için uygundur; referanslı soru-cevap, özetleme, yaratım, metin sınıflandırma, rol yapma gibi senaryolar için iyi sonuçlar verir. 32k bağlam penceresi çıkarım ve ince ayar destekler."
|
||||
"description": "En etkili ana model olup, karmaşık görevlerin işlenmesi için uygundur. Referans soru-cevap, özet çıkarma, yaratıcı yazım, metin sınıflandırma, rol yapma gibi senaryolarda mükemmel performans gösterir. 32k bağlam penceresi ile çıkarım ve ince ayar desteği sağlar."
|
||||
},
|
||||
"Doubao-pro-4k": {
|
||||
"description": "En iyi performans gösteren ana model, karmaşık görevleri işlemek için uygundur; referanslı soru-cevap, özetleme, yaratım, metin sınıflandırma, rol yapma gibi senaryolar için iyi sonuçlar verir. 4k bağlam penceresi çıkarım ve ince ayar destekler."
|
||||
},
|
||||
"Doubao-vision-lite-32k": {
|
||||
"description": "Doubao-vision modeli, Doubao tarafından sunulan çok modlu büyük modeldir, güçlü görüntü anlama ve akıl yürütme yeteneklerine sahip olup, kesin talimat anlama yeteneği sunmaktadır. Model, görüntü metin bilgisi çıkarımı ve görüntü tabanlı akıl yürütme görevlerinde güçlü bir performans sergilemekte, daha karmaşık ve daha geniş görsel soru-cevap görevlerine uygulanabilmektedir."
|
||||
},
|
||||
"Doubao-vision-pro-32k": {
|
||||
"description": "Doubao-vision modeli, Doubao tarafından sunulan çok modlu büyük modeldir, güçlü görüntü anlama ve akıl yürütme yeteneklerine sahip olup, kesin talimat anlama yeteneği sunmaktadır. Model, görüntü metin bilgisi çıkarımı ve görüntü tabanlı akıl yürütme görevlerinde güçlü bir performans sergilemekte, daha karmaşık ve daha geniş görsel soru-cevap görevlerine uygulanabilmektedir."
|
||||
"description": "En etkili ana model olup, karmaşık görevlerin işlenmesi için uygundur. Referans soru-cevap, özet çıkarma, yaratıcı yazım, metin sınıflandırma, rol yapma gibi senaryolarda mükemmel performans gösterir. 4k bağlam penceresi ile çıkarım ve ince ayar desteği sağlar."
|
||||
},
|
||||
"ERNIE-3.5-128K": {
|
||||
"description": "Baidu'nun kendi geliştirdiği, büyük ölçekli bir dil modeli olan ERNIE-3.5, geniş bir Çin ve İngilizce veri kümesini kapsar. Güçlü genel yeteneklere sahip olup, çoğu diyalog, soru-cevap, yaratıcı içerik üretimi ve eklenti uygulama senaryolarını karşılayabilir; ayrıca, Baidu arama eklentisi ile otomatik entegrasyonu destekleyerek, soru-cevap bilgilerinin güncelliğini sağlar."
|
||||
@@ -224,24 +203,21 @@
|
||||
"Pro/Qwen/Qwen2.5-VL-7B-Instruct": {
|
||||
"description": "Qwen2.5-VL, Qwen serisinin yeni üyesidir ve güçlü görsel anlama yeteneğine sahiptir. Görsellerdeki metinleri, grafikleri ve düzenleri analiz edebilir, uzun videoları anlayabilir ve olayları yakalayabilir. Akıl yürütme yapabilir, araçları kullanabilir, çoklu format nesne konumlandırmayı destekler ve yapılandırılmış çıktılar üretebilir. Video anlama için dinamik çözünürlük ve kare hızı eğitimini optimize etmiş ve görsel kodlayıcı verimliliğini artırmıştır."
|
||||
},
|
||||
"Pro/THUDM/GLM-4.1V-9B-Thinking": {
|
||||
"description": "GLM-4.1V-9B-Thinking, Zhipu AI ve Tsinghua Üniversitesi KEG Laboratuvarı tarafından ortaklaşa yayınlanan açık kaynaklı bir görsel dil modeli (VLM) olup, karmaşık çok modlu bilişsel görevleri işlemek için tasarlanmıştır. Bu model, GLM-4-9B-0414 temel modeli üzerine kurulmuş olup, \"Düşünce Zinciri\" (Chain-of-Thought) akıl yürütme mekanizmasını ve pekiştirmeli öğrenme stratejisini benimseyerek, modlar arası akıl yürütme yeteneği ve kararlılığını önemli ölçüde artırmıştır."
|
||||
},
|
||||
"Pro/THUDM/glm-4-9b-chat": {
|
||||
"description": "GLM-4-9B-Chat, Zhipu AI tarafından sunulan GLM-4 serisi önceden eğitilmiş modellerin açık kaynak versiyonudur. Bu model, anlam, matematik, akıl yürütme, kod ve bilgi gibi birçok alanda mükemmel performans sergilemektedir. Çoklu diyalogları desteklemenin yanı sıra, GLM-4-9B-Chat, web tarayıcı, kod yürütme, özelleştirilmiş araç çağrısı (Function Call) ve uzun metin akıl yürütme gibi gelişmiş özelliklere de sahiptir. Model, Çince, İngilizce, Japonca, Korece ve Almanca gibi 26 dili desteklemektedir. GLM-4-9B-Chat, AlignBench-v2, MT-Bench, MMLU ve C-Eval gibi birçok standart testte mükemmel performans sergilemiştir. Bu model, maksimum 128K bağlam uzunluğunu desteklemekte olup, akademik araştırmalar ve ticari uygulamalar için uygundur."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1": {
|
||||
"description": "DeepSeek-R1, modeldeki tekrarlılık ve okunabilirlik sorunlarını çözen bir güçlendirilmiş öğrenme (RL) destekli çıkarım modelidir. RL'den önce, DeepSeek-R1 soğuk başlangıç verileri tanıtarak çıkarım performansını daha da optimize etmiştir. Matematik, kod ve çıkarım görevlerinde OpenAI-o1 ile benzer performans göstermektedir ve özenle tasarlanmış eğitim yöntemleri ile genel etkisini artırmıştır."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1-0120": {
|
||||
"description": "DeepSeek-R1, pekiştirmeli öğrenme (RL) destekli bir akıl yürütme modelidir ve modeldeki tekrar ve okunabilirlik sorunlarını çözer. RL öncesinde soğuk başlangıç verisi kullanarak akıl yürütme performansını daha da optimize etmiştir. Matematik, kodlama ve akıl yürütme görevlerinde OpenAI-o1 ile benzer performans gösterir ve özenle tasarlanmış eğitim yöntemleriyle genel performansı artırır."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B": {
|
||||
"description": "DeepSeek-R1-Distill-Qwen-7B, Qwen2.5-Math-7B modelinden bilgi damıtma yöntemiyle elde edilmiş bir modeldir. Bu model, DeepSeek-R1 tarafından oluşturulan 800 bin seçkin örnekle ince ayar yapılarak geliştirilmiş olup, üstün akıl yürütme yeteneği sergilemektedir. Çeşitli kıyaslama testlerinde başarılı performans gösteren model, MATH-500'de %92,8 doğruluk, AIME 2024'te %55,5 geçme oranı ve CodeForces'ta 1189 puan alarak, 7B ölçeğindeki bir model için güçlü matematik ve programlama yeteneklerini ortaya koymuştur."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-V3": {
|
||||
"description": "DeepSeek-V3, 6710 milyar parametreye sahip bir karma uzman (MoE) dil modelidir ve çok başlı potansiyel dikkat (MLA) ve DeepSeekMoE mimarisini kullanarak, yardımcı kayıplar olmadan yük dengeleme stratejileri ile çıkarım ve eğitim verimliliğini optimize etmektedir. 14.8 trilyon yüksek kaliteli token üzerinde önceden eğitilmiş ve denetimli ince ayar ve güçlendirilmiş öğrenme ile, DeepSeek-V3 performans açısından diğer açık kaynak modelleri geride bırakmakta ve lider kapalı kaynak modellere yaklaşmaktadır."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-V3-1226": {
|
||||
"description": "DeepSeek-V3, 6710 milyar parametreye sahip bir karma uzman (MoE) dil modelidir. Çok başlı potansiyel dikkat (MLA) ve DeepSeekMoE mimarisini kullanarak, yardımcı kayıpsız yük dengeleme stratejileri ile optimizasyon yapar ve çıkarım ile eğitim verimliliğini artırır. 14.8 trilyon yüksek kaliteli token üzerinde önceden eğitilmiş ve denetimli ince ayar ile pekiştirmeli öğrenme ile geliştirilmiştir; DeepSeek-V3, performans açısından diğer açık kaynaklı modellere göre üstünlük sağlar ve lider kapalı kaynak modellere yakın bir performans sergiler."
|
||||
},
|
||||
"QwQ-32B-Preview": {
|
||||
"description": "QwQ-32B-Preview, karmaşık diyalog oluşturma ve bağlam anlama görevlerini etkili bir şekilde işleyebilen yenilikçi bir doğal dil işleme modelidir."
|
||||
},
|
||||
@@ -404,6 +380,9 @@
|
||||
"THUDM/GLM-4-9B-0414": {
|
||||
"description": "GLM-4-9B-0414, GLM serisinin küçük modelidir ve 9 milyar parametreye sahiptir. Bu model, GLM-4-32B serisinin teknik özelliklerini devralır, ancak daha hafif bir dağıtım seçeneği sunar. Boyutu daha küçük olmasına rağmen, GLM-4-9B-0414, kod oluşturma, web tasarımı, SVG grafik oluşturma ve arama tabanlı yazım gibi görevlerde mükemmel yetenekler sergiler."
|
||||
},
|
||||
"THUDM/GLM-4.1V-9B-Thinking": {
|
||||
"description": "GLM-4.1V-9B-Thinking, Zhipu AI ve Tsinghua Üniversitesi KEG Laboratuvarı tarafından ortaklaşa yayınlanan açık kaynaklı bir görsel dil modeli (VLM) olup, karmaşık çok modlu bilişsel görevleri işlemek için tasarlanmıştır. Bu model, GLM-4-9B-0414 temel modeli üzerine kurulmuş olup, \"Düşünce Zinciri\" (Chain-of-Thought) akıl yürütme mekanizmasını ve pekiştirmeli öğrenme stratejisini benimseyerek, modlar arası akıl yürütme yeteneği ve kararlılığını önemli ölçüde artırmıştır."
|
||||
},
|
||||
"THUDM/GLM-Z1-32B-0414": {
|
||||
"description": "GLM-Z1-32B-0414, derin düşünme yeteneğine sahip bir çıkarım modelidir. Bu model, GLM-4-32B-0414 temel alınarak soğuk başlatma ve genişletilmiş pekiştirme öğrenimi ile geliştirilmiştir ve matematik, kod ve mantık görevlerinde daha fazla eğitim almıştır. Temel model ile karşılaştırıldığında, GLM-Z1-32B-0414, matematik yeteneklerini ve karmaşık görevleri çözme yeteneğini önemli ölçüde artırmıştır."
|
||||
},
|
||||
@@ -560,6 +539,9 @@
|
||||
"anthropic/claude-sonnet-4": {
|
||||
"description": "Claude Sonnet 4, neredeyse anında yanıtlar veya uzatılmış adım adım düşünme süreçleri üretebilir; kullanıcılar bu süreçleri net bir şekilde görebilir. API kullanıcıları ayrıca modelin düşünme süresini ayrıntılı olarak kontrol edebilir."
|
||||
},
|
||||
"ascend-tribe/pangu-pro-moe": {
|
||||
"description": "Pangu-Pro-MoE 72B-A16B, 72 milyar parametreli ve 16 milyar parametre aktive eden seyrek büyük bir dil modelidir. Bu model, grup tabanlı uzman karışımı (MoGE) mimarisine dayanır; uzman seçim aşamasında uzmanları gruplar halinde düzenler ve her grupta token başına eşit sayıda uzmanı aktive ederek uzman yük dengesini sağlar. Bu sayede Ascend platformunda modelin dağıtım verimliliği önemli ölçüde artırılmıştır."
|
||||
},
|
||||
"aya": {
|
||||
"description": "Aya 23, Cohere tarafından sunulan çok dilli bir modeldir, 23 dili destekler ve çok dilli uygulamalar için kolaylık sağlar."
|
||||
},
|
||||
@@ -569,6 +551,9 @@
|
||||
"baichuan/baichuan2-13b-chat": {
|
||||
"description": "Baichuan-13B, Baichuan Zhi Neng tarafından geliştirilen 130 milyar parametreye sahip açık kaynaklı ticari bir büyük dil modelidir ve yetkili Çince ve İngilizce benchmark'larda aynı boyuttaki en iyi sonuçları elde etmiştir."
|
||||
},
|
||||
"baidu/ERNIE-4.5-300B-A47B": {
|
||||
"description": "ERNIE-4.5-300B-A47B, Baidu tarafından geliştirilen, karma uzman (MoE) mimarisine dayanan büyük bir dil modelidir. Modelin toplam parametre sayısı 300 milyar olup, çıkarım sırasında her token için yalnızca 47 milyar parametre aktive edilir; böylece güçlü performans ile hesaplama verimliliği dengelenir. ERNIE 4.5 serisinin temel modellerinden biri olarak, metin anlama, üretme, akıl yürütme ve programlama gibi görevlerde üstün yetenekler sergiler. Model, metin ve görsel modların ortak eğitimiyle çok modlu heterojen MoE ön eğitim yöntemi kullanarak genel yeteneklerini artırmış, özellikle talimat takibi ve dünya bilgisi hafızasında etkileyici sonuçlar elde etmiştir."
|
||||
},
|
||||
"c4ai-aya-expanse-32b": {
|
||||
"description": "Aya Expanse, talimat ayarlama, veri arbitrajı, tercih eğitimi ve model birleştirme yenilikleri ile tek dilli modellerin performansını zorlamak için tasarlanmış yüksek performanslı bir 32B çok dilli modeldir. 23 dili desteklemektedir."
|
||||
},
|
||||
@@ -666,7 +651,7 @@
|
||||
"description": "Codestral, kod üretimine odaklanan son teknoloji bir üretim modelidir, ara doldurma ve kod tamamlama görevlerini optimize etmiştir."
|
||||
},
|
||||
"codex-mini-latest": {
|
||||
"description": "codex-mini-latest, Codex CLI için özel olarak tasarlanmış o4-mini'nin ince ayar versiyonudur. API üzerinden doğrudan kullanım için, gpt-4.1'den başlamanızı öneririz."
|
||||
"description": "codex-mini-latest, Codex CLI için özel olarak ince ayarlanmış o4-mini versiyonudur. API üzerinden doğrudan kullanım için, gpt-4.1'den başlamanızı öneririz."
|
||||
},
|
||||
"cognitivecomputations/dolphin-mixtral-8x22b": {
|
||||
"description": "Dolphin Mixtral 8x22B, talimat takibi, diyalog ve programlama için tasarlanmış bir modeldir."
|
||||
@@ -726,7 +711,7 @@
|
||||
"description": "Compound-beta-mini, GroqCloud'da desteklenen açık kullanılabilir modellerden güç alan bir bileşik AI sistemidir, kullanıcı sorgularını yanıtlamak için araçları akıllıca ve seçici bir şekilde kullanabilir."
|
||||
},
|
||||
"computer-use-preview": {
|
||||
"description": "computer-use-preview modeli, \"Bilgisayar Kullanım Araçları\" için özel olarak tasarlanmış bir modeldir ve bilgisayarla ilgili görevleri anlama ve yerine getirme konusunda eğitilmiştir."
|
||||
"description": "computer-use-preview modeli, \"Bilgisayar Kullanım Araçları\" için özel olarak tasarlanmış ve bilgisayarla ilgili görevleri anlama ve yerine getirme konusunda eğitilmiş özel bir modeldir."
|
||||
},
|
||||
"dall-e-2": {
|
||||
"description": "İkinci nesil DALL·E modeli, daha gerçekçi ve doğru görüntü üretimi destekler, çözünürlüğü birinci neslin 4 katıdır."
|
||||
@@ -914,9 +899,39 @@
|
||||
"doubao-1.5-thinking-pro": {
|
||||
"description": "Doubao-1.5, tamamen yeni bir derin düşünme modeli, matematik, programlama, bilimsel akıl yürütme gibi uzmanlık alanlarında ve yaratıcı yazım gibi genel görevlerde olağanüstü performans sergilemektedir. AIME 2024, Codeforces, GPQA gibi birçok saygın ölçekte sektörün en üst seviyelerine ulaşmakta veya bunlara yakın bir performans göstermektedir. 128k bağlam penceresi ve 16k çıktı desteği sunmaktadır."
|
||||
},
|
||||
"doubao-1.5-thinking-pro-m": {
|
||||
"description": "Doubao-1.5 yeni derin düşünme modeli (m versiyonu yerel çok modlu derin çıkarım yeteneği ile birlikte gelir), matematik, programlama, bilimsel çıkarım gibi uzmanlık alanlarında ve yaratıcı yazım gibi genel görevlerde üstün performans gösterir. AIME 2024, Codeforces, GPQA gibi birçok otoriter kıyaslamada sektörün ilk sıralarına ulaşmıştır veya yaklaşmıştır. 128k bağlam penceresi ve 16k çıktı desteği sağlar."
|
||||
},
|
||||
"doubao-1.5-thinking-vision-pro": {
|
||||
"description": "Yeni görsel derin düşünme modeli, daha güçlü genel çok modlu anlama ve çıkarım yeteneklerine sahiptir ve 59 açık değerlendirme kıyaslamasından 37'sinde SOTA (en iyi) performans göstermiştir."
|
||||
},
|
||||
"doubao-1.5-ui-tars": {
|
||||
"description": "Doubao-1.5-UI-TARS, grafik kullanıcı arayüzü (GUI) etkileşimine özgü yerel bir Agent modelidir. Algılama, çıkarım ve eylem gibi insan benzeri yeteneklerle GUI ile kesintisiz etkileşim sağlar."
|
||||
},
|
||||
"doubao-1.5-vision-lite": {
|
||||
"description": "Doubao-1.5-vision-lite, yeni güncellenmiş çok modlu büyük modeldir, herhangi bir çözünürlük ve aşırı en-boy oranı görüntü tanıma desteği sunar, görsel çıkarım, belge tanıma, detay bilgisi anlama ve talimat takibi yeteneklerini artırır. 128k bağlam penceresi destekler, çıktı uzunluğu maksimum 16k token destekler."
|
||||
},
|
||||
"doubao-1.5-vision-pro": {
|
||||
"description": "Doubao-1.5-vision-pro, tamamen yenilenmiş çok modlu büyük modeldir. Herhangi bir çözünürlükte ve aşırı en-boy oranlarındaki görüntüleri tanıyabilir, görsel çıkarımı, belge tanımayı, detaylı bilgi anlayışını ve komutlara uyumu artırır."
|
||||
},
|
||||
"doubao-1.5-vision-pro-32k": {
|
||||
"description": "Doubao-1.5-vision-pro, tamamen yenilenmiş çok modlu büyük modeldir. Herhangi bir çözünürlükte ve aşırı en-boy oranlarındaki görüntüleri tanıyabilir, görsel çıkarımı, belge tanımayı, detaylı bilgi anlayışını ve komutlara uyumu artırır."
|
||||
},
|
||||
"doubao-lite-128k": {
|
||||
"description": "Son derece hızlı yanıt süresi ve daha iyi fiyat-performans oranı ile müşterilere farklı senaryolar için daha esnek seçenekler sunar. 128k bağlam penceresi ile çıkarım ve ince ayar desteği sağlar."
|
||||
},
|
||||
"doubao-lite-32k": {
|
||||
"description": "Son derece hızlı yanıt süresi ve daha iyi fiyat-performans oranı ile müşterilere farklı senaryolar için daha esnek seçenekler sunar. 32k bağlam penceresi ile çıkarım ve ince ayar desteği sağlar."
|
||||
},
|
||||
"doubao-lite-4k": {
|
||||
"description": "Son derece hızlı yanıt süresi ve daha iyi fiyat-performans oranı ile müşterilere farklı senaryolar için daha esnek seçenekler sunar. 4k bağlam penceresi ile çıkarım ve ince ayar desteği sağlar."
|
||||
},
|
||||
"doubao-pro-256k": {
|
||||
"description": "En etkili ana model olup, karmaşık görevlerin işlenmesi için uygundur. Referans soru-cevap, özet çıkarma, yaratıcı yazım, metin sınıflandırma, rol yapma gibi senaryolarda mükemmel performans gösterir. 256k bağlam penceresi ile çıkarım ve ince ayar desteği sağlar."
|
||||
},
|
||||
"doubao-pro-32k": {
|
||||
"description": "En etkili ana model olup, karmaşık görevlerin işlenmesi için uygundur. Referans soru-cevap, özet çıkarma, yaratıcı yazım, metin sınıflandırma, rol yapma gibi senaryolarda mükemmel performans gösterir. 32k bağlam penceresi ile çıkarım ve ince ayar desteği sağlar."
|
||||
},
|
||||
"doubao-seed-1.6": {
|
||||
"description": "Doubao-Seed-1.6, auto/thinking/non-thinking olmak üzere üç düşünme modunu destekleyen tamamen yeni çok modlu derin düşünme modelidir. Non-thinking modunda, model performansı Doubao-1.5-pro/250115'e kıyasla büyük ölçüde artmıştır. 256k bağlam penceresini destekler ve çıktı uzunluğu maksimum 16k token olabilir."
|
||||
},
|
||||
@@ -924,7 +939,13 @@
|
||||
"description": "Doubao-Seed-1.6-flash, TPOT sadece 10ms olan son derece hızlı çok modlu derin düşünme modelidir; hem metin hem de görsel anlayışı destekler, metin anlama yeteneği önceki lite neslini aşar, görsel anlama ise rakiplerin pro serisi modelleriyle eşdeğerdir. 256k bağlam penceresini destekler ve çıktı uzunluğu maksimum 16k token olabilir."
|
||||
},
|
||||
"doubao-seed-1.6-thinking": {
|
||||
"description": "Doubao-Seed-1.6-thinking modeli düşünme yeteneğinde büyük gelişme göstermiştir; Doubao-1.5-thinking-pro ile karşılaştırıldığında Kodlama, Matematik ve mantıksal akıl yürütme gibi temel yeteneklerde daha da iyileşmiştir ve görsel anlayışı destekler. 256k bağlam penceresini destekler ve çıktı uzunluğu maksimum 16k token olabilir."
|
||||
"description": "Doubao-Seed-1.6-thinking modeli düşünme yeteneğinde büyük gelişme göstermiştir, Doubao-1.5-thinking-pro ile karşılaştırıldığında Kodlama, Matematik ve mantıksal akıl yürütme gibi temel yeteneklerde daha da iyileşmiştir, görsel anlayışı destekler. 256k bağlam penceresini destekler ve çıktı uzunluğu maksimum 16k token olabilir."
|
||||
},
|
||||
"doubao-vision-lite-32k": {
|
||||
"description": "Doubao-vision modeli, Doubao tarafından geliştirilen çok modlu büyük bir modeldir. Güçlü görüntü anlama ve çıkarım yeteneklerine ve hassas komut anlama becerisine sahiptir. Model, görüntü metin bilgisi çıkarımı ve görüntü tabanlı çıkarım görevlerinde güçlü performans sergiler ve daha karmaşık, geniş kapsamlı görsel soru-cevap görevlerinde kullanılabilir."
|
||||
},
|
||||
"doubao-vision-pro-32k": {
|
||||
"description": "Doubao-vision modeli, Doubao tarafından geliştirilen çok modlu büyük bir modeldir. Güçlü görüntü anlama ve çıkarım yeteneklerine ve hassas komut anlama becerisine sahiptir. Model, görüntü metin bilgisi çıkarımı ve görüntü tabanlı çıkarım görevlerinde güçlü performans sergiler ve daha karmaşık, geniş kapsamlı görsel soru-cevap görevlerinde kullanılabilir."
|
||||
},
|
||||
"emohaa": {
|
||||
"description": "Emohaa, duygusal sorunları anlamalarına yardımcı olmak için profesyonel danışmanlık yeteneklerine sahip bir psikolojik modeldir."
|
||||
@@ -1082,9 +1103,6 @@
|
||||
"gemini-2.5-pro": {
|
||||
"description": "Gemini 2.5 Pro, Google'ın en gelişmiş düşünce modelidir; kodlama, matematik ve STEM alanlarındaki karmaşık problemleri çıkarım yapabilir ve uzun bağlam kullanarak büyük veri setleri, kod tabanları ve belgeleri analiz edebilir."
|
||||
},
|
||||
"gemini-2.5-pro-exp-03-25": {
|
||||
"description": "Gemini 2.5 Pro Deneysel, Google'ın en gelişmiş düşünce modeli olup, kod, matematik ve STEM alanlarındaki karmaşık sorunları akıl yürütebilmektedir. Ayrıca, uzun bağlamları kullanarak büyük veri setlerini, kod havuzlarını ve belgeleri analiz edebilir."
|
||||
},
|
||||
"gemini-2.5-pro-preview-03-25": {
|
||||
"description": "Gemini 2.5 Pro Önizleme, Google'ın en gelişmiş düşünce modeli olup, kod, matematik ve STEM alanlarındaki karmaşık sorunları akıl yürütme yeteneğine sahiptir. Uzun bağlamları analiz ederek büyük veri setleri, kod havuzları ve belgeler üzerinde çalışabilir."
|
||||
},
|
||||
@@ -1151,6 +1169,12 @@
|
||||
"glm-4-plus": {
|
||||
"description": "GLM-4-Plus, güçlü uzun metin işleme ve karmaşık görevler için yeteneklere sahip yüksek akıllı bir amiral gemisidir, performansı tamamen artırılmıştır."
|
||||
},
|
||||
"glm-4.1v-thinking-flash": {
|
||||
"description": "GLM-4.1V-Thinking serisi modeller, bilinen 10 milyar parametre seviyesindeki VLM modelleri arasında en güçlü görsel modellerdir. Aynı seviyedeki SOTA görsel dil görevlerini birleştirir; video anlama, görsel soru-cevap, akademik problem çözme, OCR metin tanıma, belge ve grafik yorumlama, GUI ajanı, ön uç web kodlama, grounding gibi birçok görevde 8 kat daha büyük parametreli Qwen2.5-VL-72B modelini bile aşan performans gösterir. Önde gelen pekiştirmeli öğrenme teknikleri sayesinde, düşünce zinciri akıl yürütme yoluyla cevapların doğruluğu ve zenginliği artırılmıştır; nihai sonuçlar ve açıklanabilirlik açısından geleneksel düşünce zinciri olmayan modellerin çok ötesindedir."
|
||||
},
|
||||
"glm-4.1v-thinking-flashx": {
|
||||
"description": "GLM-4.1V-Thinking serisi modeller, bilinen 10 milyar parametre seviyesindeki VLM modelleri arasında en güçlü görsel modellerdir. Aynı seviyedeki SOTA görsel dil görevlerini birleştirir; video anlama, görsel soru-cevap, akademik problem çözme, OCR metin tanıma, belge ve grafik yorumlama, GUI ajanı, ön uç web kodlama, grounding gibi birçok görevde 8 kat daha büyük parametreli Qwen2.5-VL-72B modelini bile aşan performans gösterir. Önde gelen pekiştirmeli öğrenme teknikleri sayesinde, düşünce zinciri akıl yürütme yoluyla cevapların doğruluğu ve zenginliği artırılmıştır; nihai sonuçlar ve açıklanabilirlik açısından geleneksel düşünce zinciri olmayan modellerin çok ötesindedir."
|
||||
},
|
||||
"glm-4v": {
|
||||
"description": "GLM-4V, güçlü görüntü anlama ve akıl yürütme yetenekleri sunar, çeşitli görsel görevleri destekler."
|
||||
},
|
||||
@@ -1172,6 +1196,9 @@
|
||||
"glm-z1-flash": {
|
||||
"description": "GLM-Z1 serisi, karmaşık çıkarım yeteneklerine sahiptir, mantıksal çıkarım, matematik, programlama gibi alanlarda mükemmel performans gösterir. Maksimum bağlam uzunluğu 32K'dır."
|
||||
},
|
||||
"glm-z1-flashx": {
|
||||
"description": "Yüksek hız ve düşük maliyet: Flash geliştirilmiş versiyon, ultra hızlı çıkarım hızı ve daha hızlı eşzamanlılık garantisi sunar."
|
||||
},
|
||||
"glm-zero-preview": {
|
||||
"description": "GLM-Zero-Preview, karmaşık akıl yürütme yeteneklerine sahip olup, mantıksal akıl yürütme, matematik, programlama gibi alanlarda mükemmel performans sergilemektedir."
|
||||
},
|
||||
@@ -1223,6 +1250,9 @@
|
||||
"google/gemma-2b-it": {
|
||||
"description": "Gemma Instruct (2B), temel talimat işleme yetenekleri sunar ve hafif uygulamalar için uygundur."
|
||||
},
|
||||
"google/gemma-3-1b-it": {
|
||||
"description": "Gemma 3 1B, Google tarafından geliştirilen açık kaynaklı bir dil modelidir ve verimlilik ile performansta yeni standartlar belirlemiştir."
|
||||
},
|
||||
"google/gemma-3-27b-it": {
|
||||
"description": "Gemma 3 27B, Google'ın verimlilik ve performans açısından yeni standartlar belirleyen açık kaynaklı bir dil modelidir."
|
||||
},
|
||||
@@ -1305,7 +1335,7 @@
|
||||
"description": "GPT-4o mini, OpenAI'nin GPT-4 Omni'den sonra tanıttığı en yeni modeldir. Görsel ve metin girişi destekler ve metin çıktısı verir. En gelişmiş küçük model olarak, diğer son zamanlardaki öncü modellere göre çok daha ucuzdur ve GPT-3.5 Turbo'dan %60'tan fazla daha ucuzdur. En son teknolojiyi korurken, önemli bir maliyet etkinliği sunar. GPT-4o mini, MMLU testinde %82 puan almış olup, şu anda sohbet tercihleri açısından GPT-4'ün üzerinde yer almaktadır."
|
||||
},
|
||||
"gpt-4o-mini-audio-preview": {
|
||||
"description": "GPT-4o mini Ses modeli, ses giriş ve çıkışını destekler."
|
||||
"description": "GPT-4o mini Ses modeli, sesli giriş ve çıkışı destekler."
|
||||
},
|
||||
"gpt-4o-mini-realtime-preview": {
|
||||
"description": "GPT-4o-mini gerçek zamanlı versiyonu, ses ve metin için gerçek zamanlı giriş ve çıkış desteği sunar."
|
||||
@@ -1313,6 +1343,9 @@
|
||||
"gpt-4o-mini-search-preview": {
|
||||
"description": "GPT-4o mini arama önizleme sürümü, web arama sorgularını anlama ve yürütme için özel olarak eğitilmiş bir modeldir ve Chat Completions API kullanır. Jeton ücretlerinin yanı sıra, web arama sorguları her araç çağrısı başına ücretlendirilir."
|
||||
},
|
||||
"gpt-4o-mini-transcribe": {
|
||||
"description": "GPT-4o Mini Transcribe, GPT-4o kullanarak sesleri metne dönüştüren bir konuşma tanıma modelidir. Orijinal Whisper modeline kıyasla kelime hata oranını düşürür ve dil tanıma ile doğruluğu artırır. Daha doğru transkripsiyonlar için kullanın."
|
||||
},
|
||||
"gpt-4o-mini-tts": {
|
||||
"description": "GPT-4o mini TTS, GPT-4o mini'ye dayalı bir metin-ses modeldir ve yüksek kaliteli ses üretimi, düşük maliyetli oluşturma sunar."
|
||||
},
|
||||
@@ -1322,12 +1355,15 @@
|
||||
"gpt-4o-realtime-preview-2024-10-01": {
|
||||
"description": "GPT-4o gerçek zamanlı versiyonu, ses ve metin için gerçek zamanlı giriş ve çıkış desteği sunar."
|
||||
},
|
||||
"gpt-4o-realtime-preview-2024-12-17": {
|
||||
"description": "GPT-4o gerçek zamanlı versiyonu, ses ve metin için gerçek zamanlı giriş ve çıkış desteği sunar."
|
||||
"gpt-4o-realtime-preview-2025-06-03": {
|
||||
"description": "GPT-4o gerçek zamanlı sürümü, ses ve metin giriş-çıkışını gerçek zamanlı destekler."
|
||||
},
|
||||
"gpt-4o-search-preview": {
|
||||
"description": "GPT-4o arama önizleme sürümü, web arama sorgularını anlama ve yürütme için özel olarak eğitilmiş bir modeldir ve Chat Completions API kullanır. Jeton ücretlerinin yanı sıra, web arama sorguları her araç çağrısı başına ücretlendirilir."
|
||||
},
|
||||
"gpt-4o-transcribe": {
|
||||
"description": "GPT-4o Transcribe, GPT-4o kullanarak sesleri metne dönüştüren bir konuşma tanıma modelidir. Orijinal Whisper modeline kıyasla kelime hata oranını düşürür ve dil tanıma ile doğruluğu artırır. Daha doğru transkripsiyonlar için kullanın."
|
||||
},
|
||||
"grok-2-1212": {
|
||||
"description": "Bu model, doğruluk, talimat takibi ve çok dilli yetenekler açısından geliştirilmiştir."
|
||||
},
|
||||
@@ -1346,9 +1382,15 @@
|
||||
"grok-3-mini-fast": {
|
||||
"description": "Hafif model olup, konuşma öncesi düşünür. Hızlı ve akıllı çalışır, derin alan bilgisi gerektirmeyen mantıksal görevler için uygundur ve orijinal düşünce izlerini elde edebilir."
|
||||
},
|
||||
"grok-4": {
|
||||
"description": "En yeni ve en güçlü amiral gemisi modelimiz, doğal dil işleme, matematiksel hesaplama ve akıl yürütme alanlarında üstün performans sergiliyor — mükemmel bir çok yönlü oyuncu."
|
||||
},
|
||||
"gryphe/mythomax-l2-13b": {
|
||||
"description": "MythoMax l2 13B, birden fazla üst düzey modelin birleşimiyle yaratıcı ve zeka odaklı bir dil modelidir."
|
||||
},
|
||||
"hunyuan-a13b": {
|
||||
"description": "Hunyuan'ın ilk karma akıl yürütme modeli olan hunyuan-standard-256K'nın yükseltilmiş versiyonu, toplam 80 milyar parametre ve 13 milyar parametre aktive eder. Varsayılan olarak yavaş düşünme modundadır ve parametre veya komut yoluyla hızlı ve yavaş düşünme modları arasında geçişi destekler; hızlı/yavaş düşünme geçişi için sorguya / no_think eklenir. Genel yetenekler önceki nesle göre kapsamlı şekilde geliştirilmiş olup, özellikle matematik, bilim, uzun metin anlama ve ajan yeteneklerinde belirgin artışlar vardır."
|
||||
},
|
||||
"hunyuan-code": {
|
||||
"description": "Hunyuan'ın en son kod oluşturma modeli, 200B yüksek kaliteli kod verisi ile artırılmış temel model ile altı ay boyunca yüksek kaliteli SFT verisi eğitimi almıştır. Bağlam penceresi uzunluğu 8K'ya çıkarılmıştır ve beş büyük dil için kod oluşturma otomatik değerlendirme göstergelerinde ön sıralardadır; beş büyük dilde 10 kriterin her yönüyle yüksek kaliteli değerlendirmelerde performansı birinci sıradadır."
|
||||
},
|
||||
@@ -1400,6 +1442,9 @@
|
||||
"hunyuan-t1-vision": {
|
||||
"description": "Hunyuan çok modlu anlayış derin düşünme modeli, çok modlu doğal uzun düşünce zincirini destekler, çeşitli görsel çıkarım senaryolarında uzmandır ve fen bilimleri problemlerinde hızlı düşünme modellerine kıyasla kapsamlı iyileşme sağlar."
|
||||
},
|
||||
"hunyuan-t1-vision-20250619": {
|
||||
"description": "Hunyuan'ın en yeni t1-vision çok modlu anlama derin düşünme modeli, çok modlu doğal düşünce zincirini destekler ve önceki nesil varsayılan modele kıyasla kapsamlı iyileştirmeler sunar."
|
||||
},
|
||||
"hunyuan-turbo": {
|
||||
"description": "Hunyuan'ın yeni nesil büyük dil modelinin önizleme sürümü, tamamen yeni bir karma uzman modeli (MoE) yapısı kullanır ve hunyuan-pro'ya kıyasla daha hızlı çıkarım verimliliği ve daha güçlü performans sunar."
|
||||
},
|
||||
@@ -1430,6 +1475,12 @@
|
||||
"hunyuan-turbos-role-plus": {
|
||||
"description": "Hunyuan'ın en son rol yapma modeli, Hunyuan tarafından resmi olarak ince ayar ve eğitimle geliştirilmiş, rol yapma senaryoları veri setiyle artırılmıştır ve rol yapma senaryolarında daha iyi temel performans sunar."
|
||||
},
|
||||
"hunyuan-turbos-vision": {
|
||||
"description": "Bu model, görsel ve metin anlama senaryoları için uygundur ve Hunyuan'ın en yeni turbos tabanlı yeni nesil görsel dil amiral gemisi büyük modelidir. Görsel tabanlı varlık tanıma, bilgi sorgulama, metin oluşturma, fotoğrafla problem çözme gibi görevlerde odaklanır ve önceki nesil modele kıyasla kapsamlı iyileştirmeler içerir."
|
||||
},
|
||||
"hunyuan-turbos-vision-20250619": {
|
||||
"description": "Hunyuan'ın en yeni turbos-vision görsel dil amiral gemisi büyük modeli, görsel ve metin anlama ile ilgili görevlerde, görsel tabanlı varlık tanıma, bilgi sorgulama, metin oluşturma, fotoğrafla problem çözme gibi alanlarda önceki nesil varsayılan modele kıyasla kapsamlı iyileştirmeler sunar."
|
||||
},
|
||||
"hunyuan-vision": {
|
||||
"description": "Hunyuan'ın en son çok modlu modeli, resim + metin girişi ile metin içeriği oluşturmayı destekler."
|
||||
},
|
||||
@@ -1457,6 +1508,9 @@
|
||||
"jina-deepsearch-v1": {
|
||||
"description": "Derin arama, web araması, okuma ve akıl yürütmeyi birleştirerek kapsamlı bir araştırma yapar. Bunu, araştırma görevlerinizi kabul eden bir ajan olarak düşünebilirsiniz - geniş bir arama yapar ve birden fazla yineleme ile cevap verir. Bu süreç, sürekli araştırma, akıl yürütme ve sorunları çeşitli açılardan çözmeyi içerir. Bu, doğrudan önceden eğitilmiş verilerden cevaplar üreten standart büyük modellerle ve tek seferlik yüzey aramasına dayanan geleneksel RAG sistemleriyle temelde farklıdır."
|
||||
},
|
||||
"kimi-k2-0711-preview": {
|
||||
"description": "kimi-k2, son derece güçlü kodlama ve Agent yeteneklerine sahip MoE mimarili temel bir modeldir. Toplam parametre sayısı 1T, aktif parametre sayısı 32B'dir. Genel bilgi çıkarımı, programlama, matematik, Agent gibi ana kategorilerde yapılan kıyaslama testlerinde K2 modeli, diğer önde gelen açık kaynak modelleri geride bırakmıştır."
|
||||
},
|
||||
"kimi-latest": {
|
||||
"description": "Kimi akıllı asistan ürünü, en son Kimi büyük modelini kullanır ve henüz kararlı olmayan özellikler içerebilir. Görüntü anlayışını desteklerken, isteğin bağlam uzunluğuna göre 8k/32k/128k modelini faturalama modeli olarak otomatik olarak seçecektir."
|
||||
},
|
||||
@@ -1869,7 +1923,7 @@
|
||||
"description": "o1, OpenAI'nin geniş genel bilgiye ihtiyaç duyan karmaşık görevler için uygun yeni bir akıl yürütme modelidir. Bu model, 128K bağlam ve Ekim 2023 bilgi kesim tarihi ile donatılmıştır."
|
||||
},
|
||||
"o1-pro": {
|
||||
"description": "o1 serisi modeller, güçlendirilmiş öğrenme ile eğitilmiş olup, yanıtlamadan önce düşünme yapabilir ve karmaşık akıl yürütme görevlerini yerine getirebilir. o1-pro modeli, daha derin düşünme için daha fazla hesaplama kaynağı kullanır ve böylece sürekli olarak daha kaliteli yanıtlar sunar."
|
||||
"description": "o1 serisi modeller, yanıtlamadan önce düşünme yapabilen ve karmaşık akıl yürütme görevlerini yerine getirebilen pekiştirmeli öğrenme ile eğitilmiştir. o1-pro modeli, daha derin düşünme için daha fazla hesaplama kaynağı kullanır ve böylece sürekli olarak daha kaliteli yanıtlar sunar."
|
||||
},
|
||||
"o3": {
|
||||
"description": "o3, çok çeşitli alanlarda mükemmel performans gösteren çok yönlü güçlü bir modeldir. Matematik, bilim, programlama ve görsel çıkarım görevlerinde yeni standartlar belirler. Ayrıca teknik yazım ve talimat takibi konusunda da uzmandır. Kullanıcılar, metin, kod ve görüntüleri analiz ederek çok adımlı karmaşık sorunları çözebilir."
|
||||
@@ -1881,7 +1935,7 @@
|
||||
"description": "o3-mini, aynı maliyet ve gecikme hedefleriyle yüksek zeka sunan en yeni küçük ölçekli çıkarım modelimizdir."
|
||||
},
|
||||
"o3-pro": {
|
||||
"description": "o3-pro modeli, daha derin düşünmek ve her zaman daha iyi yanıtlar sunmak için daha fazla hesaplama kullanır; yalnızca Responses API altında kullanılabilir."
|
||||
"description": "o3-pro modeli, daha derin düşünmek ve her zaman daha iyi yanıtlar sunmak için daha fazla hesaplama kullanır, yalnızca Responses API altında kullanılabilir."
|
||||
},
|
||||
"o4-mini": {
|
||||
"description": "o4-mini, en yeni küçük o serisi modelimizdir. Hızlı ve etkili çıkarım için optimize edilmiştir ve kodlama ile görsel görevlerde son derece yüksek verimlilik ve performans sergiler."
|
||||
@@ -2349,7 +2403,7 @@
|
||||
"description": "v0-1.5-md modeli, günlük görevler ve kullanıcı arayüzü (UI) oluşturma için uygundur"
|
||||
},
|
||||
"whisper-1": {
|
||||
"description": "Genel ses tanıma modeli, çok dilli ses tanıma, ses çevirisi ve dil tanıma desteği sunar."
|
||||
"description": "Genel amaçlı konuşma tanıma modeli olup, çok dilli konuşma tanıma, konuşma çevirisi ve dil tanıma destekler."
|
||||
},
|
||||
"wizardlm2": {
|
||||
"description": "WizardLM 2, Microsoft AI tarafından sunulan bir dil modelidir, karmaşık diyaloglar, çok dilli, akıl yürütme ve akıllı asistan alanlarında özellikle başarılıdır."
|
||||
|
||||
@@ -520,6 +520,7 @@
|
||||
"hotkey": "Kısayollar",
|
||||
"llm": "Modeller",
|
||||
"provider": "Yapay Zeka Hizmet Sağlayıcısı",
|
||||
"proxy": "Ağ Proxy",
|
||||
"storage": "Veri Depolama",
|
||||
"sync": "Bulut Senkronizasyonu",
|
||||
"system-agent": "Sistem Asistanı",
|
||||
|
||||
@@ -46,6 +46,9 @@
|
||||
"reasoningEffort": {
|
||||
"title": "Cường độ suy luận"
|
||||
},
|
||||
"thinking": {
|
||||
"title": "Công tắc suy nghĩ sâu"
|
||||
},
|
||||
"title": "Chức năng mở rộng mô hình"
|
||||
},
|
||||
"history": {
|
||||
|
||||
@@ -1,4 +1,43 @@
|
||||
{
|
||||
"proxy": {
|
||||
"auth": "Cần xác thực",
|
||||
"authDesc": "Nếu máy chủ proxy yêu cầu tên đăng nhập và mật khẩu",
|
||||
"authSettings": "Cài đặt xác thực",
|
||||
"basicSettings": "Cài đặt proxy",
|
||||
"basicSettingsDesc": "Cấu hình các tham số kết nối của máy chủ proxy",
|
||||
"bypass": "Địa chỉ không sử dụng proxy",
|
||||
"connectionTest": "Kiểm tra kết nối",
|
||||
"enable": "Bật proxy",
|
||||
"enableDesc": "Khi bật, truy cập mạng sẽ thông qua máy chủ proxy",
|
||||
"password": "Mật khẩu",
|
||||
"password_placeholder": "Vui lòng nhập mật khẩu",
|
||||
"port": "Cổng",
|
||||
"resetButton": "Đặt lại",
|
||||
"saveButton": "Lưu",
|
||||
"saveFailed": "Lưu thất bại: {{error}}",
|
||||
"saveSuccess": "Lưu cài đặt proxy thành công",
|
||||
"server": "Địa chỉ máy chủ",
|
||||
"testButton": "Kiểm tra kết nối",
|
||||
"testDescription": "Sử dụng cấu hình proxy hiện tại để kiểm tra kết nối, xác nhận cấu hình hoạt động bình thường",
|
||||
"testFailed": "Kết nối thất bại",
|
||||
"testSuccessWithTime": "Kiểm tra kết nối thành công, thời gian: {{time}} ms",
|
||||
"testUrl": "Địa chỉ kiểm tra",
|
||||
"testUrlPlaceholder": "Vui lòng nhập URL cần kiểm tra",
|
||||
"testing": "Đang kiểm tra kết nối...",
|
||||
"type": "Loại proxy",
|
||||
"unsavedChanges": "Bạn có các thay đổi chưa được lưu",
|
||||
"username": "Tên người dùng",
|
||||
"username_placeholder": "Vui lòng nhập tên người dùng",
|
||||
"validation": {
|
||||
"passwordRequired": "Mật khẩu là bắt buộc khi bật xác thực",
|
||||
"portInvalid": "Cổng phải là số từ 1 đến 65535",
|
||||
"portRequired": "Cổng là bắt buộc khi bật proxy",
|
||||
"serverInvalid": "Vui lòng nhập địa chỉ máy chủ hợp lệ (IP hoặc tên miền)",
|
||||
"serverRequired": "Địa chỉ máy chủ là bắt buộc khi bật proxy",
|
||||
"typeRequired": "Loại proxy là bắt buộc khi bật proxy",
|
||||
"usernameRequired": "Tên đăng nhập là bắt buộc khi bật xác thực"
|
||||
}
|
||||
},
|
||||
"remoteServer": {
|
||||
"authError": "Xác thực thất bại: {{error}}",
|
||||
"authPending": "Vui lòng hoàn tất xác thực trong trình duyệt",
|
||||
|
||||
+96
-42
@@ -71,44 +71,23 @@
|
||||
"DeepSeek-V3": {
|
||||
"description": "DeepSeek-V3 là một mô hình MoE do công ty DeepSeek tự phát triển. Nhiều kết quả đánh giá của DeepSeek-V3 đã vượt qua các mô hình mã nguồn mở khác như Qwen2.5-72B và Llama-3.1-405B, và về hiệu suất không thua kém các mô hình đóng nguồn hàng đầu thế giới như GPT-4o và Claude-3.5-Sonnet."
|
||||
},
|
||||
"Doubao-1.5-thinking-pro-m": {
|
||||
"description": "Doubao-1.5 là mô hình suy nghĩ sâu mới (phiên bản m đi kèm khả năng suy luận đa phương thức nguyên bản), thể hiện xuất sắc trong các lĩnh vực chuyên môn như toán học, lập trình, suy luận khoa học và các nhiệm vụ chung như viết sáng tạo, đạt hoặc gần đạt trình độ hàng đầu trong nhiều bài kiểm tra chuẩn uy tín như AIME 2024, Codeforces, GPQA. Hỗ trợ cửa sổ ngữ cảnh 128k, đầu ra 16k."
|
||||
},
|
||||
"Doubao-1.5-thinking-vision-pro": {
|
||||
"description": "Mô hình tư duy sâu mới với thị giác, có khả năng hiểu và suy luận đa phương thức mạnh mẽ hơn, đạt được hiệu suất SOTA trong 37 trên 59 tiêu chuẩn đánh giá công khai."
|
||||
},
|
||||
"Doubao-1.5-vision-pro": {
|
||||
"description": "Doubao-1.5-vision-pro là mô hình đa phương tiện lớn được nâng cấp mới, hỗ trợ nhận diện hình ảnh với bất kỳ độ phân giải nào và tỷ lệ dài rộng cực đoan, tăng cường khả năng suy luận hình ảnh, nhận diện tài liệu, hiểu thông tin chi tiết và tuân thủ hướng dẫn."
|
||||
},
|
||||
"Doubao-1.5-vision-pro-32k": {
|
||||
"description": "Doubao-1.5-vision-pro là mô hình lớn đa phương thức được nâng cấp hoàn toàn, hỗ trợ nhận diện hình ảnh với bất kỳ độ phân giải nào và tỷ lệ dài rộng cực đoan, tăng cường khả năng suy luận thị giác, nhận diện tài liệu, hiểu thông tin chi tiết và tuân thủ chỉ dẫn."
|
||||
},
|
||||
"Doubao-lite-128k": {
|
||||
"description": "Doubao-lite có tốc độ phản hồi cực nhanh, giá trị tốt hơn, cung cấp sự lựa chọn linh hoạt cho khách hàng trong nhiều tình huống khác nhau. Hỗ trợ suy diễn và tinh chỉnh trong ngữ cảnh 128k."
|
||||
"description": "Doubao-lite sở hữu tốc độ phản hồi tối ưu, hiệu quả chi phí tốt hơn, cung cấp lựa chọn linh hoạt hơn cho các kịch bản khác nhau của khách hàng. Hỗ trợ suy luận và tinh chỉnh với cửa sổ ngữ cảnh 128k."
|
||||
},
|
||||
"Doubao-lite-32k": {
|
||||
"description": "Doubao-lite có tốc độ phản hồi cực nhanh, giá trị tốt hơn, cung cấp sự lựa chọn linh hoạt cho khách hàng trong nhiều tình huống khác nhau. Hỗ trợ suy diễn và tinh chỉnh trong ngữ cảnh 32k."
|
||||
"description": "Doubao-lite sở hữu tốc độ phản hồi tối ưu, hiệu quả chi phí tốt hơn, cung cấp lựa chọn linh hoạt hơn cho các kịch bản khác nhau của khách hàng. Hỗ trợ suy luận và tinh chỉnh với cửa sổ ngữ cảnh 32k."
|
||||
},
|
||||
"Doubao-lite-4k": {
|
||||
"description": "Doubao-lite có tốc độ phản hồi cực nhanh, giá trị tốt hơn, cung cấp sự lựa chọn linh hoạt cho khách hàng trong nhiều tình huống khác nhau. Hỗ trợ suy diễn và tinh chỉnh trong ngữ cảnh 4k."
|
||||
"description": "Doubao-lite sở hữu tốc độ phản hồi tối ưu, hiệu quả chi phí tốt hơn, cung cấp lựa chọn linh hoạt hơn cho các kịch bản khác nhau của khách hàng. Hỗ trợ suy luận và tinh chỉnh với cửa sổ ngữ cảnh 4k."
|
||||
},
|
||||
"Doubao-pro-128k": {
|
||||
"description": "Mô hình chính có hiệu quả tốt nhất, phù hợp để xử lý các nhiệm vụ phức tạp, có hiệu quả tốt trong các tình huống như hỏi đáp tham khảo, tóm tắt, sáng tác, phân loại văn bản, và nhập vai. Hỗ trợ suy diễn và tinh chỉnh trong ngữ cảnh 128k."
|
||||
},
|
||||
"Doubao-pro-256k": {
|
||||
"description": "Mô hình chủ lực có hiệu quả tốt nhất, phù hợp để xử lý các nhiệm vụ phức tạp, có hiệu quả tốt trong các tình huống như hỏi đáp tham khảo, tóm tắt, sáng tác, phân loại văn bản, và nhập vai. Hỗ trợ suy luận và tinh chỉnh với cửa sổ ngữ cảnh 256k."
|
||||
"description": "Mô hình chủ lực với hiệu quả tốt nhất, phù hợp xử lý các nhiệm vụ phức tạp, có hiệu quả xuất sắc trong các kịch bản như hỏi đáp tham khảo, tóm tắt, sáng tạo, phân loại văn bản, nhập vai. Hỗ trợ suy luận và tinh chỉnh với cửa sổ ngữ cảnh 128k."
|
||||
},
|
||||
"Doubao-pro-32k": {
|
||||
"description": "Mô hình chính có hiệu quả tốt nhất, phù hợp để xử lý các nhiệm vụ phức tạp, có hiệu quả tốt trong các tình huống như hỏi đáp tham khảo, tóm tắt, sáng tác, phân loại văn bản, và nhập vai. Hỗ trợ suy diễn và tinh chỉnh trong ngữ cảnh 32k."
|
||||
"description": "Mô hình chủ lực với hiệu quả tốt nhất, phù hợp xử lý các nhiệm vụ phức tạp, có hiệu quả xuất sắc trong các kịch bản như hỏi đáp tham khảo, tóm tắt, sáng tạo, phân loại văn bản, nhập vai. Hỗ trợ suy luận và tinh chỉnh với cửa sổ ngữ cảnh 32k."
|
||||
},
|
||||
"Doubao-pro-4k": {
|
||||
"description": "Mô hình chính có hiệu quả tốt nhất, phù hợp để xử lý các nhiệm vụ phức tạp, có hiệu quả tốt trong các tình huống như hỏi đáp tham khảo, tóm tắt, sáng tác, phân loại văn bản, và nhập vai. Hỗ trợ suy diễn và tinh chỉnh trong ngữ cảnh 4k."
|
||||
},
|
||||
"Doubao-vision-lite-32k": {
|
||||
"description": "Mô hình Doubao-vision là mô hình lớn đa phương thức do Doubao phát triển, có khả năng hiểu và suy luận hình ảnh mạnh mẽ, cũng như khả năng hiểu chỉ dẫn chính xác. Mô hình thể hiện hiệu suất mạnh mẽ trong việc trích xuất thông tin văn bản từ hình ảnh và các nhiệm vụ suy luận dựa trên hình ảnh, có thể áp dụng cho các nhiệm vụ hỏi đáp thị giác phức tạp và đa dạng hơn."
|
||||
},
|
||||
"Doubao-vision-pro-32k": {
|
||||
"description": "Mô hình Doubao-vision là mô hình lớn đa phương thức do Doubao phát triển, có khả năng hiểu và suy luận hình ảnh mạnh mẽ, cũng như khả năng hiểu chỉ dẫn chính xác. Mô hình thể hiện hiệu suất mạnh mẽ trong việc trích xuất thông tin văn bản từ hình ảnh và các nhiệm vụ suy luận dựa trên hình ảnh, có thể áp dụng cho các nhiệm vụ hỏi đáp thị giác phức tạp và đa dạng hơn."
|
||||
"description": "Mô hình chủ lực với hiệu quả tốt nhất, phù hợp xử lý các nhiệm vụ phức tạp, có hiệu quả xuất sắc trong các kịch bản như hỏi đáp tham khảo, tóm tắt, sáng tạo, phân loại văn bản, nhập vai. Hỗ trợ suy luận và tinh chỉnh với cửa sổ ngữ cảnh 4k."
|
||||
},
|
||||
"ERNIE-3.5-128K": {
|
||||
"description": "Mô hình ngôn ngữ quy mô lớn hàng đầu do Baidu tự phát triển, bao phủ một lượng lớn tài liệu tiếng Trung và tiếng Anh, có khả năng tổng quát mạnh mẽ, có thể đáp ứng hầu hết các yêu cầu về đối thoại, hỏi đáp, sáng tạo nội dung và các tình huống ứng dụng plugin; hỗ trợ tự động kết nối với plugin tìm kiếm của Baidu, đảm bảo thông tin hỏi đáp luôn được cập nhật kịp thời."
|
||||
@@ -224,24 +203,21 @@
|
||||
"Pro/Qwen/Qwen2.5-VL-7B-Instruct": {
|
||||
"description": "Qwen2.5-VL là thành viên mới của series Qwen, sở hữu khả năng hiểu thị giác mạnh mẽ, có thể phân tích văn bản, biểu đồ và bố cục trong hình ảnh, cũng như hiểu video dài và bắt các sự kiện, có thể suy luận, thao tác công cụ, hỗ trợ định vị vật thể đa định dạng và tạo ra đầu ra có cấu trúc, tối ưu hóa việc huấn luyện độ phân giải và tốc độ khung hình động cho việc hiểu video, đồng thời cải thiện hiệu suất của bộ mã hóa thị giác."
|
||||
},
|
||||
"Pro/THUDM/GLM-4.1V-9B-Thinking": {
|
||||
"description": "GLM-4.1V-9B-Thinking là một mô hình ngôn ngữ thị giác (VLM) mã nguồn mở được phát hành chung bởi Zhipu AI và Phòng thí nghiệm KEG của Đại học Thanh Hoa, được thiết kế đặc biệt để xử lý các nhiệm vụ nhận thức đa phương thức phức tạp. Mô hình này dựa trên mô hình cơ sở GLM-4-9B-0414, thông qua việc giới thiệu cơ chế suy luận “Chuỗi tư duy” (Chain-of-Thought) và áp dụng chiến lược học tăng cường, đã nâng cao đáng kể khả năng suy luận đa phương thức và tính ổn định của nó."
|
||||
},
|
||||
"Pro/THUDM/glm-4-9b-chat": {
|
||||
"description": "GLM-4-9B-Chat là phiên bản mã nguồn mở trong loạt mô hình tiền huấn luyện GLM-4 do Zhizhu AI phát hành. Mô hình này thể hiện xuất sắc trong nhiều lĩnh vực như ngữ nghĩa, toán học, suy luận, mã và kiến thức. Ngoài việc hỗ trợ đối thoại nhiều vòng, GLM-4-9B-Chat còn có các tính năng nâng cao như duyệt web, thực thi mã, gọi công cụ tùy chỉnh (Function Call) và suy luận văn bản dài. Mô hình hỗ trợ 26 ngôn ngữ, bao gồm tiếng Trung, tiếng Anh, tiếng Nhật, tiếng Hàn và tiếng Đức. Trong nhiều bài kiểm tra chuẩn, GLM-4-9B-Chat đã thể hiện hiệu suất xuất sắc, như AlignBench-v2, MT-Bench, MMLU và C-Eval. Mô hình hỗ trợ độ dài ngữ cảnh tối đa 128K, phù hợp cho nghiên cứu học thuật và ứng dụng thương mại."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1": {
|
||||
"description": "DeepSeek-R1 là một mô hình suy diễn được điều khiển bởi học tăng cường (RL), giải quyết các vấn đề về tính lặp lại và khả năng đọc trong mô hình. Trước khi áp dụng RL, DeepSeek-R1 đã giới thiệu dữ liệu khởi động lạnh, tối ưu hóa thêm hiệu suất suy diễn. Nó thể hiện hiệu suất tương đương với OpenAI-o1 trong các nhiệm vụ toán học, mã và suy diễn, và thông qua phương pháp đào tạo được thiết kế cẩn thận, nâng cao hiệu quả tổng thể."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1-0120": {
|
||||
"description": "DeepSeek-R1 là mô hình suy luận được điều khiển bằng học tăng cường (RL), giải quyết các vấn đề về tính lặp lại và khả năng đọc hiểu của mô hình. Trước khi áp dụng RL, DeepSeek-R1 đã giới thiệu dữ liệu khởi động lạnh để tối ưu hóa hiệu suất suy luận. Mô hình đạt hiệu quả tương đương OpenAI-o1 trong các nhiệm vụ toán học, mã hóa và suy luận, đồng thời nâng cao tổng thể nhờ phương pháp huấn luyện tinh tế."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B": {
|
||||
"description": "DeepSeek-R1-Distill-Qwen-7B là mô hình được tạo ra từ Qwen2.5-Math-7B thông qua quá trình chưng cất kiến thức. Mô hình này được tinh chỉnh bằng 800.000 mẫu được chọn lọc từ DeepSeek-R1, thể hiện khả năng suy luận xuất sắc. Nó đã đạt được hiệu suất tốt trong nhiều bài kiểm tra chuẩn, trong đó có độ chính xác 92,8% trên MATH-500, tỷ lệ vượt qua 55,5% trên AIME 2024, và điểm số 1189 trên CodeForces, thể hiện khả năng toán học và lập trình mạnh mẽ cho một mô hình có quy mô 7B."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-V3": {
|
||||
"description": "DeepSeek-V3 là một mô hình ngôn ngữ hỗn hợp chuyên gia (MoE) với 6710 tỷ tham số, sử dụng chú ý tiềm ẩn đa đầu (MLA) và kiến trúc DeepSeekMoE, kết hợp chiến lược cân bằng tải không có tổn thất phụ trợ, tối ưu hóa hiệu suất suy diễn và đào tạo. Thông qua việc được tiền huấn luyện trên 14.8 triệu tỷ token chất lượng cao, và thực hiện tinh chỉnh giám sát và học tăng cường, DeepSeek-V3 vượt trội hơn các mô hình mã nguồn mở khác, gần với các mô hình đóng kín hàng đầu."
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-V3-1226": {
|
||||
"description": "DeepSeek-V3 là một mô hình ngôn ngữ hỗn hợp chuyên gia (MoE) với 6710 tỷ tham số, sử dụng cơ cấu chú ý tiềm ẩn đa đầu (MLA) và DeepSeekMoE, kết hợp với chiến lược cân bằng tải không có tổn thất phụ trợ, tối ưu hóa hiệu suất suy diễn và đào tạo. Qua việc được tiền huấn luyện trên 14.8 triệu tỷ token chất lượng cao, và thực hiện tinh chỉnh giám sát cũng như học tăng cường, DeepSeek-V3 vượt trội về hiệu suất so với các mô hình mã nguồn mở khác, gần đạt được hiệu suất của các mô hình đóng nguồn hàng đầu."
|
||||
},
|
||||
"QwQ-32B-Preview": {
|
||||
"description": "QwQ-32B-Preview là một mô hình xử lý ngôn ngữ tự nhiên độc đáo, có khả năng xử lý hiệu quả các nhiệm vụ tạo đối thoại phức tạp và hiểu ngữ cảnh."
|
||||
},
|
||||
@@ -404,6 +380,9 @@
|
||||
"THUDM/GLM-4-9B-0414": {
|
||||
"description": "GLM-4-9B-0414 là mô hình nhỏ trong dòng GLM, với 9 tỷ tham số. Mô hình này kế thừa các đặc điểm kỹ thuật của dòng GLM-4-32B, nhưng cung cấp lựa chọn triển khai nhẹ hơn. Mặc dù quy mô nhỏ, GLM-4-9B-0414 vẫn thể hiện khả năng xuất sắc trong các nhiệm vụ như tạo mã, thiết kế trang web, tạo đồ họa SVG và viết dựa trên tìm kiếm."
|
||||
},
|
||||
"THUDM/GLM-4.1V-9B-Thinking": {
|
||||
"description": "GLM-4.1V-9B-Thinking là một mô hình ngôn ngữ thị giác (VLM) mã nguồn mở được phát hành chung bởi Zhipu AI và Phòng thí nghiệm KEG của Đại học Thanh Hoa, được thiết kế đặc biệt để xử lý các nhiệm vụ nhận thức đa phương thức phức tạp. Mô hình này dựa trên mô hình cơ sở GLM-4-9B-0414, thông qua việc giới thiệu cơ chế suy luận “Chuỗi tư duy” (Chain-of-Thought) và áp dụng chiến lược học tăng cường, đã nâng cao đáng kể khả năng suy luận đa phương thức và tính ổn định của nó."
|
||||
},
|
||||
"THUDM/GLM-Z1-32B-0414": {
|
||||
"description": "GLM-Z1-32B-0414 là một mô hình suy luận có khả năng suy tư sâu. Mô hình này được phát triển dựa trên GLM-4-32B-0414 thông qua khởi động lạnh và tăng cường học tập, và đã được huấn luyện thêm trong các nhiệm vụ toán học, mã và logic. So với mô hình cơ sở, GLM-Z1-32B-0414 đã nâng cao đáng kể khả năng toán học và khả năng giải quyết các nhiệm vụ phức tạp."
|
||||
},
|
||||
@@ -560,6 +539,9 @@
|
||||
"anthropic/claude-sonnet-4": {
|
||||
"description": "Claude Sonnet 4 có thể tạo ra phản hồi gần như tức thì hoặc suy nghĩ từng bước kéo dài, người dùng có thể rõ ràng quan sát quá trình này. Người dùng API cũng có thể kiểm soát chi tiết thời gian suy nghĩ của mô hình."
|
||||
},
|
||||
"ascend-tribe/pangu-pro-moe": {
|
||||
"description": "Pangu-Pro-MoE 72B-A16B là một mô hình ngôn ngữ lớn thưa thớt với 72 tỷ tham số và 16 tỷ tham số kích hoạt, dựa trên kiến trúc chuyên gia hỗn hợp theo nhóm (MoGE). Nó phân nhóm các chuyên gia trong giai đoạn lựa chọn chuyên gia và giới hạn token kích hoạt số lượng chuyên gia bằng nhau trong mỗi nhóm, từ đó đạt được cân bằng tải chuyên gia và cải thiện đáng kể hiệu quả triển khai mô hình trên nền tảng Ascend."
|
||||
},
|
||||
"aya": {
|
||||
"description": "Aya 23 là mô hình đa ngôn ngữ do Cohere phát hành, hỗ trợ 23 ngôn ngữ, tạo điều kiện thuận lợi cho các ứng dụng ngôn ngữ đa dạng."
|
||||
},
|
||||
@@ -569,6 +551,9 @@
|
||||
"baichuan/baichuan2-13b-chat": {
|
||||
"description": "Baichuan-13B là mô hình ngôn ngữ lớn mã nguồn mở có thể thương mại hóa với 130 tỷ tham số, được phát triển bởi Baichuan Intelligence, đã đạt được hiệu suất tốt nhất trong cùng kích thước trên các benchmark tiếng Trung và tiếng Anh."
|
||||
},
|
||||
"baidu/ERNIE-4.5-300B-A47B": {
|
||||
"description": "ERNIE-4.5-300B-A47B là một mô hình ngôn ngữ lớn dựa trên kiến trúc chuyên gia hỗn hợp (MoE) do công ty Baidu phát triển. Mô hình có tổng số 300 tỷ tham số, nhưng trong quá trình suy luận mỗi token chỉ kích hoạt 47 tỷ tham số, đảm bảo hiệu suất mạnh mẽ đồng thời tối ưu hóa hiệu quả tính toán. Là một trong những mô hình cốt lõi của dòng ERNIE 4.5, nó thể hiện khả năng xuất sắc trong các nhiệm vụ hiểu, tạo văn bản, suy luận và lập trình. Mô hình áp dụng phương pháp tiền huấn luyện MoE dị thể đa phương thức sáng tạo, thông qua huấn luyện kết hợp văn bản và hình ảnh, nâng cao hiệu quả tổng thể, đặc biệt nổi bật trong việc tuân thủ chỉ dẫn và ghi nhớ kiến thức thế giới."
|
||||
},
|
||||
"c4ai-aya-expanse-32b": {
|
||||
"description": "Aya Expanse là một mô hình đa ngôn ngữ hiệu suất cao 32B, được thiết kế để thách thức hiệu suất của các mô hình đơn ngôn ngữ thông qua việc tinh chỉnh theo chỉ dẫn, khai thác dữ liệu, đào tạo theo sở thích và hợp nhất mô hình. Nó hỗ trợ 23 ngôn ngữ."
|
||||
},
|
||||
@@ -726,7 +711,7 @@
|
||||
"description": "Compound-beta-mini là một hệ thống AI phức hợp, được hỗ trợ bởi các mô hình có sẵn công khai trong GroqCloud, có khả năng thông minh và chọn lọc sử dụng công cụ để trả lời các truy vấn của người dùng."
|
||||
},
|
||||
"computer-use-preview": {
|
||||
"description": "Mô hình computer-use-preview được thiết kế chuyên biệt cho \"công cụ sử dụng máy tính\", được huấn luyện để hiểu và thực hiện các nhiệm vụ liên quan đến máy tính."
|
||||
"description": "Mô hình computer-use-preview được thiết kế chuyên biệt cho “công cụ sử dụng máy tính”, được huấn luyện để hiểu và thực hiện các nhiệm vụ liên quan đến máy tính."
|
||||
},
|
||||
"dall-e-2": {
|
||||
"description": "Mô hình DALL·E thế hệ thứ hai, hỗ trợ tạo hình ảnh chân thực và chính xác hơn, với độ phân giải gấp 4 lần thế hệ đầu tiên."
|
||||
@@ -914,9 +899,39 @@
|
||||
"doubao-1.5-thinking-pro": {
|
||||
"description": "Mô hình tư duy sâu mới Doubao-1.5, nổi bật trong các lĩnh vực chuyên môn như toán học, lập trình, suy luận khoa học và các nhiệm vụ viết sáng tạo, đạt hoặc gần đạt trình độ hàng đầu trong ngành trên nhiều tiêu chuẩn uy tín như AIME 2024, Codeforces, GPQA. Hỗ trợ cửa sổ ngữ cảnh 128k, đầu ra 16k."
|
||||
},
|
||||
"doubao-1.5-thinking-pro-m": {
|
||||
"description": "Doubao-1.5 là mô hình tư duy sâu hoàn toàn mới (phiên bản m có khả năng suy luận đa phương thức sâu nguyên bản), thể hiện xuất sắc trong các lĩnh vực chuyên môn như toán học, lập trình, suy luận khoa học và các nhiệm vụ sáng tạo chung. Đạt hoặc gần đạt trình độ hàng đầu ngành trên nhiều chuẩn đánh giá uy tín như AIME 2024, Codeforces, GPQA. Hỗ trợ cửa sổ ngữ cảnh 128k, đầu ra 16k."
|
||||
},
|
||||
"doubao-1.5-thinking-vision-pro": {
|
||||
"description": "Mô hình tư duy sâu đa phương thức hoàn toàn mới, có khả năng hiểu và suy luận đa phương thức tổng quát mạnh mẽ, đạt hiệu suất SOTA trên 37 trong số 59 chuẩn đánh giá công khai."
|
||||
},
|
||||
"doubao-1.5-ui-tars": {
|
||||
"description": "Doubao-1.5-UI-TARS là mô hình Agent nguyên bản hướng tới tương tác giao diện đồ họa (GUI). Thông qua khả năng nhận thức, suy luận và hành động giống con người, tương tác liền mạch với GUI."
|
||||
},
|
||||
"doubao-1.5-vision-lite": {
|
||||
"description": "Doubao-1.5-vision-lite là mô hình đa phương tiện lớn được nâng cấp mới, hỗ trợ nhận diện hình ảnh với bất kỳ độ phân giải nào và tỷ lệ dài rộng cực đoan, tăng cường khả năng suy luận hình ảnh, nhận diện tài liệu, hiểu thông tin chi tiết và tuân thủ hướng dẫn. Hỗ trợ cửa sổ ngữ cảnh 128k, độ dài đầu ra tối đa 16k tokens."
|
||||
},
|
||||
"doubao-1.5-vision-pro": {
|
||||
"description": "Doubao-1.5-vision-pro là mô hình đa phương thức lớn được nâng cấp hoàn toàn mới, hỗ trợ nhận dạng hình ảnh với độ phân giải tùy ý và tỷ lệ khung hình cực đoan, tăng cường khả năng suy luận thị giác, nhận dạng tài liệu, hiểu thông tin chi tiết và tuân thủ chỉ dẫn."
|
||||
},
|
||||
"doubao-1.5-vision-pro-32k": {
|
||||
"description": "Doubao-1.5-vision-pro là mô hình đa phương thức lớn được nâng cấp hoàn toàn mới, hỗ trợ nhận dạng hình ảnh với độ phân giải tùy ý và tỷ lệ khung hình cực đoan, tăng cường khả năng suy luận thị giác, nhận dạng tài liệu, hiểu thông tin chi tiết và tuân thủ chỉ dẫn."
|
||||
},
|
||||
"doubao-lite-128k": {
|
||||
"description": "Sở hữu tốc độ phản hồi tối ưu, hiệu quả chi phí tốt hơn, cung cấp lựa chọn linh hoạt hơn cho các kịch bản khác nhau của khách hàng. Hỗ trợ suy luận và tinh chỉnh với cửa sổ ngữ cảnh 128k."
|
||||
},
|
||||
"doubao-lite-32k": {
|
||||
"description": "Sở hữu tốc độ phản hồi tối ưu, hiệu quả chi phí tốt hơn, cung cấp lựa chọn linh hoạt hơn cho các kịch bản khác nhau của khách hàng. Hỗ trợ suy luận và tinh chỉnh với cửa sổ ngữ cảnh 32k."
|
||||
},
|
||||
"doubao-lite-4k": {
|
||||
"description": "Sở hữu tốc độ phản hồi tối ưu, hiệu quả chi phí tốt hơn, cung cấp lựa chọn linh hoạt hơn cho các kịch bản khác nhau của khách hàng. Hỗ trợ suy luận và tinh chỉnh với cửa sổ ngữ cảnh 4k."
|
||||
},
|
||||
"doubao-pro-256k": {
|
||||
"description": "Mô hình chủ lực với hiệu quả tốt nhất, phù hợp xử lý các nhiệm vụ phức tạp, có hiệu quả xuất sắc trong các kịch bản như hỏi đáp tham khảo, tóm tắt, sáng tạo, phân loại văn bản, nhập vai. Hỗ trợ suy luận và tinh chỉnh với cửa sổ ngữ cảnh 256k."
|
||||
},
|
||||
"doubao-pro-32k": {
|
||||
"description": "Mô hình chủ lực với hiệu quả tốt nhất, phù hợp xử lý các nhiệm vụ phức tạp, có hiệu quả xuất sắc trong các kịch bản như hỏi đáp tham khảo, tóm tắt, sáng tạo, phân loại văn bản, nhập vai. Hỗ trợ suy luận và tinh chỉnh với cửa sổ ngữ cảnh 32k."
|
||||
},
|
||||
"doubao-seed-1.6": {
|
||||
"description": "Doubao-Seed-1.6 là mô hình suy nghĩ sâu đa phương thức hoàn toàn mới, hỗ trợ ba chế độ suy nghĩ auto/thinking/non-thinking. Ở chế độ non-thinking, hiệu quả mô hình cải thiện đáng kể so với Doubao-1.5-pro/250115. Hỗ trợ cửa sổ ngữ cảnh 256k, độ dài đầu ra tối đa 16k tokens."
|
||||
},
|
||||
@@ -924,7 +939,13 @@
|
||||
"description": "Doubao-Seed-1.6-flash là mô hình suy nghĩ sâu đa phương thức với tốc độ suy luận tối ưu, TPOT chỉ cần 10ms; đồng thời hỗ trợ hiểu văn bản và hình ảnh, khả năng hiểu văn bản vượt trội so với thế hệ lite trước, khả năng hiểu hình ảnh sánh ngang với các mô hình pro của đối thủ. Hỗ trợ cửa sổ ngữ cảnh 256k, độ dài đầu ra tối đa 16k tokens."
|
||||
},
|
||||
"doubao-seed-1.6-thinking": {
|
||||
"description": "Mô hình Doubao-Seed-1.6-thinking có khả năng suy nghĩ được tăng cường đáng kể, so với Doubao-1.5-thinking-pro, nâng cao hơn nữa các năng lực cơ bản như Lập trình, Toán học, Lý luận logic, đồng thời hỗ trợ hiểu hình ảnh. Hỗ trợ cửa sổ ngữ cảnh 256k, độ dài đầu ra tối đa 16k tokens."
|
||||
"description": "Mô hình Doubao-Seed-1.6-thinking có khả năng suy nghĩ được tăng cường đáng kể, so với Doubao-1.5-thinking-pro, nâng cao hơn nữa các năng lực cơ bản như lập trình, toán học, suy luận logic, đồng thời hỗ trợ hiểu hình ảnh. Hỗ trợ cửa sổ ngữ cảnh 256k, độ dài đầu ra tối đa 16k tokens."
|
||||
},
|
||||
"doubao-vision-lite-32k": {
|
||||
"description": "Mô hình Doubao-vision là mô hình đa phương thức lớn do Doubao phát triển, có khả năng hiểu và suy luận hình ảnh mạnh mẽ, cùng khả năng hiểu chỉ dẫn chính xác. Mô hình thể hiện hiệu suất vượt trội trong việc trích xuất thông tin văn bản từ hình ảnh và các nhiệm vụ suy luận dựa trên hình ảnh, có thể ứng dụng trong các nhiệm vụ hỏi đáp thị giác phức tạp và đa dạng hơn."
|
||||
},
|
||||
"doubao-vision-pro-32k": {
|
||||
"description": "Mô hình Doubao-vision là mô hình đa phương thức lớn do Doubao phát triển, có khả năng hiểu và suy luận hình ảnh mạnh mẽ, cùng khả năng hiểu chỉ dẫn chính xác. Mô hình thể hiện hiệu suất vượt trội trong việc trích xuất thông tin văn bản từ hình ảnh và các nhiệm vụ suy luận dựa trên hình ảnh, có thể ứng dụng trong các nhiệm vụ hỏi đáp thị giác phức tạp và đa dạng hơn."
|
||||
},
|
||||
"emohaa": {
|
||||
"description": "Emohaa là mô hình tâm lý, có khả năng tư vấn chuyên nghiệp, giúp người dùng hiểu các vấn đề cảm xúc."
|
||||
@@ -1082,9 +1103,6 @@
|
||||
"gemini-2.5-pro": {
|
||||
"description": "Gemini 2.5 Pro là mô hình tư duy tiên tiến nhất của Google, có khả năng suy luận các vấn đề phức tạp trong lĩnh vực mã nguồn, toán học và STEM, cũng như phân tích các bộ dữ liệu lớn, kho mã và tài liệu bằng ngữ cảnh dài."
|
||||
},
|
||||
"gemini-2.5-pro-exp-03-25": {
|
||||
"description": "Gemini 2.5 Pro Experimental là mô hình tư duy tiên tiến nhất của Google, có khả năng suy luận về mã, toán học và các vấn đề phức tạp trong lĩnh vực STEM, đồng thời có thể phân tích các tập dữ liệu lớn, kho mã và tài liệu bằng cách sử dụng ngữ cảnh dài."
|
||||
},
|
||||
"gemini-2.5-pro-preview-03-25": {
|
||||
"description": "Gemini 2.5 Pro Preview là mô hình tư duy tiên tiến nhất của Google, có khả năng suy luận về mã, toán học và các vấn đề phức tạp trong lĩnh vực STEM, cũng như phân tích các tập dữ liệu lớn, kho mã và tài liệu bằng cách sử dụng ngữ cảnh dài."
|
||||
},
|
||||
@@ -1151,6 +1169,12 @@
|
||||
"glm-4-plus": {
|
||||
"description": "GLM-4-Plus là mô hình flagship thông minh cao, có khả năng xử lý văn bản dài và nhiệm vụ phức tạp, hiệu suất được nâng cao toàn diện."
|
||||
},
|
||||
"glm-4.1v-thinking-flash": {
|
||||
"description": "Dòng mô hình GLM-4.1V-Thinking là mô hình VLM cấp 10 tỷ tham số mạnh nhất hiện biết, tích hợp các nhiệm vụ ngôn ngữ thị giác SOTA cùng cấp, bao gồm hiểu video, hỏi đáp hình ảnh, giải bài tập chuyên ngành, nhận dạng ký tự quang học (OCR), phân tích tài liệu và biểu đồ, tác nhân GUI, lập trình giao diện web frontend, định vị (Grounding) và nhiều nhiệm vụ khác, với khả năng vượt trội so với Qwen2.5-VL-72B có tham số gấp 8 lần. Thông qua công nghệ học tăng cường tiên tiến, mô hình nắm vững phương pháp suy luận chuỗi tư duy để nâng cao độ chính xác và sự phong phú của câu trả lời, vượt trội rõ rệt so với các mô hình truyền thống không có tính năng thinking về hiệu quả cuối cùng và khả năng giải thích."
|
||||
},
|
||||
"glm-4.1v-thinking-flashx": {
|
||||
"description": "Dòng mô hình GLM-4.1V-Thinking là mô hình VLM cấp 10 tỷ tham số mạnh nhất hiện biết, tích hợp các nhiệm vụ ngôn ngữ thị giác SOTA cùng cấp, bao gồm hiểu video, hỏi đáp hình ảnh, giải bài tập chuyên ngành, nhận dạng ký tự quang học (OCR), phân tích tài liệu và biểu đồ, tác nhân GUI, lập trình giao diện web frontend, định vị (Grounding) và nhiều nhiệm vụ khác, với khả năng vượt trội so với Qwen2.5-VL-72B có tham số gấp 8 lần. Thông qua công nghệ học tăng cường tiên tiến, mô hình nắm vững phương pháp suy luận chuỗi tư duy để nâng cao độ chính xác và sự phong phú của câu trả lời, vượt trội rõ rệt so với các mô hình truyền thống không có tính năng thinking về hiệu quả cuối cùng và khả năng giải thích."
|
||||
},
|
||||
"glm-4v": {
|
||||
"description": "GLM-4V cung cấp khả năng hiểu và suy luận hình ảnh mạnh mẽ, hỗ trợ nhiều nhiệm vụ hình ảnh."
|
||||
},
|
||||
@@ -1172,6 +1196,9 @@
|
||||
"glm-z1-flash": {
|
||||
"description": "Dòng GLM-Z1 có khả năng suy luận phức tạp mạnh mẽ, thể hiện xuất sắc trong các lĩnh vực suy luận logic, toán học, lập trình. Độ dài ngữ cảnh tối đa là 32K."
|
||||
},
|
||||
"glm-z1-flashx": {
|
||||
"description": "Tốc độ cao, giá thấp: Phiên bản tăng cường Flash, tốc độ suy luận siêu nhanh, đảm bảo đồng thời nhanh hơn."
|
||||
},
|
||||
"glm-zero-preview": {
|
||||
"description": "GLM-Zero-Preview có khả năng suy luận phức tạp mạnh mẽ, thể hiện xuất sắc trong các lĩnh vực suy luận logic, toán học, lập trình."
|
||||
},
|
||||
@@ -1223,6 +1250,9 @@
|
||||
"google/gemma-2b-it": {
|
||||
"description": "Gemma Instruct (2B) cung cấp khả năng xử lý chỉ dẫn cơ bản, phù hợp cho các ứng dụng nhẹ."
|
||||
},
|
||||
"google/gemma-3-1b-it": {
|
||||
"description": "Gemma 3 1B là một mô hình ngôn ngữ mã nguồn mở của Google, thiết lập tiêu chuẩn mới về hiệu quả và hiệu suất."
|
||||
},
|
||||
"google/gemma-3-27b-it": {
|
||||
"description": "Gemma 3 27B là một mô hình ngôn ngữ mã nguồn mở của Google, thiết lập tiêu chuẩn mới về hiệu suất và hiệu quả."
|
||||
},
|
||||
@@ -1313,6 +1343,9 @@
|
||||
"gpt-4o-mini-search-preview": {
|
||||
"description": "GPT-4o mini phiên bản xem trước tìm kiếm là mô hình được huấn luyện chuyên biệt để hiểu và thực thi các truy vấn tìm kiếm trên web, sử dụng API Chat Completions. Ngoài phí token, truy vấn tìm kiếm trên web còn tính phí theo mỗi lần gọi công cụ."
|
||||
},
|
||||
"gpt-4o-mini-transcribe": {
|
||||
"description": "GPT-4o Mini Transcribe là mô hình chuyển đổi giọng nói thành văn bản sử dụng GPT-4o để phiên âm âm thanh. So với mô hình Whisper gốc, nó cải thiện tỷ lệ lỗi từ và nâng cao khả năng nhận diện ngôn ngữ cũng như độ chính xác. Sử dụng nó để có bản phiên âm chính xác hơn."
|
||||
},
|
||||
"gpt-4o-mini-tts": {
|
||||
"description": "GPT-4o mini TTS là mô hình chuyển văn bản thành giọng nói dựa trên GPT-4o mini, cung cấp sinh âm thanh cao cấp với chi phí thấp hơn."
|
||||
},
|
||||
@@ -1322,12 +1355,15 @@
|
||||
"gpt-4o-realtime-preview-2024-10-01": {
|
||||
"description": "Phiên bản thời gian thực của GPT-4o, hỗ trợ đầu vào và đầu ra âm thanh và văn bản theo thời gian thực."
|
||||
},
|
||||
"gpt-4o-realtime-preview-2024-12-17": {
|
||||
"description": "Phiên bản thời gian thực của GPT-4o, hỗ trợ đầu vào và đầu ra âm thanh và văn bản theo thời gian thực."
|
||||
"gpt-4o-realtime-preview-2025-06-03": {
|
||||
"description": "Phiên bản thời gian thực của GPT-4o, hỗ trợ nhập xuất âm thanh và văn bản theo thời gian thực."
|
||||
},
|
||||
"gpt-4o-search-preview": {
|
||||
"description": "GPT-4o phiên bản xem trước tìm kiếm là mô hình được huấn luyện chuyên biệt để hiểu và thực thi các truy vấn tìm kiếm trên web, sử dụng API Chat Completions. Ngoài phí token, truy vấn tìm kiếm trên web còn tính phí theo mỗi lần gọi công cụ."
|
||||
},
|
||||
"gpt-4o-transcribe": {
|
||||
"description": "GPT-4o Transcribe là mô hình chuyển đổi giọng nói thành văn bản sử dụng GPT-4o để phiên âm âm thanh. So với mô hình Whisper gốc, nó cải thiện tỷ lệ lỗi từ và nâng cao khả năng nhận diện ngôn ngữ cũng như độ chính xác. Sử dụng nó để có bản phiên âm chính xác hơn."
|
||||
},
|
||||
"grok-2-1212": {
|
||||
"description": "Mô hình này đã được cải thiện về độ chính xác, khả năng tuân thủ hướng dẫn và khả năng đa ngôn ngữ."
|
||||
},
|
||||
@@ -1346,9 +1382,15 @@
|
||||
"grok-3-mini-fast": {
|
||||
"description": "Mô hình nhẹ, suy nghĩ trước khi trả lời. Chạy nhanh, thông minh, phù hợp cho các nhiệm vụ logic không đòi hỏi kiến thức chuyên sâu và có thể truy xuất được chuỗi suy nghĩ gốc."
|
||||
},
|
||||
"grok-4": {
|
||||
"description": "Mô hình hàng đầu mới nhất và mạnh mẽ nhất của chúng tôi, thể hiện xuất sắc trong xử lý ngôn ngữ tự nhiên, tính toán toán học và suy luận — một lựa chọn toàn diện hoàn hảo."
|
||||
},
|
||||
"gryphe/mythomax-l2-13b": {
|
||||
"description": "MythoMax l2 13B là mô hình ngôn ngữ kết hợp giữa sáng tạo và trí thông minh, kết hợp nhiều mô hình hàng đầu."
|
||||
},
|
||||
"hunyuan-a13b": {
|
||||
"description": "Hunyuan là mô hình suy luận hỗn hợp đầu tiên, phiên bản nâng cấp của hunyuan-standard-256K, với tổng số tham số 80 tỷ và 13 tỷ tham số kích hoạt. Mặc định ở chế độ suy nghĩ chậm, hỗ trợ chuyển đổi giữa chế độ suy nghĩ nhanh và chậm qua tham số hoặc chỉ thị, cách chuyển đổi là thêm / no_think trước truy vấn; năng lực tổng thể được cải thiện toàn diện so với thế hệ trước, đặc biệt là về toán học, khoa học, hiểu văn bản dài và năng lực tác nhân."
|
||||
},
|
||||
"hunyuan-code": {
|
||||
"description": "Mô hình sinh mã mới nhất của Hunyuan, được huấn luyện trên 200B dữ liệu mã chất lượng cao, trải qua nửa năm huấn luyện dữ liệu SFT chất lượng cao, độ dài cửa sổ ngữ cảnh tăng lên 8K, đứng đầu trong các chỉ số đánh giá tự động sinh mã cho năm ngôn ngữ lớn; trong đánh giá chất lượng cao của 10 tiêu chí mã tổng hợp cho năm ngôn ngữ, hiệu suất nằm trong nhóm đầu."
|
||||
},
|
||||
@@ -1400,6 +1442,9 @@
|
||||
"hunyuan-t1-vision": {
|
||||
"description": "Mô hình suy nghĩ sâu đa phương thức Hunyuan, hỗ trợ chuỗi suy nghĩ dài nguyên bản đa phương thức, xuất sắc trong các tình huống suy luận hình ảnh đa dạng, cải thiện toàn diện so với mô hình suy nghĩ nhanh trong các bài toán khoa học tự nhiên."
|
||||
},
|
||||
"hunyuan-t1-vision-20250619": {
|
||||
"description": "Phiên bản mới nhất của Hunyuan t1-vision là mô hình suy nghĩ sâu đa phương thức, hỗ trợ chuỗi tư duy dài nguyên bản đa phương thức, cải thiện toàn diện so với phiên bản mặc định thế hệ trước."
|
||||
},
|
||||
"hunyuan-turbo": {
|
||||
"description": "Phiên bản xem trước của thế hệ mới mô hình ngôn ngữ lớn Hunyuan, sử dụng cấu trúc mô hình chuyên gia hỗn hợp (MoE) hoàn toàn mới, so với hunyuan-pro, hiệu suất suy diễn nhanh hơn và hiệu quả mạnh mẽ hơn."
|
||||
},
|
||||
@@ -1430,6 +1475,12 @@
|
||||
"hunyuan-turbos-role-plus": {
|
||||
"description": "Mô hình nhập vai phiên bản mới nhất của Hunyuan, được tinh chỉnh chính thức bởi Hunyuan, dựa trên mô hình Hunyuan kết hợp với bộ dữ liệu kịch bản nhập vai để tăng cường huấn luyện, mang lại hiệu quả cơ bản tốt hơn trong các kịch bản nhập vai."
|
||||
},
|
||||
"hunyuan-turbos-vision": {
|
||||
"description": "Mô hình này phù hợp với các kịch bản hiểu hình ảnh và văn bản, là mô hình ngôn ngữ thị giác hàng đầu thế hệ mới dựa trên Hunyuan turbos mới nhất, tập trung vào các nhiệm vụ liên quan đến hiểu hình ảnh và văn bản, bao gồm nhận dạng thực thể dựa trên hình ảnh, hỏi đáp kiến thức, sáng tạo nội dung, giải bài tập qua ảnh chụp, với cải tiến toàn diện so với thế hệ trước."
|
||||
},
|
||||
"hunyuan-turbos-vision-20250619": {
|
||||
"description": "Phiên bản mới nhất của Hunyuan turbos-vision là mô hình ngôn ngữ thị giác hàng đầu, cải thiện toàn diện so với phiên bản mặc định thế hệ trước trong các nhiệm vụ liên quan đến hiểu hình ảnh và văn bản, bao gồm nhận dạng thực thể dựa trên hình ảnh, hỏi đáp kiến thức, sáng tạo nội dung, giải bài tập qua ảnh chụp."
|
||||
},
|
||||
"hunyuan-vision": {
|
||||
"description": "Mô hình đa phương thức mới nhất của Hunyuan, hỗ trợ đầu vào hình ảnh + văn bản để tạo ra nội dung văn bản."
|
||||
},
|
||||
@@ -1457,6 +1508,9 @@
|
||||
"jina-deepsearch-v1": {
|
||||
"description": "Tìm kiếm sâu kết hợp tìm kiếm trên mạng, đọc và suy luận, có thể thực hiện điều tra toàn diện. Bạn có thể coi nó như một đại lý, nhận nhiệm vụ nghiên cứu của bạn - nó sẽ thực hiện tìm kiếm rộng rãi và qua nhiều lần lặp lại trước khi đưa ra câu trả lời. Quá trình này liên quan đến nghiên cứu liên tục, suy luận và giải quyết vấn đề từ nhiều góc độ. Điều này khác biệt hoàn toàn với việc tạo ra câu trả lời trực tiếp từ dữ liệu đã được huấn luyện trước của các mô hình lớn tiêu chuẩn và các hệ thống RAG truyền thống dựa vào tìm kiếm bề mặt một lần."
|
||||
},
|
||||
"kimi-k2-0711-preview": {
|
||||
"description": "kimi-k2 là mô hình cơ sở kiến trúc MoE với khả năng mã hóa và Agent cực mạnh, tổng số tham số 1T, tham số kích hoạt 32B. Trong các bài kiểm tra hiệu năng chuẩn về suy luận kiến thức chung, lập trình, toán học, Agent và các lĩnh vực chính khác, mô hình K2 vượt trội hơn các mô hình mã nguồn mở phổ biến khác."
|
||||
},
|
||||
"kimi-latest": {
|
||||
"description": "Sản phẩm trợ lý thông minh Kimi sử dụng mô hình lớn Kimi mới nhất, có thể chứa các tính năng chưa ổn định. Hỗ trợ hiểu hình ảnh, đồng thời tự động chọn mô hình 8k/32k/128k làm mô hình tính phí dựa trên độ dài ngữ cảnh yêu cầu."
|
||||
},
|
||||
@@ -1881,7 +1935,7 @@
|
||||
"description": "o3-mini là mô hình suy diễn nhỏ gọn mới nhất của chúng tôi, cung cấp trí thông minh cao với chi phí và độ trễ tương tự như o1-mini."
|
||||
},
|
||||
"o3-pro": {
|
||||
"description": "Mô hình o3-pro sử dụng nhiều tài nguyên tính toán hơn để suy nghĩ sâu hơn và luôn cung cấp câu trả lời tốt hơn, chỉ hỗ trợ sử dụng dưới API Responses."
|
||||
"description": "Mô hình o3-pro sử dụng nhiều tài nguyên tính toán hơn để suy nghĩ sâu sắc hơn và luôn cung cấp câu trả lời tốt hơn, chỉ hỗ trợ sử dụng dưới API Responses."
|
||||
},
|
||||
"o4-mini": {
|
||||
"description": "o4-mini là mô hình nhỏ gọn mới nhất trong dòng o của chúng tôi. Nó được tối ưu hóa cho suy luận nhanh chóng và hiệu quả, thể hiện hiệu suất và hiệu quả cao trong các nhiệm vụ mã hóa và hình ảnh."
|
||||
@@ -2349,7 +2403,7 @@
|
||||
"description": "Mô hình v0-1.5-md phù hợp cho các nhiệm vụ hàng ngày và tạo giao diện người dùng (UI)"
|
||||
},
|
||||
"whisper-1": {
|
||||
"description": "Mô hình nhận diện giọng nói đa năng, hỗ trợ nhận diện giọng nói đa ngôn ngữ, dịch giọng nói và nhận diện ngôn ngữ."
|
||||
"description": "Mô hình nhận dạng giọng nói đa năng, hỗ trợ nhận dạng giọng nói đa ngôn ngữ, dịch giọng nói và nhận diện ngôn ngữ."
|
||||
},
|
||||
"wizardlm2": {
|
||||
"description": "WizardLM 2 là mô hình ngôn ngữ do Microsoft AI cung cấp, đặc biệt xuất sắc trong các lĩnh vực đối thoại phức tạp, đa ngôn ngữ, suy luận và trợ lý thông minh."
|
||||
|
||||
@@ -520,6 +520,7 @@
|
||||
"hotkey": "Phím tắt",
|
||||
"llm": "Mô hình ngôn ngữ",
|
||||
"provider": "Nhà cung cấp AI",
|
||||
"proxy": "Mạng proxy",
|
||||
"storage": "Lưu trữ dữ liệu",
|
||||
"sync": "Đồng bộ trên đám mây",
|
||||
"system-agent": "Trợ lý hệ thống",
|
||||
|
||||
@@ -46,6 +46,9 @@
|
||||
"reasoningEffort": {
|
||||
"title": "推理强度"
|
||||
},
|
||||
"thinking": {
|
||||
"title": "深度思考开关"
|
||||
},
|
||||
"title": "模型扩展功能"
|
||||
},
|
||||
"history": {
|
||||
|
||||
@@ -1,4 +1,43 @@
|
||||
{
|
||||
"proxy": {
|
||||
"auth": "需要认证",
|
||||
"authDesc": "如果代理服务器需要用户名和密码",
|
||||
"authSettings": "认证设置",
|
||||
"basicSettings": "代理设置",
|
||||
"basicSettingsDesc": "配置代理服务器的连接参数",
|
||||
"bypass": "不使用代理的地址",
|
||||
"connectionTest": "连接测试",
|
||||
"enable": "启用代理",
|
||||
"enableDesc": "开启后将通过代理服务器访问网络",
|
||||
"password": "密码",
|
||||
"password_placeholder": "请输入密码",
|
||||
"port": "端口",
|
||||
"resetButton": "重置",
|
||||
"saveButton": "保存",
|
||||
"saveFailed": "保存失败:{{error}}",
|
||||
"saveSuccess": "代理设置保存成功",
|
||||
"server": "服务器地址",
|
||||
"testButton": "测试连接",
|
||||
"testDescription": "使用当前代理配置测试连接,验证配置是否正常工作",
|
||||
"testFailed": "连接失败",
|
||||
"testSuccessWithTime": "测试连接成功,耗时 {{time}} ms",
|
||||
"testUrl": "测试地址",
|
||||
"testUrlPlaceholder": "请输入要测试的 URL",
|
||||
"testing": "正在测试连接...",
|
||||
"type": "代理类型",
|
||||
"unsavedChanges": "您有未保存的更改",
|
||||
"username": "用户名",
|
||||
"username_placeholder": "请输入用户名",
|
||||
"validation": {
|
||||
"passwordRequired": "启用认证时密码为必填项",
|
||||
"portInvalid": "端口必须是 1 到 65535 之间的数字",
|
||||
"portRequired": "启用代理时端口为必填项",
|
||||
"serverInvalid": "请输入有效的服务器地址(IP 或域名)",
|
||||
"serverRequired": "启用代理时服务器地址为必填项",
|
||||
"typeRequired": "启用代理时代理类型为必填项",
|
||||
"usernameRequired": "启用认证时用户名为必填项"
|
||||
}
|
||||
},
|
||||
"remoteServer": {
|
||||
"authError": "授权失败: {{error}}",
|
||||
"authPending": "请在浏览器中完成授权",
|
||||
|
||||
+92
-38
@@ -71,44 +71,23 @@
|
||||
"DeepSeek-V3": {
|
||||
"description": "DeepSeek-V3 是一款由深度求索公司自研的MoE模型。DeepSeek-V3 多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型,并在性能上和世界顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。"
|
||||
},
|
||||
"Doubao-1.5-thinking-pro-m": {
|
||||
"description": "Doubao-1.5全新深度思考模型 (m 版本自带原生多模态深度推理能力),在数学、编程、科学推理等专业领域及创意写作等通用任务中表现突出,在AIME 2024、Codeforces、GPQA等多项权威基准上达到或接近业界第一梯队水平。支持128k上下文窗口,16k输出。"
|
||||
},
|
||||
"Doubao-1.5-thinking-vision-pro": {
|
||||
"description": "全新视觉深度思考模型,具备更强的通用多模态理解和推理能力,在 59 个公开评测基准中的 37 个上取得 SOTA 表现。"
|
||||
},
|
||||
"Doubao-1.5-vision-pro": {
|
||||
"description": "Doubao-1.5-vision-pro 全新升级的多模态大模型,支持任意分辨率和极端长宽比图像识别,增强视觉推理、文档识别、细节信息理解和指令遵循能力。"
|
||||
},
|
||||
"Doubao-1.5-vision-pro-32k": {
|
||||
"description": "Doubao-1.5-vision-pro 全新升级的多模态大模型,支持任意分辨率和极端长宽比图像识别,增强视觉推理、文档识别、细节信息理解和指令遵循能力。"
|
||||
},
|
||||
"Doubao-lite-128k": {
|
||||
"description": "拥有极致的响应速度,更好的性价比,为客户不同场景提供更灵活的选择。支持 128k 上下文窗口的推理和精调。"
|
||||
"description": "Doubao-lite 拥有极致的响应速度,更好的性价比,为客户不同场景提供更灵活的选择。支持128k上下文窗口的推理和精调。"
|
||||
},
|
||||
"Doubao-lite-32k": {
|
||||
"description": "拥有极致的响应速度,更好的性价比,为客户不同场景提供更灵活的选择。支持 32k 上下文窗口的推理和精调。"
|
||||
"description": "Doubao-lite拥有极致的响应速度,更好的性价比,为客户不同场景提供更灵活的选择。支持32k上下文窗口的推理和精调。"
|
||||
},
|
||||
"Doubao-lite-4k": {
|
||||
"description": "拥有极致的响应速度,更好的性价比,为客户不同场景提供更灵活的选择。支持 4k 上下文窗口的推理和精调。"
|
||||
"description": "Doubao-lite拥有极致的响应速度,更好的性价比,为客户不同场景提供更灵活的选择。支持4k上下文窗口的推理和精调。"
|
||||
},
|
||||
"Doubao-pro-128k": {
|
||||
"description": "效果最好的主力模型,适合处理复杂任务,在参考问答、总结摘要、创作、文本分类、角色扮演等场景都有很好的效果。支持 128k 上下文窗口的推理和精调。"
|
||||
},
|
||||
"Doubao-pro-256k": {
|
||||
"description": "效果最好的主力模型,适合处理复杂任务,在参考问答、总结摘要、创作、文本分类、角色扮演等场景都有很好的效果。支持 256k 上下文窗口的推理和精调。"
|
||||
"description": "效果最好的主力模型,适合处理复杂任务,在参考问答、总结摘要、创作、文本分类、角色扮演等场景都有很好的效果。支持128k上下文窗口的推理和精调。"
|
||||
},
|
||||
"Doubao-pro-32k": {
|
||||
"description": "效果最好的主力模型,适合处理复杂任务,在参考问答、总结摘要、创作、文本分类、角色扮演等场景都有很好的效果。支持 32k 上下文窗口的推理和精调。"
|
||||
"description": "效果最好的主力模型,适合处理复杂任务,在参考问答、总结摘要、创作、文本分类、角色扮演等场景都有很好的效果。支持32k上下文窗口的推理和精调。"
|
||||
},
|
||||
"Doubao-pro-4k": {
|
||||
"description": "效果最好的主力模型,适合处理复杂任务,在参考问答、总结摘要、创作、文本分类、角色扮演等场景都有很好的效果。支持 4k 上下文窗口的推理和精调。"
|
||||
},
|
||||
"Doubao-vision-lite-32k": {
|
||||
"description": "Doubao-vision 模型是豆包推出的多模态大模型,具备强大的图片理解与推理能力,以及精准的指令理解能力。模型在图像文本信息抽取、基于图像的推理任务上有展现出了强大的性能,能够应用于更复杂、更广泛的视觉问答任务。"
|
||||
},
|
||||
"Doubao-vision-pro-32k": {
|
||||
"description": "Doubao-vision 模型是豆包推出的多模态大模型,具备强大的图片理解与推理能力,以及精准的指令理解能力。模型在图像文本信息抽取、基于图像的推理任务上有展现出了强大的性能,能够应用于更复杂、更广泛的视觉问答任务。"
|
||||
"description": "效果最好的主力模型,适合处理复杂任务,在参考问答、总结摘要、创作、文本分类、角色扮演等场景都有很好的效果。支持4k上下文窗口的推理和精调。"
|
||||
},
|
||||
"ERNIE-3.5-128K": {
|
||||
"description": "百度自研的旗舰级大规模⼤语⾔模型,覆盖海量中英文语料,具有强大的通用能力,可满足绝大部分对话问答、创作生成、插件应用场景要求;支持自动对接百度搜索插件,保障问答信息时效。"
|
||||
@@ -224,24 +203,21 @@
|
||||
"Pro/Qwen/Qwen2.5-VL-7B-Instruct": {
|
||||
"description": "Qwen2.5-VL 是 Qwen 系列的新成员,具备强大的视觉理解能力,能分析图像中的文本、图表和布局,并能理解长视频和捕捉事件,它可以进行推理、操作工具,支持多格式物体定位和生成结构化输出,优化了视频理解的动态分辨率与帧率训练,并提升了视觉编码器效率。"
|
||||
},
|
||||
"Pro/THUDM/GLM-4.1V-9B-Thinking": {
|
||||
"description": "GLM-4.1V-9B-Thinking 是由智谱 AI 和清华大学 KEG 实验室联合发布的一款开源视觉语言模型(VLM),专为处理复杂的多模态认知任务而设计。该模型基于 GLM-4-9B-0414 基础模型,通过引入“思维链”(Chain-of-Thought)推理机制和采用强化学习策略,显著提升了其跨模态的推理能力和稳定性。"
|
||||
},
|
||||
"Pro/THUDM/glm-4-9b-chat": {
|
||||
"description": "GLM-4-9B-Chat 是智谱 AI 推出的 GLM-4 系列预训练模型中的开源版本。该模型在语义、数学、推理、代码和知识等多个方面表现出色。除了支持多轮对话外,GLM-4-9B-Chat 还具备网页浏览、代码执行、自定义工具调用(Function Call)和长文本推理等高级功能。模型支持 26 种语言,包括中文、英文、日语、韩语和德语等。在多项基准测试中,GLM-4-9B-Chat 展现了优秀的性能,如 AlignBench-v2、MT-Bench、MMLU 和 C-Eval 等。该模型支持最大 128K 的上下文长度,适用于学术研究和商业应用"
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1": {
|
||||
"description": "DeepSeek-R1 是一款强化学习(RL)驱动的推理模型,解决了模型中的重复性和可读性问题。在 RL 之前,DeepSeek-R1 引入了冷启动数据,进一步优化了推理性能。它在数学、代码和推理任务中与 OpenAI-o1 表现相当,并且通过精心设计的训练方法,提升了整体效果。"
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1-0120": {
|
||||
"description": "DeepSeek-R1 是一款强化学习(RL)驱动的推理模型,解决了模型中的重复性和可读性问题。在 RL 之前,DeepSeek-R1 引入了冷启动数据,进一步优化了推理性能。它在数学、代码和推理任务中与 OpenAI-o1 表现相当,并且通过精心设计的训练方法,提升了整体效果。"
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B": {
|
||||
"description": "DeepSeek-R1-Distill-Qwen-7B 是基于 Qwen2.5-Math-7B 通过知识蒸馏得到的模型。该模型使用 DeepSeek-R1 生成的 80 万个精选样本进行微调,展现出优秀的推理能力。在多个基准测试中表现出色,其中在 MATH-500 上达到了 92.8% 的准确率,在 AIME 2024 上达到了 55.5% 的通过率,在 CodeForces 上获得了 1189 的评分,作为 7B 规模的模型展示了较强的数学和编程能力。"
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-V3": {
|
||||
"description": "DeepSeek-V3 是一款拥有 6710 亿参数的混合专家(MoE)语言模型,采用多头潜在注意力(MLA)和 DeepSeekMoE 架构,结合无辅助损失的负载平衡策略,优化推理和训练效率。通过在 14.8 万亿高质量tokens上预训练,并进行监督微调和强化学习,DeepSeek-V3 在性能上超越其他开源模型,接近领先闭源模型。"
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-V3-1226": {
|
||||
"description": "DeepSeek-V3 是一款拥有 6710 亿参数的混合专家(MoE)语言模型,采用多头潜在注意力(MLA)和 DeepSeekMoE 架构,结合无辅助损失的负载平衡策略,优化推理和训练效率。通过在 14.8 万亿高质量tokens上预训练,并进行监督微调和强化学习,DeepSeek-V3 在性能上超越其他开源模型,接近领先闭源模型。"
|
||||
},
|
||||
"QwQ-32B-Preview": {
|
||||
"description": "Qwen QwQ 是由 Qwen 团队开发的实验研究模型,专注于提升AI推理能力。"
|
||||
},
|
||||
@@ -404,6 +380,9 @@
|
||||
"THUDM/GLM-4-9B-0414": {
|
||||
"description": "GLM-4-9B-0414 是 GLM 系列的小型模型,拥有 90 亿参数。该模型继承了 GLM-4-32B 系列的技术特点,但提供了更轻量级的部署选择。尽管规模较小,GLM-4-9B-0414 仍在代码生成、网页设计、SVG 图形生成和基于搜索的写作等任务上展现出色能力。"
|
||||
},
|
||||
"THUDM/GLM-4.1V-9B-Thinking": {
|
||||
"description": "GLM-4.1V-9B-Thinking 是由智谱 AI 和清华大学 KEG 实验室联合发布的一款开源视觉语言模型(VLM),专为处理复杂的多模态认知任务而设计。该模型基于 GLM-4-9B-0414 基础模型,通过引入“思维链”(Chain-of-Thought)推理机制和采用强化学习策略,显著提升了其跨模态的推理能力和稳定性。"
|
||||
},
|
||||
"THUDM/GLM-Z1-32B-0414": {
|
||||
"description": "GLM-Z1-32B-0414 是一个具有深度思考能力的推理模型。该模型基于 GLM-4-32B-0414 通过冷启动和扩展强化学习开发,并在数学、代码和逻辑任务上进行了进一步训练。与基础模型相比,GLM-Z1-32B-0414 显著提升了数学能力和解决复杂任务的能力。"
|
||||
},
|
||||
@@ -560,6 +539,9 @@
|
||||
"anthropic/claude-sonnet-4": {
|
||||
"description": "Claude Sonnet 4 可以产生近乎即时的响应或延长的逐步思考,用户可以清晰地看到这些过程。API 用户还可以对模型思考的时间进行细致的控制"
|
||||
},
|
||||
"ascend-tribe/pangu-pro-moe": {
|
||||
"description": "Pangu-Pro-MoE 72B-A16B 是一款 720 亿参数、激活 160 亿参的稀疏大语言模型,它基于分组混合专家(MoGE)架构,它在专家选择阶段对专家进行分组,并约束 token 在每个组内激活等量专家,从而实现专家负载均衡,显著提升模型在昇腾平台的部署效率。"
|
||||
},
|
||||
"aya": {
|
||||
"description": "Aya 23 是 Cohere 推出的多语言模型,支持 23 种语言,为多元化语言应用提供便利。"
|
||||
},
|
||||
@@ -569,6 +551,9 @@
|
||||
"baichuan/baichuan2-13b-chat": {
|
||||
"description": "Baichuan-13B 百川智能开发的包含 130 亿参数的开源可商用的大规模语言模型,在权威的中文和英文 benchmark 上均取得同尺寸最好的效果"
|
||||
},
|
||||
"baidu/ERNIE-4.5-300B-A47B": {
|
||||
"description": "ERNIE-4.5-300B-A47B 是由百度公司开发的一款基于混合专家(MoE)架构的大语言模型。该模型总参数量为 3000 亿,但在推理时每个 token 仅激活 470 亿参数,从而在保证强大性能的同时兼顾了计算效率。作为 ERNIE 4.5 系列的核心模型之一,在文本理解、生成、推理和编程等任务上展现出卓越的能力。该模型采用了一种创新的多模态异构 MoE 预训练方法,通过文本与视觉模态的联合训练,有效提升了模型的综合能力,尤其在指令遵循和世界知识记忆方面效果突出。"
|
||||
},
|
||||
"c4ai-aya-expanse-32b": {
|
||||
"description": "Aya Expanse 是一款高性能的 32B 多语言模型,旨在通过指令调优、数据套利、偏好训练和模型合并的创新,挑战单语言模型的表现。它支持 23 种语言。"
|
||||
},
|
||||
@@ -914,9 +899,39 @@
|
||||
"doubao-1.5-thinking-pro": {
|
||||
"description": "Doubao-1.5全新深度思考模型,在数学、编程、科学推理等专业领域及创意写作等通用任务中表现突出,在AIME 2024、Codeforces、GPQA等多项权威基准上达到或接近业界第一梯队水平。支持128k上下文窗口,16k输出。"
|
||||
},
|
||||
"doubao-1.5-thinking-pro-m": {
|
||||
"description": "Doubao-1.5全新深度思考模型 (m 版本自带原生多模态深度推理能力),在数学、编程、科学推理等专业领域及创意写作等通用任务中表现突出,在AIME 2024、Codeforces、GPQA等多项权威基准上达到或接近业界第一梯队水平。支持128k上下文窗口,16k输出。"
|
||||
},
|
||||
"doubao-1.5-thinking-vision-pro": {
|
||||
"description": "全新视觉深度思考模型,具备更强的通用多模态理解和推理能力,在 59 个公开评测基准中的 37 个上取得 SOTA 表现。"
|
||||
},
|
||||
"doubao-1.5-ui-tars": {
|
||||
"description": "Doubao-1.5-UI-TARS 是一款原生面向图形界面交互(GUI)的Agent模型。通过感知、推理和行动等类人的能力,与 GUI 进行无缝交互。"
|
||||
},
|
||||
"doubao-1.5-vision-lite": {
|
||||
"description": "Doubao-1.5-vision-lite 全新升级的多模态大模型,支持任意分辨率和极端长宽比图像识别,增强视觉推理、文档识别、细节信息理解和指令遵循能力。支持 128k 上下文窗口,输出长度支持最大 16k tokens。"
|
||||
},
|
||||
"doubao-1.5-vision-pro": {
|
||||
"description": "Doubao-1.5-vision-pro 全新升级的多模态大模型,支持任意分辨率和极端长宽比图像识别,增强视觉推理、文档识别、细节信息理解和指令遵循能力。"
|
||||
},
|
||||
"doubao-1.5-vision-pro-32k": {
|
||||
"description": "Doubao-1.5-vision-pro 全新升级的多模态大模型,支持任意分辨率和极端长宽比图像识别,增强视觉推理、文档识别、细节信息理解和指令遵循能力。"
|
||||
},
|
||||
"doubao-lite-128k": {
|
||||
"description": "拥有极致的响应速度,更好的性价比,为客户不同场景提供更灵活的选择。支持 128k 上下文窗口的推理和精调。"
|
||||
},
|
||||
"doubao-lite-32k": {
|
||||
"description": "拥有极致的响应速度,更好的性价比,为客户不同场景提供更灵活的选择。支持 32k 上下文窗口的推理和精调。"
|
||||
},
|
||||
"doubao-lite-4k": {
|
||||
"description": "拥有极致的响应速度,更好的性价比,为客户不同场景提供更灵活的选择。支持 4k 上下文窗口的推理和精调。"
|
||||
},
|
||||
"doubao-pro-256k": {
|
||||
"description": "效果最好的主力模型,适合处理复杂任务,在参考问答、总结摘要、创作、文本分类、角色扮演等场景都有很好的效果。支持 256k 上下文窗口的推理和精调。"
|
||||
},
|
||||
"doubao-pro-32k": {
|
||||
"description": "效果最好的主力模型,适合处理复杂任务,在参考问答、总结摘要、创作、文本分类、角色扮演等场景都有很好的效果。支持 32k 上下文窗口的推理和精调。"
|
||||
},
|
||||
"doubao-seed-1.6": {
|
||||
"description": "Doubao-Seed-1.6全新多模态深度思考模型,同时支持auto/thinking/non-thinking三种思考模式。 non-thinking模式下,模型效果对比Doubao-1.5-pro/250115大幅提升。支持 256k 上下文窗口,输出长度支持最大 16k tokens。"
|
||||
},
|
||||
@@ -926,6 +941,12 @@
|
||||
"doubao-seed-1.6-thinking": {
|
||||
"description": "Doubao-Seed-1.6-thinking模型思考能力大幅强化, 对比Doubao-1.5-thinking-pro,在Coding、Math、 逻辑推理等基础能力上进一步提升, 支持视觉理解。 支持 256k 上下文窗口,输出长度支持最大 16k tokens。"
|
||||
},
|
||||
"doubao-vision-lite-32k": {
|
||||
"description": "Doubao-vision 模型是豆包推出的多模态大模型,具备强大的图片理解与推理能力,以及精准的指令理解能力。模型在图像文本信息抽取、基于图像的推理任务上有展现出了强大的性能,能够应用于更复杂、更广泛的视觉问答任务。"
|
||||
},
|
||||
"doubao-vision-pro-32k": {
|
||||
"description": "Doubao-vision 模型是豆包推出的多模态大模型,具备强大的图片理解与推理能力,以及精准的指令理解能力。模型在图像文本信息抽取、基于图像的推理任务上有展现出了强大的性能,能够应用于更复杂、更广泛的视觉问答任务。"
|
||||
},
|
||||
"emohaa": {
|
||||
"description": "Emohaa 是心理模型,具备专业咨询能力,帮助用户理解情感问题。"
|
||||
},
|
||||
@@ -1082,9 +1103,6 @@
|
||||
"gemini-2.5-pro": {
|
||||
"description": "Gemini 2.5 Pro 是 Google 最先进的思维模型,能够对代码、数学和STEM领域的复杂问题进行推理,以及使用长上下文分析大型数据集、代码库和文档。"
|
||||
},
|
||||
"gemini-2.5-pro-exp-03-25": {
|
||||
"description": "Gemini 2.5 Pro Experimental 是 Google 最先进的思维模型,能够对代码、数学和STEM领域的复杂问题进行推理,以及使用长上下文分析大型数据集、代码库和文档。"
|
||||
},
|
||||
"gemini-2.5-pro-preview-03-25": {
|
||||
"description": "Gemini 2.5 Pro Preview 是 Google 最先进的思维模型,能够对代码、数学和STEM领域的复杂问题进行推理,以及使用长上下文分析大型数据集、代码库和文档。"
|
||||
},
|
||||
@@ -1151,6 +1169,12 @@
|
||||
"glm-4-plus": {
|
||||
"description": "GLM-4-Plus 作为高智能旗舰,具备强大的处理长文本和复杂任务的能力,性能全面提升。"
|
||||
},
|
||||
"glm-4.1v-thinking-flash": {
|
||||
"description": "GLM-4.1V-Thinking 系列模型是目前已知10B级别的VLM模型中性能最强的视觉模型,融合了同级别SOTA的各项视觉语言任务,包括视频理解、图片问答、学科解题、OCR文字识别、文档和图表解读、GUI Agent、前端网页Coding、Grounding等,多项任务能力甚至超过8倍参数量的Qwen2.5-VL-72B。通过领先的强化学习技术,模型掌握了通过思维链推理的方式提升回答的准确性和丰富度,从最终效果和可解释性等维度都显著超过传统的非thinking模型。"
|
||||
},
|
||||
"glm-4.1v-thinking-flashx": {
|
||||
"description": "GLM-4.1V-Thinking 系列模型是目前已知10B级别的VLM模型中性能最强的视觉模型,融合了同级别SOTA的各项视觉语言任务,包括视频理解、图片问答、学科解题、OCR文字识别、文档和图表解读、GUI Agent、前端网页Coding、Grounding等,多项任务能力甚至超过8倍参数量的Qwen2.5-VL-72B。通过领先的强化学习技术,模型掌握了通过思维链推理的方式提升回答的准确性和丰富度,从最终效果和可解释性等维度都显著超过传统的非thinking模型。"
|
||||
},
|
||||
"glm-4v": {
|
||||
"description": "GLM-4V 提供强大的图像理解与推理能力,支持多种视觉任务。"
|
||||
},
|
||||
@@ -1172,6 +1196,9 @@
|
||||
"glm-z1-flash": {
|
||||
"description": "GLM-Z1 系列具备强大的复杂推理能力,在逻辑推理、数学、编程等领域表现优异。最大上下文长度为32K。"
|
||||
},
|
||||
"glm-z1-flashx": {
|
||||
"description": "高速低价:Flash增强版本,超快推理速度,更快并发保障。"
|
||||
},
|
||||
"glm-zero-preview": {
|
||||
"description": "GLM-Zero-Preview具备强大的复杂推理能力,在逻辑推理、数学、编程等领域表现优异。"
|
||||
},
|
||||
@@ -1223,6 +1250,9 @@
|
||||
"google/gemma-2b-it": {
|
||||
"description": "Gemma Instruct (2B) 提供基本的指令处理能力,适合轻量级应用。"
|
||||
},
|
||||
"google/gemma-3-1b-it": {
|
||||
"description": "Gemma 3 1B 是谷歌的一款开源语言模型,以其在效率和性能方面设立了新的标准。"
|
||||
},
|
||||
"google/gemma-3-27b-it": {
|
||||
"description": "Gemma 3 27B 是谷歌的一款开源语言模型,以其在效率和性能方面设立了新的标准。"
|
||||
},
|
||||
@@ -1313,6 +1343,9 @@
|
||||
"gpt-4o-mini-search-preview": {
|
||||
"description": "GPT-4o mini 搜索预览版是一个专门训练用于理解和执行网页搜索查询的模型,使用的是 Chat Completions API。除了令牌费用之外,网页搜索查询还会按每次工具调用收取费用。"
|
||||
},
|
||||
"gpt-4o-mini-transcribe": {
|
||||
"description": "GPT-4o Mini Transcribe 是一种使用 GPT-4o 转录音频的语音转文本模型。与原始 Whisper 模型相比,它提高了单词错误率,并提高了语言识别和准确性。使用它来获得更准确的转录。"
|
||||
},
|
||||
"gpt-4o-mini-tts": {
|
||||
"description": "GPT-4o mini TTS 是一个基于 GPT-4o mini 构建的文本转语音模型,这是一种快速且强大的语言模型。使用它可以将文本转换为自然听起来的语音文本。最大输入标记数为 2000。"
|
||||
},
|
||||
@@ -1322,12 +1355,15 @@
|
||||
"gpt-4o-realtime-preview-2024-10-01": {
|
||||
"description": "GPT-4o 实时版本,支持音频和文本实时输入输出"
|
||||
},
|
||||
"gpt-4o-realtime-preview-2024-12-17": {
|
||||
"gpt-4o-realtime-preview-2025-06-03": {
|
||||
"description": "GPT-4o 实时版本,支持音频和文本实时输入输出"
|
||||
},
|
||||
"gpt-4o-search-preview": {
|
||||
"description": "GPT-4o 搜索预览版是一个专门训练用于理解和执行网页搜索查询的模型,使用的是 Chat Completions API。除了令牌费用之外,网页搜索查询还会按每次工具调用收取费用。"
|
||||
},
|
||||
"gpt-4o-transcribe": {
|
||||
"description": "GPT-4o Transcribe 是一种使用 GPT-4o 转录音频的语音转文本模型。与原始 Whisper 模型相比,它提高了单词错误率,并提高了语言识别和准确性。使用它来获得更准确的转录。"
|
||||
},
|
||||
"grok-2-1212": {
|
||||
"description": "该模型在准确性、指令遵循和多语言能力方面有所改进。"
|
||||
},
|
||||
@@ -1346,9 +1382,15 @@
|
||||
"grok-3-mini-fast": {
|
||||
"description": "轻量级模型,回话前会先思考。运行快速、智能,适用于不需要深层领域知识的逻辑任务,并能获取原始的思维轨迹。"
|
||||
},
|
||||
"grok-4": {
|
||||
"description": "我们最新最强大的旗舰模型,在自然语言处理、数学计算和推理方面表现卓越 —— 是一款完美的全能型选手。"
|
||||
},
|
||||
"gryphe/mythomax-l2-13b": {
|
||||
"description": "MythoMax l2 13B 是一款合并了多个顶尖模型的创意与智能相结合的语言模型。"
|
||||
},
|
||||
"hunyuan-a13b": {
|
||||
"description": "混元第一个混合推理模型,hunyuan-standard-256K 的升级版本,总参数80B,激活13B,默认是慢思考模式,支持通过参数或者指令进行快慢思考模式切换,慢快思考切换方式为 query 前加/ no_think;整体能力相对上一代全面提升,特别数学、科学、长文理解和 Agent 能力提升显著。"
|
||||
},
|
||||
"hunyuan-code": {
|
||||
"description": "混元最新代码生成模型,经过 200B 高质量代码数据增训基座模型,迭代半年高质量 SFT 数据训练,上下文长窗口长度增大到 8K,五大语言代码生成自动评测指标上位居前列;五大语言10项考量各方面综合代码任务人工高质量评测上,性能处于第一梯队"
|
||||
},
|
||||
@@ -1400,6 +1442,9 @@
|
||||
"hunyuan-t1-vision": {
|
||||
"description": "混元多模态理解深度思考模型,支持多模态原生长思维链,擅长处理各种图片推理场景,在理科难题上相比快思考模型全面提升。"
|
||||
},
|
||||
"hunyuan-t1-vision-20250619": {
|
||||
"description": "混元最新版t1-vision多模态理解深度思考模型,支持多模态原生长思维链,相比上一代默认版本模型全面提升。"
|
||||
},
|
||||
"hunyuan-turbo": {
|
||||
"description": "混元全新一代大语言模型的预览版,采用全新的混合专家模型(MoE)结构,相比hunyuan-pro推理效率更快,效果表现更强。"
|
||||
},
|
||||
@@ -1430,6 +1475,12 @@
|
||||
"hunyuan-turbos-role-plus": {
|
||||
"description": "混元最新版角色扮演模型,混元官方精调训练推出的角色扮演模型,基于混元模型结合角色扮演场景数据集进行增训,在角色扮演场景具有更好的基础效果。"
|
||||
},
|
||||
"hunyuan-turbos-vision": {
|
||||
"description": "此模型适用于图文理解场景,是基于混元最新 turbos 的新一代视觉语言旗舰大模型,聚焦图文理解相关任务,包括基于图片的实体识别、知识问答、文案创作、拍照解题等方面,相比前一代模型全面提升。"
|
||||
},
|
||||
"hunyuan-turbos-vision-20250619": {
|
||||
"description": "混元最新版turbos-vision视觉语言旗舰大模型,在图文理解相关的任务上,包括基于图片的实体识别、知识问答、文案创作、拍照解题等上面相比上一代默认版本模型全面提升。"
|
||||
},
|
||||
"hunyuan-vision": {
|
||||
"description": "混元最新多模态模型,支持图片+文本输入生成文本内容。"
|
||||
},
|
||||
@@ -1457,6 +1508,9 @@
|
||||
"jina-deepsearch-v1": {
|
||||
"description": "深度搜索结合了网络搜索、阅读和推理,可进行全面调查。您可以将其视为一个代理,接受您的研究任务 - 它会进行广泛搜索并经过多次迭代,然后才能给出答案。这个过程涉及持续的研究、推理和从各个角度解决问题。这与直接从预训练数据生成答案的标准大模型以及依赖一次性表面搜索的传统 RAG 系统有着根本的不同。"
|
||||
},
|
||||
"kimi-k2-0711-preview": {
|
||||
"description": "kimi-k2 是一款具备超强代码和 Agent 能力的 MoE 架构基础模型,总参数 1T,激活参数 32B。在通用知识推理、编程、数学、Agent 等主要类别的基准性能测试中,K2 模型的性能超过其他主流开源模型。"
|
||||
},
|
||||
"kimi-latest": {
|
||||
"description": "Kimi 智能助手产品使用最新的 Kimi 大模型,可能包含尚未稳定的特性。支持图片理解,同时会自动根据请求的上下文长度选择 8k/32k/128k 模型作为计费模型"
|
||||
},
|
||||
@@ -2349,7 +2403,7 @@
|
||||
"description": "v0-1.5-md 模型适用于日常任务和用户界面(UI)生成"
|
||||
},
|
||||
"whisper-1": {
|
||||
"description": "通用语音识别模型,支持多语言语音识别、语音翻译和语言识别"
|
||||
"description": "通用语音识别模型,支持多语言语音识别、语音翻译和语言识别。"
|
||||
},
|
||||
"wizardlm2": {
|
||||
"description": "WizardLM 2 是微软AI提供的语言模型,在复杂对话、多语言、推理和智能助手领域表现尤为出色。"
|
||||
|
||||
@@ -520,6 +520,7 @@
|
||||
"hotkey": "快捷键",
|
||||
"llm": "语言模型",
|
||||
"provider": "AI 服务商",
|
||||
"proxy": "网络代理",
|
||||
"storage": "数据存储",
|
||||
"sync": "云端同步",
|
||||
"system-agent": "系统助手",
|
||||
|
||||
@@ -46,6 +46,9 @@
|
||||
"reasoningEffort": {
|
||||
"title": "推理強度"
|
||||
},
|
||||
"thinking": {
|
||||
"title": "深度思考開關"
|
||||
},
|
||||
"title": "模型擴展功能"
|
||||
},
|
||||
"history": {
|
||||
|
||||
@@ -1,4 +1,43 @@
|
||||
{
|
||||
"proxy": {
|
||||
"auth": "需要認證",
|
||||
"authDesc": "如果代理伺服器需要使用者名稱和密碼",
|
||||
"authSettings": "認證設定",
|
||||
"basicSettings": "代理設定",
|
||||
"basicSettingsDesc": "配置代理伺服器的連線參數",
|
||||
"bypass": "不使用代理的地址",
|
||||
"connectionTest": "連線測試",
|
||||
"enable": "啟用代理",
|
||||
"enableDesc": "開啟後將透過代理伺服器存取網路",
|
||||
"password": "密碼",
|
||||
"password_placeholder": "請輸入密碼",
|
||||
"port": "埠號",
|
||||
"resetButton": "重設",
|
||||
"saveButton": "儲存",
|
||||
"saveFailed": "儲存失敗:{{error}}",
|
||||
"saveSuccess": "代理設定儲存成功",
|
||||
"server": "伺服器地址",
|
||||
"testButton": "測試連接",
|
||||
"testDescription": "使用目前代理設定測試連線,驗證設定是否正常運作",
|
||||
"testFailed": "連線失敗",
|
||||
"testSuccessWithTime": "測試連線成功,耗時 {{time}} 毫秒",
|
||||
"testUrl": "測試地址",
|
||||
"testUrlPlaceholder": "請輸入要測試的 URL",
|
||||
"testing": "正在測試連接...",
|
||||
"type": "代理類型",
|
||||
"unsavedChanges": "您有未儲存的變更",
|
||||
"username": "使用者名稱",
|
||||
"username_placeholder": "請輸入使用者名稱",
|
||||
"validation": {
|
||||
"passwordRequired": "啟用認證時密碼為必填項",
|
||||
"portInvalid": "連接埠必須是 1 到 65535 之間的數字",
|
||||
"portRequired": "啟用代理時連接埠為必填項",
|
||||
"serverInvalid": "請輸入有效的伺服器位址(IP 或網域名稱)",
|
||||
"serverRequired": "啟用代理時伺服器位址為必填項",
|
||||
"typeRequired": "啟用代理時代理類型為必填項",
|
||||
"usernameRequired": "啟用認證時使用者名稱為必填項"
|
||||
}
|
||||
},
|
||||
"remoteServer": {
|
||||
"authError": "授權失敗: {{error}}",
|
||||
"authPending": "請在瀏覽器中完成授權",
|
||||
|
||||
+93
-39
@@ -71,44 +71,23 @@
|
||||
"DeepSeek-V3": {
|
||||
"description": "DeepSeek-V3 是一款由深度求索公司自研的MoE模型。DeepSeek-V3 多項評測成績超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他開源模型,並在性能上和世界頂尖的閉源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。"
|
||||
},
|
||||
"Doubao-1.5-thinking-pro-m": {
|
||||
"description": "Doubao-1.5 全新深度思考模型 (m 版本自帶原生多模態深度推理能力),在數學、程式設計、科學推理等專業領域及創意寫作等通用任務中表現突出,在 AIME 2024、Codeforces、GPQA 等多項權威基準上達到或接近業界第一梯隊水平。支持 128k 上下文窗口,16k 輸出。"
|
||||
},
|
||||
"Doubao-1.5-thinking-vision-pro": {
|
||||
"description": "全新視覺深度思考模型,具備更強的通用多模態理解和推理能力,在 59 個公開評測基準中的 37 個上取得 SOTA 表現。"
|
||||
},
|
||||
"Doubao-1.5-vision-pro": {
|
||||
"description": "Doubao-1.5-vision-pro 全新升級的多模態大模型,支持任意解析度和極端長寬比圖像識別,增強視覺推理、文檔識別、細節信息理解和指令遵循能力。"
|
||||
},
|
||||
"Doubao-1.5-vision-pro-32k": {
|
||||
"description": "Doubao-1.5-vision-pro 全新升級的多模態大模型,支持任意解析度和極端長寬比圖像識別,增強視覺推理、文檔識別、細節信息理解和指令遵循能力。"
|
||||
},
|
||||
"Doubao-lite-128k": {
|
||||
"description": "Doubao-lite 擁有極致的回應速度,更好的性價比,為客戶不同場景提供更靈活的選擇。支持 128k 上下文窗口的推理和精調。"
|
||||
"description": "Doubao-lite 擁有極致的響應速度,更好的性價比,為客戶不同場景提供更靈活的選擇。支持128k上下文視窗的推理和精調。"
|
||||
},
|
||||
"Doubao-lite-32k": {
|
||||
"description": "Doubao-lite 擁有極致的回應速度,更好的性價比,為客戶不同場景提供更靈活的選擇。支持 32k 上下文窗口的推理和精調。"
|
||||
"description": "Doubao-lite擁有極致的響應速度,更好的性價比,為客戶不同場景提供更靈活的選擇。支持32k上下文視窗的推理和精調。"
|
||||
},
|
||||
"Doubao-lite-4k": {
|
||||
"description": "Doubao-lite 擁有極致的回應速度,更好的性價比,為客戶不同場景提供更靈活的選擇。支持 4k 上下文窗口的推理和精調。"
|
||||
"description": "Doubao-lite擁有極致的響應速度,更好的性價比,為客戶不同場景提供更靈活的選擇。支持4k上下文視窗的推理和精調。"
|
||||
},
|
||||
"Doubao-pro-128k": {
|
||||
"description": "效果最好的主力模型,適合處理複雜任務,在參考問答、總結摘要、創作、文本分類、角色扮演等場景都有很好的效果。支持 128k 上下文窗口的推理和精調。"
|
||||
},
|
||||
"Doubao-pro-256k": {
|
||||
"description": "效果最好的主力模型,適合處理複雜任務,在參考問答、總結摘要、創作、文本分類、角色扮演等場景都有很好的效果。支持 256k 上下文窗口的推理和精調。"
|
||||
"description": "效果最好的主力模型,適合處理複雜任務,在參考問答、總結摘要、創作、文本分類、角色扮演等場景都有很好的效果。支持128k上下文視窗的推理和精調。"
|
||||
},
|
||||
"Doubao-pro-32k": {
|
||||
"description": "效果最好的主力模型,適合處理複雜任務,在參考問答、總結摘要、創作、文本分類、角色扮演等場景都有很好的效果。支持 32k 上下文窗口的推理和精調。"
|
||||
"description": "效果最好的主力模型,適合處理複雜任務,在參考問答、總結摘要、創作、文本分類、角色扮演等場景都有很好的效果。支持32k上下文視窗的推理和精調。"
|
||||
},
|
||||
"Doubao-pro-4k": {
|
||||
"description": "效果最好的主力模型,適合處理複雜任務,在參考問答、總結摘要、創作、文本分類、角色扮演等場景都有很好的效果。支持 4k 上下文窗口的推理和精調。"
|
||||
},
|
||||
"Doubao-vision-lite-32k": {
|
||||
"description": "Doubao-vision 模型是豆包推出的多模態大模型,具備強大的圖片理解與推理能力,以及精準的指令理解能力。模型在圖像文本信息抽取、基於圖像的推理任務上展現出強大的性能,能夠應用於更複雜、更廣泛的視覺問答任務。"
|
||||
},
|
||||
"Doubao-vision-pro-32k": {
|
||||
"description": "Doubao-vision 模型是豆包推出的多模態大模型,具備強大的圖片理解與推理能力,以及精準的指令理解能力。模型在圖像文本信息抽取、基於圖像的推理任務上展現出強大的性能,能夠應用於更複雜、更廣泛的視覺問答任務。"
|
||||
"description": "效果最好的主力模型,適合處理複雜任務,在參考問答、總結摘要、創作、文本分類、角色扮演等場景都有很好的效果。支持4k上下文視窗的推理和精調。"
|
||||
},
|
||||
"ERNIE-3.5-128K": {
|
||||
"description": "百度自研的旗艦級大規模語言模型,覆蓋海量中英文語料,具有強大的通用能力,可滿足絕大部分對話問答、創作生成、插件應用場景要求;支持自動對接百度搜索插件,保障問答信息時效。"
|
||||
@@ -224,24 +203,21 @@
|
||||
"Pro/Qwen/Qwen2.5-VL-7B-Instruct": {
|
||||
"description": "Qwen2.5-VL 是 Qwen 系列的新成員,具備強大的視覺理解能力,能分析圖像中的文字、圖表和版面配置,並能理解長影片和捕捉事件。它可以進行推理、操作工具,支援多格式物件定位和生成結構化輸出,優化了影片理解的動態解析度與影格率訓練,並提升了視覺編碼器效率。"
|
||||
},
|
||||
"Pro/THUDM/GLM-4.1V-9B-Thinking": {
|
||||
"description": "GLM-4.1V-9B-Thinking 是由智譜 AI 和清華大學 KEG 實驗室聯合發布的一款開源視覺語言模型(VLM),專為處理複雜的多模態認知任務而設計。該模型基於 GLM-4-9B-0414 基礎模型,通過引入「思維鏈」(Chain-of-Thought)推理機制和採用強化學習策略,顯著提升了其跨模態的推理能力和穩定性。"
|
||||
},
|
||||
"Pro/THUDM/glm-4-9b-chat": {
|
||||
"description": "GLM-4-9B-Chat 是智譜 AI 推出的 GLM-4 系列預訓練模型中的開源版本。該模型在語義、數學、推理、代碼和知識等多個方面表現出色。除了支持多輪對話外,GLM-4-9B-Chat 還具備網頁瀏覽、代碼執行、自定義工具調用(Function Call)和長文本推理等高級功能。模型支持 26 種語言,包括中文、英文、日文、韓文和德文等。在多項基準測試中,GLM-4-9B-Chat 展現了優秀的性能,如 AlignBench-v2、MT-Bench、MMLU 和 C-Eval 等。該模型支持最大 128K 的上下文長度,適用於學術研究和商業應用"
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1": {
|
||||
"description": "DeepSeek-R1 是一款強化學習(RL)驅動的推理模型,解決了模型中的重複性和可讀性問題。在 RL 之前,DeepSeek-R1 引入了冷啟動數據,進一步優化了推理性能。它在數學、代碼和推理任務中與 OpenAI-o1 表現相當,並且透過精心設計的訓練方法,提升了整體效果。"
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1-0120": {
|
||||
"description": "DeepSeek-R1 是一款強化學習(RL)驅動的推理模型,解決了模型中的重複性和可讀性問題。在 RL 之前,DeepSeek-R1 引入了冷啟動資料,進一步優化了推理性能。它在數學、程式碼和推理任務中與 OpenAI-o1 表現相當,並且透過精心設計的訓練方法,提升了整體效果。"
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B": {
|
||||
"description": "DeepSeek-R1-Distill-Qwen-7B 是基於 Qwen2.5-Math-7B 透過知識蒸餾技術所獲得的模型。該模型使用 DeepSeek-R1 生成的 80 萬個精選樣本進行微調,展現出優異的推理能力。在多個基準測試中表現出色,其中在 MATH-500 上達到了 92.8% 的準確率,在 AIME 2024 上達到了 55.5% 的通過率,在 CodeForces 上獲得了 1189 的評分,作為 7B 規模的模型展示了較強的數學和程式設計能力。"
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-V3": {
|
||||
"description": "DeepSeek-V3 是一款擁有 6710 億參數的混合專家(MoE)語言模型,採用多頭潛在注意力(MLA)和 DeepSeekMoE 架構,結合無輔助損失的負載平衡策略,優化推理和訓練效率。透過在 14.8 萬億高質量tokens上預訓練,並進行監督微調和強化學習,DeepSeek-V3 在性能上超越其他開源模型,接近領先閉源模型。"
|
||||
},
|
||||
"Pro/deepseek-ai/DeepSeek-V3-1226": {
|
||||
"description": "DeepSeek-V3 是一款擁有 6710 億參數的混合專家(MoE)語言模型,採用多頭潛在注意力(MLA)和 DeepSeekMoE 架構,結合無輔助損失的負載平衡策略,優化推理和訓練效率。透過在 14.8 萬兆高品質 tokens 上預訓練,並進行監督微調和強化學習,DeepSeek-V3 在性能上超越其他開源模型,接近領先的閉源模型。"
|
||||
},
|
||||
"QwQ-32B-Preview": {
|
||||
"description": "QwQ-32B-Preview 是一款獨具創新的自然語言處理模型,能夠高效處理複雜的對話生成與上下文理解任務。"
|
||||
},
|
||||
@@ -404,6 +380,9 @@
|
||||
"THUDM/GLM-4-9B-0414": {
|
||||
"description": "GLM-4-9B-0414 是 GLM 系列的小型模型,擁有 90 億參數。該模型繼承了 GLM-4-32B 系列的技術特點,但提供了更輕量級的部署選擇。儘管規模較小,GLM-4-9B-0414 仍在程式碼生成、網頁設計、SVG 圖形生成和基於搜索的寫作等任務上展現出色能力。"
|
||||
},
|
||||
"THUDM/GLM-4.1V-9B-Thinking": {
|
||||
"description": "GLM-4.1V-9B-Thinking 是由智譜 AI 和清華大學 KEG 實驗室聯合發布的一款開源視覺語言模型(VLM),專為處理複雜的多模態認知任務而設計。該模型基於 GLM-4-9B-0414 基礎模型,通過引入「思維鏈」(Chain-of-Thought)推理機制和採用強化學習策略,顯著提升了其跨模態的推理能力和穩定性。"
|
||||
},
|
||||
"THUDM/GLM-Z1-32B-0414": {
|
||||
"description": "GLM-Z1-32B-0414 是一個具有深度思考能力的推理模型。該模型基於 GLM-4-32B-0414 通過冷啟動和擴展強化學習開發,並在數學、程式碼和邏輯任務上進行了進一步訓練。與基礎模型相比,GLM-Z1-32B-0414 顯著提升了數學能力和解決複雜任務的能力。"
|
||||
},
|
||||
@@ -560,6 +539,9 @@
|
||||
"anthropic/claude-sonnet-4": {
|
||||
"description": "Claude Sonnet 4 可以產生近乎即時的回應或延長的逐步思考,使用者可以清楚地看到這些過程。API 使用者還可以對模型思考的時間進行細緻的控制。"
|
||||
},
|
||||
"ascend-tribe/pangu-pro-moe": {
|
||||
"description": "Pangu-Pro-MoE 72B-A16B 是一款 720 億參數、激活 160 億參的稀疏大型語言模型,它基於分組混合專家(MoGE)架構,它在專家選擇階段對專家進行分組,並約束 token 在每個組內激活等量專家,從而實現專家負載均衡,顯著提升模型在昇騰平台的部署效率。"
|
||||
},
|
||||
"aya": {
|
||||
"description": "Aya 23 是 Cohere 推出的多語言模型,支持 23 種語言,為多元化語言應用提供便利。"
|
||||
},
|
||||
@@ -569,6 +551,9 @@
|
||||
"baichuan/baichuan2-13b-chat": {
|
||||
"description": "Baichuan-13B百川智能開發的包含130億參數的開源可商用的大規模語言模型,在權威的中文和英文benchmark上均取得同尺寸最好的效果。"
|
||||
},
|
||||
"baidu/ERNIE-4.5-300B-A47B": {
|
||||
"description": "ERNIE-4.5-300B-A47B 是由百度公司開發的一款基於混合專家(MoE)架構的大型語言模型。該模型總參數量為 3000 億,但在推理時每個 token 僅激活 470 億參數,從而在保證強大性能的同時兼顧了計算效率。作為 ERNIE 4.5 系列的核心模型之一,在文本理解、生成、推理和程式設計等任務上展現出卓越的能力。該模型採用了一種創新的多模態異構 MoE 預訓練方法,通過文本與視覺模態的聯合訓練,有效提升了模型的綜合能力,尤其在指令遵循和世界知識記憶方面效果突出。"
|
||||
},
|
||||
"c4ai-aya-expanse-32b": {
|
||||
"description": "Aya Expanse 是一款高性能的 32B 多語言模型,旨在通過指令調優、數據套利、偏好訓練和模型合併的創新,挑戰單語言模型的表現。它支持 23 種語言。"
|
||||
},
|
||||
@@ -914,9 +899,39 @@
|
||||
"doubao-1.5-thinking-pro": {
|
||||
"description": "Doubao-1.5全新深度思考模型,在數學、程式設計、科學推理等專業領域及創意寫作等通用任務中表現突出,在AIME 2024、Codeforces、GPQA等多項權威基準上達到或接近業界第一梯隊水平。支持128k上下文窗口,16k輸出。"
|
||||
},
|
||||
"doubao-1.5-thinking-pro-m": {
|
||||
"description": "Doubao-1.5全新深度思考模型(m 版本自帶原生多模態深度推理能力),在數學、程式設計、科學推理等專業領域及創意寫作等通用任務中表現突出,在AIME 2024、Codeforces、GPQA等多項權威基準上達到或接近業界第一梯隊水準。支持128k上下文視窗,16k輸出。"
|
||||
},
|
||||
"doubao-1.5-thinking-vision-pro": {
|
||||
"description": "全新視覺深度思考模型,具備更強的通用多模態理解和推理能力,在59個公開評測基準中的37個上取得SOTA表現。"
|
||||
},
|
||||
"doubao-1.5-ui-tars": {
|
||||
"description": "Doubao-1.5-UI-TARS 是一款原生面向圖形介面互動(GUI)的Agent模型。透過感知、推理和行動等類人能力,與 GUI 進行無縫互動。"
|
||||
},
|
||||
"doubao-1.5-vision-lite": {
|
||||
"description": "Doubao-1.5-vision-lite 全新升級的多模態大模型,支持任意解析度和極端長寬比圖像識別,增強視覺推理、文檔識別、細節信息理解和指令遵循能力。支持 128k 上下文窗口,輸出長度支持最大 16k tokens。"
|
||||
},
|
||||
"doubao-1.5-vision-pro": {
|
||||
"description": "Doubao-1.5-vision-pro 全新升級的多模態大模型,支持任意解析度和極端長寬比影像識別,增強視覺推理、文件識別、細節資訊理解和指令遵循能力。"
|
||||
},
|
||||
"doubao-1.5-vision-pro-32k": {
|
||||
"description": "Doubao-1.5-vision-pro 全新升級的多模態大模型,支持任意解析度和極端長寬比影像識別,增強視覺推理、文件識別、細節資訊理解和指令遵循能力。"
|
||||
},
|
||||
"doubao-lite-128k": {
|
||||
"description": "擁有極致的響應速度,更好的性價比,為客戶不同場景提供更靈活的選擇。支持128k上下文視窗的推理和精調。"
|
||||
},
|
||||
"doubao-lite-32k": {
|
||||
"description": "擁有極致的響應速度,更好的性價比,為客戶不同場景提供更靈活的選擇。支持32k上下文視窗的推理和精調。"
|
||||
},
|
||||
"doubao-lite-4k": {
|
||||
"description": "擁有極致的響應速度,更好的性價比,為客戶不同場景提供更靈活的選擇。支持4k上下文視窗的推理和精調。"
|
||||
},
|
||||
"doubao-pro-256k": {
|
||||
"description": "效果最好的主力模型,適合處理複雜任務,在參考問答、總結摘要、創作、文本分類、角色扮演等場景都有很好的效果。支持256k上下文視窗的推理和精調。"
|
||||
},
|
||||
"doubao-pro-32k": {
|
||||
"description": "效果最好的主力模型,適合處理複雜任務,在參考問答、總結摘要、創作、文本分類、角色扮演等場景都有很好的效果。支持32k上下文視窗的推理和精調。"
|
||||
},
|
||||
"doubao-seed-1.6": {
|
||||
"description": "Doubao-Seed-1.6 全新多模態深度思考模型,同時支援 auto/thinking/non-thinking 三種思考模式。non-thinking 模式下,模型效果相較 Doubao-1.5-pro/250115 大幅提升。支援 256k 上下文視窗,輸出長度支援最大 16k tokens。"
|
||||
},
|
||||
@@ -926,6 +941,12 @@
|
||||
"doubao-seed-1.6-thinking": {
|
||||
"description": "Doubao-Seed-1.6-thinking 模型思考能力大幅強化,相較 Doubao-1.5-thinking-pro,在 Coding、Math、邏輯推理等基礎能力上進一步提升,支援視覺理解。支援 256k 上下文視窗,輸出長度支援最大 16k tokens。"
|
||||
},
|
||||
"doubao-vision-lite-32k": {
|
||||
"description": "Doubao-vision 模型是豆包推出的多模態大模型,具備強大的圖片理解與推理能力,以及精準的指令理解能力。模型在影像文本資訊擷取、基於影像的推理任務上展現出強大的性能,能夠應用於更複雜、更廣泛的視覺問答任務。"
|
||||
},
|
||||
"doubao-vision-pro-32k": {
|
||||
"description": "Doubao-vision 模型是豆包推出的多模態大模型,具備強大的圖片理解與推理能力,以及精準的指令理解能力。模型在影像文本資訊擷取、基於影像的推理任務上展現出強大的性能,能夠應用於更複雜、更廣泛的視覺問答任務。"
|
||||
},
|
||||
"emohaa": {
|
||||
"description": "Emohaa是一個心理模型,具備專業諮詢能力,幫助用戶理解情感問題。"
|
||||
},
|
||||
@@ -1082,9 +1103,6 @@
|
||||
"gemini-2.5-pro": {
|
||||
"description": "Gemini 2.5 Pro 是 Google 最先進的思維模型,能夠對程式碼、數學和 STEM 領域的複雜問題進行推理,以及使用長上下文分析大型資料集、程式碼庫和文件。"
|
||||
},
|
||||
"gemini-2.5-pro-exp-03-25": {
|
||||
"description": "Gemini 2.5 Pro 實驗版是 Google 最先進的思維模型,能夠對代碼、數學和 STEM 領域的複雜問題進行推理,還能利用長上下文來分析大型數據集、代碼庫和文檔。"
|
||||
},
|
||||
"gemini-2.5-pro-preview-03-25": {
|
||||
"description": "Gemini 2.5 Pro Preview 是 Google 最先進的思維模型,能夠對程式碼、數學和STEM領域的複雜問題進行推理,以及使用長上下文分析大型數據集、程式庫和文檔。"
|
||||
},
|
||||
@@ -1151,6 +1169,12 @@
|
||||
"glm-4-plus": {
|
||||
"description": "GLM-4-Plus作為高智能旗艦,具備強大的處理長文本和複雜任務的能力,性能全面提升。"
|
||||
},
|
||||
"glm-4.1v-thinking-flash": {
|
||||
"description": "GLM-4.1V-Thinking 系列模型是目前已知10B級別的VLM模型中性能最強的視覺模型,融合了同級別SOTA的各項視覺語言任務,包括影片理解、圖片問答、學科解題、OCR文字識別、文件和圖表解讀、GUI Agent、前端網頁程式設計、Grounding等,多項任務能力甚至超過8倍參數量的Qwen2.5-VL-72B。通過領先的強化學習技術,模型掌握了透過思維鏈推理的方式提升回答的準確性和豐富度,從最終效果和可解釋性等維度都顯著超過傳統的非thinking模型。"
|
||||
},
|
||||
"glm-4.1v-thinking-flashx": {
|
||||
"description": "GLM-4.1V-Thinking 系列模型是目前已知10B級別的VLM模型中性能最強的視覺模型,融合了同級別SOTA的各項視覺語言任務,包括影片理解、圖片問答、學科解題、OCR文字識別、文件和圖表解讀、GUI Agent、前端網頁程式設計、Grounding等,多項任務能力甚至超過8倍參數量的Qwen2.5-VL-72B。通過領先的強化學習技術,模型掌握了透過思維鏈推理的方式提升回答的準確性和豐富度,從最終效果和可解釋性等維度都顯著超過傳統的非thinking模型。"
|
||||
},
|
||||
"glm-4v": {
|
||||
"description": "GLM-4V提供強大的圖像理解與推理能力,支持多種視覺任務。"
|
||||
},
|
||||
@@ -1172,6 +1196,9 @@
|
||||
"glm-z1-flash": {
|
||||
"description": "GLM-Z1 系列具備強大的複雜推理能力,在邏輯推理、數學、程式設計等領域表現優異。最大上下文長度為32K。"
|
||||
},
|
||||
"glm-z1-flashx": {
|
||||
"description": "高速低價:Flash增強版本,超快推理速度,更快並發保障。"
|
||||
},
|
||||
"glm-zero-preview": {
|
||||
"description": "GLM-Zero-Preview具備強大的複雜推理能力,在邏輯推理、數學、程式設計等領域表現優異。"
|
||||
},
|
||||
@@ -1223,6 +1250,9 @@
|
||||
"google/gemma-2b-it": {
|
||||
"description": "Gemma Instruct (2B) 提供基本的指令處理能力,適合輕量級應用。"
|
||||
},
|
||||
"google/gemma-3-1b-it": {
|
||||
"description": "Gemma 3 1B 是谷歌的一款開源語言模型,以其在效率和性能方面樹立了新的標準。"
|
||||
},
|
||||
"google/gemma-3-27b-it": {
|
||||
"description": "Gemma 3 27B 是谷歌的一款開源語言模型,以其在效率和性能方面設立了新的標準。"
|
||||
},
|
||||
@@ -1313,6 +1343,9 @@
|
||||
"gpt-4o-mini-search-preview": {
|
||||
"description": "GPT-4o mini 搜尋預覽版是一個專門訓練用於理解和執行網頁搜尋查詢的模型,使用的是 Chat Completions API。除了代幣費用之外,網頁搜尋查詢還會按每次工具呼叫收取費用。"
|
||||
},
|
||||
"gpt-4o-mini-transcribe": {
|
||||
"description": "GPT-4o Mini Transcribe 是一種使用 GPT-4o 轉錄音訊的語音轉文字模型。與原始 Whisper 模型相比,它降低了字詞錯誤率,並提升了語言識別和準確性。使用它來獲得更準確的轉錄。"
|
||||
},
|
||||
"gpt-4o-mini-tts": {
|
||||
"description": "GPT-4o mini TTS 是基於 GPT-4o mini 的文本轉語音模型,提供高品質的語音生成,同時降低成本。"
|
||||
},
|
||||
@@ -1322,12 +1355,15 @@
|
||||
"gpt-4o-realtime-preview-2024-10-01": {
|
||||
"description": "GPT-4o 實時版本,支持音頻和文本實時輸入輸出"
|
||||
},
|
||||
"gpt-4o-realtime-preview-2024-12-17": {
|
||||
"description": "GPT-4o 實時版本,支持音頻和文本實時輸入輸出"
|
||||
"gpt-4o-realtime-preview-2025-06-03": {
|
||||
"description": "GPT-4o 即時版本,支持音訊和文字即時輸入輸出"
|
||||
},
|
||||
"gpt-4o-search-preview": {
|
||||
"description": "GPT-4o 搜尋預覽版是一個專門訓練用於理解和執行網頁搜尋查詢的模型,使用的是 Chat Completions API。除了代幣費用之外,網頁搜尋查詢還會按每次工具呼叫收取費用。"
|
||||
},
|
||||
"gpt-4o-transcribe": {
|
||||
"description": "GPT-4o Transcribe 是一種使用 GPT-4o 轉錄音訊的語音轉文字模型。與原始 Whisper 模型相比,它降低了字詞錯誤率,並提升了語言識別和準確性。使用它來獲得更準確的轉錄。"
|
||||
},
|
||||
"grok-2-1212": {
|
||||
"description": "該模型在準確性、指令遵循和多語言能力方面有所改進。"
|
||||
},
|
||||
@@ -1346,9 +1382,15 @@
|
||||
"grok-3-mini-fast": {
|
||||
"description": "輕量級模型,對話前會先思考。運行快速、智能,適用於不需要深層領域知識的邏輯任務,並能獲取原始的思維軌跡。"
|
||||
},
|
||||
"grok-4": {
|
||||
"description": "我們最新最強大的旗艦模型,在自然語言處理、數學計算和推理方面表現卓越 —— 是一款完美的全能型選手。"
|
||||
},
|
||||
"gryphe/mythomax-l2-13b": {
|
||||
"description": "MythoMax l2 13B 是一款合併了多個頂尖模型的創意與智能相結合的語言模型。"
|
||||
},
|
||||
"hunyuan-a13b": {
|
||||
"description": "混元第一個混合推理模型,hunyuan-standard-256K 的升級版本,總參數80B,激活13B,預設為慢思考模式,支持透過參數或指令進行快慢思考模式切換,慢快思考切換方式為 query 前加/ no_think;整體能力相較上一代全面提升,特別是數學、科學、長文理解和 Agent 能力提升顯著。"
|
||||
},
|
||||
"hunyuan-code": {
|
||||
"description": "混元最新代碼生成模型,經過 200B 高質量代碼數據增訓基座模型,迭代半年高質量 SFT 數據訓練,上下文長窗口長度增大到 8K,五大語言代碼生成自動評測指標上位居前列;五大語言 10 項考量各方面綜合代碼任務人工高質量評測上,性能處於第一梯隊。"
|
||||
},
|
||||
@@ -1400,6 +1442,9 @@
|
||||
"hunyuan-t1-vision": {
|
||||
"description": "混元多模態理解深度思考模型,支援多模態原生長思維鏈,擅長處理各種圖片推理場景,在理科難題上相比快思考模型全面提升。"
|
||||
},
|
||||
"hunyuan-t1-vision-20250619": {
|
||||
"description": "混元最新版 t1-vision 多模態理解深度思考模型,支持多模態原生長思維鏈,相較上一代預設版本模型全面提升。"
|
||||
},
|
||||
"hunyuan-turbo": {
|
||||
"description": "混元全新一代大語言模型的預覽版,採用全新的混合專家模型(MoE)結構,相較於 hunyuan-pro 推理效率更快,效果表現更強。"
|
||||
},
|
||||
@@ -1430,6 +1475,12 @@
|
||||
"hunyuan-turbos-role-plus": {
|
||||
"description": "混元最新版角色扮演模型,混元官方精調訓練推出的角色扮演模型,基於混元模型結合角色扮演場景資料集進行增訓,在角色扮演場景具有更好的基礎效果。"
|
||||
},
|
||||
"hunyuan-turbos-vision": {
|
||||
"description": "此模型適用於圖文理解場景,是基於混元最新 turbos 的新一代視覺語言旗艦大型模型,聚焦圖文理解相關任務,包括基於圖片的實體識別、知識問答、文案創作、拍照解題等方面,相較前一代模型全面提升。"
|
||||
},
|
||||
"hunyuan-turbos-vision-20250619": {
|
||||
"description": "混元最新版 turbos-vision 視覺語言旗艦大型模型,在圖文理解相關的任務上,包括基於圖片的實體識別、知識問答、文案創作、拍照解題等方面,相較上一代預設版本模型全面提升。"
|
||||
},
|
||||
"hunyuan-vision": {
|
||||
"description": "混元最新多模態模型,支持圖片 + 文本輸入生成文本內容。"
|
||||
},
|
||||
@@ -1457,6 +1508,9 @@
|
||||
"jina-deepsearch-v1": {
|
||||
"description": "深度搜索結合了網路搜索、閱讀和推理,可進行全面調查。您可以將其視為一個代理,接受您的研究任務 - 它會進行廣泛搜索並經過多次迭代,然後才能給出答案。這個過程涉及持續的研究、推理和從各個角度解決問題。這與直接從預訓練數據生成答案的標準大模型以及依賴一次性表面搜索的傳統 RAG 系統有著根本的不同。"
|
||||
},
|
||||
"kimi-k2-0711-preview": {
|
||||
"description": "kimi-k2 是一款具備超強程式碼和 Agent 能力的 MoE 架構基礎模型,總參數 1T,激活參數 32B。在通用知識推理、程式設計、數學、Agent 等主要類別的基準性能測試中,K2 模型的性能超越其他主流開源模型。"
|
||||
},
|
||||
"kimi-latest": {
|
||||
"description": "Kimi 智能助手產品使用最新的 Kimi 大模型,可能包含尚未穩定的特性。支持圖片理解,同時會自動根據請求的上下文長度選擇 8k/32k/128k 模型作為計費模型"
|
||||
},
|
||||
@@ -2349,7 +2403,7 @@
|
||||
"description": "v0-1.5-md 模型適用於日常任務和使用者介面(UI)生成"
|
||||
},
|
||||
"whisper-1": {
|
||||
"description": "通用語音識別模型,支持多語言語音識別、語音翻譯和語言識別"
|
||||
"description": "通用語音識別模型,支持多語言語音識別、語音翻譯和語言識別。"
|
||||
},
|
||||
"wizardlm2": {
|
||||
"description": "WizardLM 2 是微軟 AI 提供的語言模型,在複雜對話、多語言、推理和智能助手領域表現尤為出色。"
|
||||
|
||||
@@ -520,6 +520,7 @@
|
||||
"hotkey": "快速鍵",
|
||||
"llm": "語言模型",
|
||||
"provider": "AI 服務商",
|
||||
"proxy": "網路代理",
|
||||
"storage": "資料儲存",
|
||||
"sync": "雲端同步",
|
||||
"system-agent": "系統助手",
|
||||
|
||||
+4
-8
@@ -1,6 +1,6 @@
|
||||
{
|
||||
"name": "@lobehub/chat",
|
||||
"version": "1.97.9",
|
||||
"version": "1.98.2",
|
||||
"description": "Lobe Chat - an open-source, high-performance chatbot framework that supports speech synthesis, multimodal, and extensible Function Call plugin system. Supports one-click free deployment of your private ChatGPT/LLM web application.",
|
||||
"keywords": [
|
||||
"framework",
|
||||
@@ -41,11 +41,8 @@
|
||||
"db:generate": "drizzle-kit generate && npm run db:generate-client && npm run workflow:dbml",
|
||||
"db:generate-client": "tsx ./scripts/migrateClientDB/compile-migrations.ts",
|
||||
"db:migrate": "MIGRATION_DB=1 tsx ./scripts/migrateServerDB/index.ts",
|
||||
"db:push": "drizzle-kit push",
|
||||
"db:push-test": "NODE_ENV=test drizzle-kit push",
|
||||
"db:studio": "drizzle-kit studio",
|
||||
"db:visualize": "dbdocs build docs/development/database-schema.dbml --project lobe-chat",
|
||||
"db:z-pull": "drizzle-kit introspect",
|
||||
"desktop:build": "npm run desktop:build-next && npm run desktop:prepare-dist && npm run desktop:build-electron",
|
||||
"desktop:build-electron": "tsx scripts/electronWorkflow/buildElectron.ts",
|
||||
"desktop:build-next": "npm run build:electron",
|
||||
@@ -121,7 +118,7 @@
|
||||
"dependencies": {
|
||||
"@ant-design/icons": "^5.6.1",
|
||||
"@ant-design/pro-components": "^2.8.7",
|
||||
"@anthropic-ai/sdk": "^0.54.0",
|
||||
"@anthropic-ai/sdk": "^0.56.0",
|
||||
"@auth/core": "^0.38.0",
|
||||
"@aws-sdk/client-bedrock-runtime": "^3.821.0",
|
||||
"@aws-sdk/client-s3": "^3.821.0",
|
||||
@@ -170,7 +167,6 @@
|
||||
"@vercel/speed-insights": "^1.2.0",
|
||||
"@xterm/xterm": "^5.5.0",
|
||||
"ahooks": "^3.8.5",
|
||||
"ai": "^3.4.33",
|
||||
"antd": "^5.26.4",
|
||||
"antd-style": "^3.7.1",
|
||||
"brotli-wasm": "^3.0.1",
|
||||
@@ -203,7 +199,7 @@
|
||||
"langfuse": "^3.37.3",
|
||||
"langfuse-core": "^3.37.3",
|
||||
"lodash-es": "^4.17.21",
|
||||
"lucide-react": "^0.522.0",
|
||||
"lucide-react": "^0.525.0",
|
||||
"mammoth": "^1.9.1",
|
||||
"markdown-to-txt": "^2.0.1",
|
||||
"mdast-util-to-markdown": "^2.1.2",
|
||||
@@ -315,7 +311,7 @@
|
||||
"@types/unist": "^3.0.3",
|
||||
"@types/uuid": "^10.0.0",
|
||||
"@types/ws": "^8.18.1",
|
||||
"@typescript/native-preview": "latest",
|
||||
"@typescript/native-preview": "7.0.0-dev.20250711.1",
|
||||
"@vitest/coverage-v8": "^3.1.4",
|
||||
"ajv-keywords": "^5.1.0",
|
||||
"commitlint": "^19.8.1",
|
||||
|
||||
@@ -1,6 +1,7 @@
|
||||
import { LocalFilesDispatchEvents } from './localFile';
|
||||
import { MenuDispatchEvents } from './menu';
|
||||
import { RemoteServerBroadcastEvents, RemoteServerDispatchEvents } from './remoteServer';
|
||||
import { DesktopSettingsDispatchEvents } from './settings';
|
||||
import { ShortcutDispatchEvents } from './shortcut';
|
||||
import { SystemBroadcastEvents, SystemDispatchEvents } from './system';
|
||||
import { TrayDispatchEvents } from './tray';
|
||||
@@ -21,7 +22,8 @@ export interface ClientDispatchEvents
|
||||
ShortcutDispatchEvents,
|
||||
RemoteServerDispatchEvents,
|
||||
UploadFilesDispatchEvents,
|
||||
TrayDispatchEvents {}
|
||||
TrayDispatchEvents,
|
||||
DesktopSettingsDispatchEvents {}
|
||||
|
||||
export type ClientDispatchEventKey = keyof ClientDispatchEvents;
|
||||
|
||||
|
||||
@@ -0,0 +1,12 @@
|
||||
import { NetworkProxySettings } from '../types';
|
||||
|
||||
export interface DesktopSettingsDispatchEvents {
|
||||
getProxySettings: () => NetworkProxySettings;
|
||||
setProxySettings: (settings: Partial<NetworkProxySettings>) => void;
|
||||
testProxyConfig: (data: { config: NetworkProxySettings; testUrl?: string }) => Promise<{
|
||||
message?: string;
|
||||
responseTime?: number;
|
||||
success: boolean;
|
||||
}>;
|
||||
testProxyConnection: (url: string) => Promise<{ message?: string; success: boolean }>;
|
||||
}
|
||||
@@ -1,6 +1,7 @@
|
||||
export * from './dataSync';
|
||||
export * from './dispatch';
|
||||
export * from './localFile';
|
||||
export * from './proxy';
|
||||
export * from './proxyTRPCRequest';
|
||||
export * from './route';
|
||||
export * from './shortcut';
|
||||
|
||||
@@ -0,0 +1,12 @@
|
||||
export type ProxyType = 'http' | 'https' | 'socks5';
|
||||
|
||||
export interface NetworkProxySettings {
|
||||
enableProxy: boolean;
|
||||
proxyBypass?: string;
|
||||
proxyPassword?: string;
|
||||
proxyPort: string;
|
||||
proxyRequireAuth: boolean;
|
||||
proxyServer: string;
|
||||
proxyType: ProxyType;
|
||||
proxyUsername?: string;
|
||||
}
|
||||
@@ -10,9 +10,9 @@ export const generateMetadata = async (props: DynamicLayoutProps) => {
|
||||
const { locale, t } = await parsePageMetaProps(props);
|
||||
return metadataModule.generate({
|
||||
alternate: true,
|
||||
description: t('discover.home.description'),
|
||||
description: t('discover.description'),
|
||||
locale,
|
||||
title: t('discover.home.title'),
|
||||
title: t('discover.title'),
|
||||
url: '/discover',
|
||||
});
|
||||
};
|
||||
@@ -21,9 +21,9 @@ const Page = async (props: DynamicLayoutProps) => {
|
||||
const { locale, t, isMobile } = await parsePageMetaProps(props);
|
||||
|
||||
const ld = ldModule.generate({
|
||||
description: t('discover.home.description'),
|
||||
description: t('discover.description'),
|
||||
locale,
|
||||
title: t('discover.home.title'),
|
||||
title: t('discover.title'),
|
||||
url: '/discover',
|
||||
webpage: {
|
||||
enable: true,
|
||||
|
||||
@@ -4,6 +4,7 @@ import {
|
||||
Brain,
|
||||
Cloudy,
|
||||
Database,
|
||||
EthernetPort,
|
||||
Info,
|
||||
KeyboardIcon,
|
||||
Mic2,
|
||||
@@ -16,7 +17,7 @@ import { useTranslation } from 'react-i18next';
|
||||
import { Flexbox } from 'react-layout-kit';
|
||||
|
||||
import type { MenuProps } from '@/components/Menu';
|
||||
import { isDeprecatedEdition } from '@/const/version';
|
||||
import { isDeprecatedEdition, isDesktop } from '@/const/version';
|
||||
import { SettingsTabs } from '@/store/global/initialState';
|
||||
import { featureFlagsSelectors, useServerConfigStore } from '@/store/serverConfig';
|
||||
|
||||
@@ -117,6 +118,15 @@ export const useCategory = () => {
|
||||
{
|
||||
type: 'divider',
|
||||
},
|
||||
isDesktop && {
|
||||
icon: <Icon icon={EthernetPort} />,
|
||||
key: SettingsTabs.Proxy,
|
||||
label: (
|
||||
<Link href={'/settings/proxy'} onClick={(e) => e.preventDefault()}>
|
||||
{t('tab.proxy')}
|
||||
</Link>
|
||||
),
|
||||
},
|
||||
{
|
||||
icon: <Icon icon={Database} />,
|
||||
key: SettingsTabs.Storage,
|
||||
|
||||
@@ -0,0 +1,369 @@
|
||||
'use client';
|
||||
|
||||
import { NetworkProxySettings } from '@lobechat/electron-client-ipc';
|
||||
import { Alert, Block, Text } from '@lobehub/ui';
|
||||
import { App, Button, Divider, Form, Input, Radio, Skeleton, Space, Switch } from 'antd';
|
||||
import isEqual from 'fast-deep-equal';
|
||||
import { useCallback, useEffect, useState } from 'react';
|
||||
import { useTranslation } from 'react-i18next';
|
||||
import { Flexbox } from 'react-layout-kit';
|
||||
|
||||
import { desktopSettingsService } from '@/services/electron/settings';
|
||||
import { useElectronStore } from '@/store/electron';
|
||||
|
||||
interface ProxyTestResult {
|
||||
message?: string;
|
||||
responseTime?: number;
|
||||
success: boolean;
|
||||
}
|
||||
|
||||
const ProxyForm = () => {
|
||||
const { t } = useTranslation('electron');
|
||||
const [form] = Form.useForm();
|
||||
const { message } = App.useApp();
|
||||
const [testUrl, setTestUrl] = useState('https://www.google.com');
|
||||
const [isTesting, setIsTesting] = useState(false);
|
||||
const [isSaving, setIsSaving] = useState(false);
|
||||
const [testResult, setTestResult] = useState<ProxyTestResult | null>(null);
|
||||
const [hasUnsavedChanges, setHasUnsavedChanges] = useState(false);
|
||||
|
||||
const isEnableProxy = Form.useWatch('enableProxy', form);
|
||||
const proxyRequireAuth = Form.useWatch('proxyRequireAuth', form);
|
||||
|
||||
const [setProxySettings, useGetProxySettings] = useElectronStore((s) => [
|
||||
s.setProxySettings,
|
||||
s.useGetProxySettings,
|
||||
]);
|
||||
const { data: proxySettings, isLoading } = useGetProxySettings();
|
||||
|
||||
useEffect(() => {
|
||||
if (proxySettings) {
|
||||
form.setFieldsValue(proxySettings);
|
||||
setHasUnsavedChanges(false);
|
||||
}
|
||||
}, [form, proxySettings]);
|
||||
|
||||
// 监听表单变化
|
||||
const handleValuesChange = useCallback(() => {
|
||||
setHasUnsavedChanges(true);
|
||||
setTestResult(null); // 清除之前的测试结果
|
||||
}, []);
|
||||
|
||||
const updateFormValue = (value: any) => {
|
||||
const preValues = form.getFieldsValue();
|
||||
form.setFieldsValue(value);
|
||||
const newValues = form.getFieldsValue();
|
||||
if (isEqual(newValues, preValues)) return;
|
||||
|
||||
handleValuesChange();
|
||||
};
|
||||
|
||||
// 保存配置
|
||||
const handleSave = useCallback(async () => {
|
||||
try {
|
||||
setIsSaving(true);
|
||||
const values = await form.validateFields();
|
||||
await setProxySettings(values);
|
||||
setHasUnsavedChanges(false);
|
||||
message.success(t('proxy.saveSuccess'));
|
||||
} catch (error) {
|
||||
if (error instanceof Error) {
|
||||
message.error(t('proxy.saveFailed', { error: error.message }));
|
||||
}
|
||||
} finally {
|
||||
setIsSaving(false);
|
||||
}
|
||||
}, [form, t, message]);
|
||||
|
||||
// 重置配置
|
||||
const handleReset = useCallback(() => {
|
||||
if (proxySettings) {
|
||||
form.setFieldsValue(proxySettings);
|
||||
setHasUnsavedChanges(false);
|
||||
setTestResult(null);
|
||||
}
|
||||
}, [form, proxySettings]);
|
||||
|
||||
// 测试代理配置
|
||||
const handleTest = useCallback(async () => {
|
||||
try {
|
||||
setIsTesting(true);
|
||||
setTestResult(null);
|
||||
|
||||
// 验证表单并获取当前配置
|
||||
const values = await form.validateFields();
|
||||
const config: NetworkProxySettings = {
|
||||
...proxySettings,
|
||||
...values,
|
||||
};
|
||||
|
||||
// 使用新的 testProxyConfig 方法测试用户正在配置的代理
|
||||
const result = await desktopSettingsService.testProxyConfig(config, testUrl);
|
||||
|
||||
setTestResult(result);
|
||||
} catch (error) {
|
||||
const errorMessage = error instanceof Error ? error.message : 'Unknown error';
|
||||
const result: ProxyTestResult = {
|
||||
message: errorMessage,
|
||||
success: false,
|
||||
};
|
||||
setTestResult(result);
|
||||
message.error(t('proxy.testFailed'));
|
||||
} finally {
|
||||
setIsTesting(false);
|
||||
}
|
||||
}, [proxySettings, testUrl]);
|
||||
|
||||
if (isLoading) return <Skeleton />;
|
||||
|
||||
return (
|
||||
<Form
|
||||
disabled={isSaving}
|
||||
form={form}
|
||||
layout="vertical"
|
||||
onValuesChange={handleValuesChange}
|
||||
requiredMark={false}
|
||||
>
|
||||
<Flexbox gap={24}>
|
||||
{/* 基本代理设置 */}
|
||||
<Block
|
||||
paddingBlock={16}
|
||||
paddingInline={24}
|
||||
style={{ borderRadius: 12 }}
|
||||
variant={'outlined'}
|
||||
>
|
||||
<Form.Item name="enableProxy" noStyle valuePropName="checked">
|
||||
<Flexbox align={'center'} horizontal justify={'space-between'}>
|
||||
<Flexbox>
|
||||
<Text as={'h4'}>{t('proxy.enable')}</Text>
|
||||
<Text type={'secondary'}>{t('proxy.enableDesc')}</Text>
|
||||
</Flexbox>
|
||||
<Switch
|
||||
checked={isEnableProxy}
|
||||
onChange={(checked) => {
|
||||
updateFormValue({ enableProxy: checked });
|
||||
}}
|
||||
/>
|
||||
</Flexbox>
|
||||
</Form.Item>
|
||||
</Block>
|
||||
|
||||
{/* 认证设置 */}
|
||||
<Block
|
||||
paddingBlock={16}
|
||||
paddingInline={24}
|
||||
style={{ borderRadius: 12 }}
|
||||
variant={'outlined'}
|
||||
>
|
||||
<Flexbox gap={24}>
|
||||
<Flexbox>
|
||||
<Text as={'h4'}>{t('proxy.basicSettings')}</Text>
|
||||
<Text type={'secondary'}>{t('proxy.basicSettingsDesc')}</Text>
|
||||
</Flexbox>
|
||||
<Flexbox>
|
||||
<Form.Item
|
||||
dependencies={['enableProxy']}
|
||||
label={t('proxy.type')}
|
||||
name="proxyType"
|
||||
rules={[
|
||||
({ getFieldValue }) => ({
|
||||
message: t('proxy.validation.typeRequired'),
|
||||
required: getFieldValue('enableProxy'),
|
||||
}),
|
||||
]}
|
||||
>
|
||||
<Radio.Group disabled={!form.getFieldValue('enableProxy')}>
|
||||
<Radio value="http">HTTP</Radio>
|
||||
<Radio value="https">HTTPS</Radio>
|
||||
<Radio value="socks5">SOCKS5</Radio>
|
||||
</Radio.Group>
|
||||
</Form.Item>
|
||||
|
||||
<Space.Compact style={{ width: '100%' }}>
|
||||
<Form.Item
|
||||
dependencies={['enableProxy']}
|
||||
label={t('proxy.server')}
|
||||
name="proxyServer"
|
||||
rules={[
|
||||
({ getFieldValue }) => ({
|
||||
message: t('proxy.validation.serverRequired'),
|
||||
required: getFieldValue('enableProxy'),
|
||||
}),
|
||||
{
|
||||
message: t('proxy.validation.serverInvalid'),
|
||||
pattern:
|
||||
/^((25[0-5]|2[0-4]\d|[01]?\d{1,2})\.){3}(25[0-5]|2[0-4]\d|[01]?\d{1,2})$|^[\dA-Za-z]([\dA-Za-z-]*[\dA-Za-z])?(\.[\dA-Za-z]([\dA-Za-z-]*[\dA-Za-z])?)*$/,
|
||||
},
|
||||
]}
|
||||
style={{ flex: 1, marginBottom: 0 }}
|
||||
>
|
||||
<Input disabled={!form.getFieldValue('enableProxy')} placeholder="127.0.0.1" />
|
||||
</Form.Item>
|
||||
|
||||
<Form.Item
|
||||
dependencies={['enableProxy']}
|
||||
label={t('proxy.port')}
|
||||
name="proxyPort"
|
||||
rules={[
|
||||
({ getFieldValue }) => ({
|
||||
message: t('proxy.validation.portRequired'),
|
||||
required: getFieldValue('enableProxy'),
|
||||
}),
|
||||
{
|
||||
message: t('proxy.validation.portInvalid'),
|
||||
pattern:
|
||||
/^([1-9]\d{0,3}|[1-5]\d{4}|6[0-4]\d{3}|65[0-4]\d{2}|655[0-2]\d|6553[0-5])$/,
|
||||
},
|
||||
]}
|
||||
style={{ marginBottom: 0, width: 120 }}
|
||||
>
|
||||
<Input disabled={!form.getFieldValue('enableProxy')} placeholder="7890" />
|
||||
</Form.Item>
|
||||
</Space.Compact>
|
||||
</Flexbox>
|
||||
<Divider size={'small'} />
|
||||
<Flexbox gap={12}>
|
||||
<Form.Item
|
||||
dependencies={['enableProxy']}
|
||||
name="proxyRequireAuth"
|
||||
noStyle
|
||||
valuePropName="checked"
|
||||
>
|
||||
<Flexbox align={'center'} horizontal justify={'space-between'}>
|
||||
<Flexbox>
|
||||
<Text as={'h5'}>{t('proxy.auth')}</Text>
|
||||
<Text type={'secondary'}>{t('proxy.authDesc')}</Text>
|
||||
</Flexbox>
|
||||
<Switch
|
||||
checked={proxyRequireAuth}
|
||||
disabled={!isEnableProxy}
|
||||
onChange={(checked) => {
|
||||
updateFormValue({ proxyRequireAuth: checked });
|
||||
}}
|
||||
/>
|
||||
</Flexbox>
|
||||
</Form.Item>
|
||||
|
||||
<Form.Item
|
||||
dependencies={['proxyRequireAuth', 'enableProxy']}
|
||||
label={t('proxy.username')}
|
||||
name="proxyUsername"
|
||||
rules={[
|
||||
({ getFieldValue }) => ({
|
||||
message: t('proxy.validation.usernameRequired'),
|
||||
required: getFieldValue('proxyRequireAuth') && getFieldValue('enableProxy'),
|
||||
}),
|
||||
]}
|
||||
style={{
|
||||
display:
|
||||
form.getFieldValue('proxyRequireAuth') && form.getFieldValue('enableProxy')
|
||||
? 'block'
|
||||
: 'none',
|
||||
}}
|
||||
>
|
||||
<Input placeholder={t('proxy.username_placeholder')} />
|
||||
</Form.Item>
|
||||
|
||||
<Form.Item
|
||||
dependencies={['proxyRequireAuth', 'enableProxy']}
|
||||
label={t('proxy.password')}
|
||||
name="proxyPassword"
|
||||
rules={[
|
||||
({ getFieldValue }) => ({
|
||||
message: t('proxy.validation.passwordRequired'),
|
||||
required: getFieldValue('proxyRequireAuth') && getFieldValue('enableProxy'),
|
||||
}),
|
||||
]}
|
||||
style={{
|
||||
display:
|
||||
form.getFieldValue('proxyRequireAuth') && form.getFieldValue('enableProxy')
|
||||
? 'block'
|
||||
: 'none',
|
||||
}}
|
||||
>
|
||||
<Input.Password placeholder={t('proxy.password_placeholder')} />
|
||||
</Form.Item>
|
||||
</Flexbox>
|
||||
</Flexbox>
|
||||
</Block>
|
||||
|
||||
{/* 连接测试 */}
|
||||
|
||||
<Block
|
||||
paddingBlock={16}
|
||||
paddingInline={24}
|
||||
style={{ borderRadius: 12 }}
|
||||
variant={'outlined'}
|
||||
>
|
||||
<Flexbox gap={24}>
|
||||
<Flexbox>
|
||||
<Text as={'h4'}>{t('proxy.connectionTest')}</Text>
|
||||
<Text type={'secondary'}>{t('proxy.testDescription')}</Text>
|
||||
</Flexbox>
|
||||
<Form.Item label={t('proxy.testUrl')}>
|
||||
<Flexbox gap={8}>
|
||||
<Space.Compact style={{ width: '100%' }}>
|
||||
<Input
|
||||
onChange={(e) => setTestUrl(e.target.value)}
|
||||
placeholder={t('proxy.testUrlPlaceholder')}
|
||||
style={{ flex: 1 }}
|
||||
value={testUrl}
|
||||
/>
|
||||
<Button loading={isTesting} onClick={handleTest} type="default">
|
||||
{t('proxy.testButton')}
|
||||
</Button>
|
||||
</Space.Compact>
|
||||
{/* 测试结果显示 */}
|
||||
{!testResult ? null : testResult.success ? (
|
||||
<Alert
|
||||
closable
|
||||
message={
|
||||
<Flexbox align="center" gap={8} horizontal>
|
||||
{t('proxy.testSuccessWithTime', { time: testResult.responseTime })}
|
||||
</Flexbox>
|
||||
}
|
||||
type={'success'}
|
||||
/>
|
||||
) : (
|
||||
<Alert
|
||||
closable
|
||||
message={
|
||||
<Flexbox align="center" gap={8} horizontal>
|
||||
{t('proxy.testFailed')}: {testResult.message}
|
||||
</Flexbox>
|
||||
}
|
||||
type={'error'}
|
||||
variant={'outlined'}
|
||||
/>
|
||||
)}
|
||||
</Flexbox>
|
||||
</Form.Item>
|
||||
</Flexbox>
|
||||
</Block>
|
||||
{/* 操作按钮 */}
|
||||
<Space>
|
||||
<Button
|
||||
disabled={!hasUnsavedChanges}
|
||||
loading={isSaving}
|
||||
onClick={handleSave}
|
||||
type="primary"
|
||||
>
|
||||
{t('proxy.saveButton')}
|
||||
</Button>
|
||||
|
||||
<Button disabled={!hasUnsavedChanges || isSaving} onClick={handleReset}>
|
||||
{t('proxy.resetButton')}
|
||||
</Button>
|
||||
|
||||
{hasUnsavedChanges && (
|
||||
<Text style={{ marginLeft: 8 }} type="warning">
|
||||
{t('proxy.unsavedChanges')}
|
||||
</Text>
|
||||
)}
|
||||
</Space>
|
||||
</Flexbox>
|
||||
</Form>
|
||||
);
|
||||
};
|
||||
|
||||
export default ProxyForm;
|
||||
@@ -0,0 +1,22 @@
|
||||
'use client';
|
||||
|
||||
import { useTranslation } from 'react-i18next';
|
||||
|
||||
import PageTitle from '@/components/PageTitle';
|
||||
|
||||
import ProxyForm from './features/ProxyForm';
|
||||
|
||||
const ProxySettings = () => {
|
||||
const { t } = useTranslation('setting');
|
||||
|
||||
return (
|
||||
<div>
|
||||
<PageTitle title={t('tab.proxy')} />
|
||||
<ProxyForm />
|
||||
</div>
|
||||
);
|
||||
};
|
||||
|
||||
ProxySettings.displayName = 'ProxySettings';
|
||||
|
||||
export default ProxySettings;
|
||||
@@ -0,0 +1,28 @@
|
||||
import { notFound } from 'next/navigation';
|
||||
|
||||
import { isDesktop } from '@/const/version';
|
||||
import { metadataModule } from '@/server/metadata';
|
||||
import { translation } from '@/server/translation';
|
||||
import { DynamicLayoutProps } from '@/types/next';
|
||||
import { RouteVariants } from '@/utils/server/routeVariants';
|
||||
|
||||
import Client from './index';
|
||||
|
||||
export const generateMetadata = async (props: DynamicLayoutProps) => {
|
||||
const locale = await RouteVariants.getLocale(props);
|
||||
const { t } = await translation('setting', locale);
|
||||
|
||||
return metadataModule.generate({
|
||||
description: t('header.desc'),
|
||||
title: t('tab.proxy'),
|
||||
url: '/settings/proxy',
|
||||
});
|
||||
};
|
||||
|
||||
const Page = () => {
|
||||
if (!isDesktop) return notFound();
|
||||
|
||||
return <Client />;
|
||||
};
|
||||
|
||||
export default Page;
|
||||
@@ -11,7 +11,8 @@ const googleChatModels: AIChatModelCard[] = [
|
||||
contextWindowTokens: 1_048_576 + 65_536,
|
||||
description:
|
||||
'Gemini 2.5 Pro 是 Google 最先进的思维模型,能够对代码、数学和STEM领域的复杂问题进行推理,以及使用长上下文分析大型数据集、代码库和文档。',
|
||||
displayName: 'Gemini 2.5 Pro (Paid)',
|
||||
displayName: 'Gemini 2.5 Pro',
|
||||
enabled: true,
|
||||
id: 'gemini-2.5-pro',
|
||||
maxOutput: 65_536,
|
||||
pricing: {
|
||||
@@ -40,6 +41,7 @@ const googleChatModels: AIChatModelCard[] = [
|
||||
id: 'gemini-2.5-pro-preview-06-05',
|
||||
maxOutput: 65_536,
|
||||
pricing: {
|
||||
cachedInput: 0.31, // prompts <= 200k tokens
|
||||
input: 1.25, // prompts <= 200k tokens
|
||||
output: 10, // prompts <= 200k tokens
|
||||
},
|
||||
@@ -65,6 +67,7 @@ const googleChatModels: AIChatModelCard[] = [
|
||||
id: 'gemini-2.5-pro-preview-05-06',
|
||||
maxOutput: 65_536,
|
||||
pricing: {
|
||||
cachedInput: 0.31, // prompts <= 200k tokens
|
||||
input: 1.25, // prompts <= 200k tokens
|
||||
output: 10, // prompts <= 200k tokens
|
||||
},
|
||||
@@ -75,30 +78,6 @@ const googleChatModels: AIChatModelCard[] = [
|
||||
},
|
||||
type: 'chat',
|
||||
},
|
||||
{
|
||||
abilities: {
|
||||
functionCall: true,
|
||||
reasoning: true,
|
||||
search: true,
|
||||
vision: true,
|
||||
},
|
||||
contextWindowTokens: 1_048_576 + 65_536,
|
||||
description:
|
||||
'Gemini 2.5 Pro Experimental 是 Google 最先进的思维模型,能够对代码、数学和STEM领域的复杂问题进行推理,以及使用长上下文分析大型数据集、代码库和文档。',
|
||||
displayName: 'Gemini 2.5 Pro Experimental 03-25',
|
||||
id: 'gemini-2.5-pro-exp-03-25',
|
||||
maxOutput: 65_536,
|
||||
pricing: {
|
||||
input: 0,
|
||||
output: 0,
|
||||
},
|
||||
releasedAt: '2025-03-25',
|
||||
settings: {
|
||||
searchImpl: 'params',
|
||||
searchProvider: 'google',
|
||||
},
|
||||
type: 'chat',
|
||||
},
|
||||
{
|
||||
abilities: {
|
||||
functionCall: true,
|
||||
@@ -138,6 +117,7 @@ const googleChatModels: AIChatModelCard[] = [
|
||||
id: 'gemini-2.5-flash-preview-05-20',
|
||||
maxOutput: 65_536,
|
||||
pricing: {
|
||||
cachedInput: 0.0375,
|
||||
input: 0.15,
|
||||
output: 3.5, // Thinking
|
||||
},
|
||||
@@ -162,6 +142,7 @@ const googleChatModels: AIChatModelCard[] = [
|
||||
id: 'gemini-2.5-flash-preview-04-17',
|
||||
maxOutput: 65_536,
|
||||
pricing: {
|
||||
cachedInput: 0.0375,
|
||||
input: 0.15,
|
||||
output: 3.5, // Thinking
|
||||
},
|
||||
@@ -187,7 +168,7 @@ const googleChatModels: AIChatModelCard[] = [
|
||||
maxOutput: 65_536,
|
||||
pricing: {
|
||||
input: 0.15,
|
||||
output: 3.5, // Thinking
|
||||
output: 3.5,
|
||||
},
|
||||
settings: {
|
||||
searchImpl: 'params',
|
||||
@@ -202,7 +183,7 @@ const googleChatModels: AIChatModelCard[] = [
|
||||
search: true,
|
||||
vision: true,
|
||||
},
|
||||
contextWindowTokens: 65_536 + 65_536,
|
||||
contextWindowTokens: 1_048_576 + 65_536,
|
||||
description:
|
||||
'Gemini 2.5 Flash-Lite Preview 是 Google 最小、性价比最高的模型,专为大规模使用而设计。',
|
||||
displayName: 'Gemini 2.5 Flash-Lite Preview 06-17',
|
||||
@@ -314,7 +295,6 @@ const googleChatModels: AIChatModelCard[] = [
|
||||
id: 'gemini-2.0-flash-lite',
|
||||
maxOutput: 8192,
|
||||
pricing: {
|
||||
cachedInput: 0.018_75,
|
||||
input: 0.075,
|
||||
output: 0.3,
|
||||
},
|
||||
@@ -331,7 +311,6 @@ const googleChatModels: AIChatModelCard[] = [
|
||||
id: 'gemini-2.0-flash-lite-001',
|
||||
maxOutput: 8192,
|
||||
pricing: {
|
||||
cachedInput: 0.018_75,
|
||||
input: 0.075,
|
||||
output: 0.3,
|
||||
},
|
||||
@@ -366,7 +345,6 @@ const googleChatModels: AIChatModelCard[] = [
|
||||
id: 'learnlm-2.0-flash-experimental',
|
||||
maxOutput: 32_768,
|
||||
pricing: {
|
||||
cachedInput: 0,
|
||||
input: 0,
|
||||
output: 0,
|
||||
},
|
||||
@@ -383,7 +361,6 @@ const googleChatModels: AIChatModelCard[] = [
|
||||
id: 'learnlm-1.5-pro-experimental',
|
||||
maxOutput: 8192,
|
||||
pricing: {
|
||||
cachedInput: 0,
|
||||
input: 0,
|
||||
output: 0,
|
||||
},
|
||||
@@ -408,23 +385,6 @@ const googleChatModels: AIChatModelCard[] = [
|
||||
releasedAt: '2024-09-25',
|
||||
type: 'chat',
|
||||
},
|
||||
{
|
||||
abilities: {
|
||||
functionCall: true,
|
||||
vision: true,
|
||||
},
|
||||
contextWindowTokens: 1_008_192,
|
||||
description: 'Gemini 1.5 Flash 001 是一款高效的多模态模型,支持广泛应用的扩展。',
|
||||
displayName: 'Gemini 1.5 Flash 001',
|
||||
id: 'gemini-1.5-flash-001', // Deprecated on 2025-05-27
|
||||
maxOutput: 8192,
|
||||
pricing: {
|
||||
cachedInput: 0.018_75,
|
||||
input: 0.075,
|
||||
output: 0.3,
|
||||
},
|
||||
type: 'chat',
|
||||
},
|
||||
{
|
||||
abilities: {
|
||||
functionCall: true,
|
||||
@@ -444,24 +404,6 @@ const googleChatModels: AIChatModelCard[] = [
|
||||
releasedAt: '2024-09-24',
|
||||
type: 'chat',
|
||||
},
|
||||
{
|
||||
abilities: {
|
||||
functionCall: true,
|
||||
vision: true,
|
||||
},
|
||||
contextWindowTokens: 2_008_192,
|
||||
description: 'Gemini 1.5 Pro 001 是可扩展的多模态AI解决方案,支持广泛的复杂任务。',
|
||||
displayName: 'Gemini 1.5 Pro 001 (Paid)',
|
||||
id: 'gemini-1.5-pro-001', // Deprecated on 2025-05-27
|
||||
maxOutput: 8192,
|
||||
pricing: {
|
||||
cachedInput: 0.3125,
|
||||
input: 1.25,
|
||||
output: 5,
|
||||
},
|
||||
releasedAt: '2024-02-15',
|
||||
type: 'chat',
|
||||
},
|
||||
{
|
||||
abilities: {
|
||||
functionCall: true,
|
||||
@@ -528,6 +470,18 @@ const googleChatModels: AIChatModelCard[] = [
|
||||
},
|
||||
type: 'chat',
|
||||
},
|
||||
{
|
||||
contextWindowTokens: 2048 + 8192,
|
||||
displayName: 'Gemma 3n E2B',
|
||||
id: 'gemma-3n-e2b-it',
|
||||
maxOutput: 2048,
|
||||
pricing: {
|
||||
cachedInput: 0,
|
||||
input: 0,
|
||||
output: 0,
|
||||
},
|
||||
type: 'chat',
|
||||
},
|
||||
{
|
||||
contextWindowTokens: 2048 + 8192,
|
||||
displayName: 'Gemma 3n E4B',
|
||||
|
||||
@@ -47,22 +47,6 @@ const groqChatModels: AIChatModelCard[] = [
|
||||
},
|
||||
type: 'chat',
|
||||
},
|
||||
{
|
||||
abilities: {
|
||||
functionCall: true,
|
||||
reasoning: true,
|
||||
},
|
||||
contextWindowTokens: 131_072,
|
||||
displayName: 'Qwen QwQ 32B',
|
||||
enabled: true,
|
||||
id: 'qwen-qwq-32b',
|
||||
maxOutput: 131_072,
|
||||
pricing: {
|
||||
input: 0.29,
|
||||
output: 0.39,
|
||||
},
|
||||
type: 'chat',
|
||||
},
|
||||
{
|
||||
abilities: {
|
||||
reasoning: true,
|
||||
|
||||
Some files were not shown because too many files have changed in this diff Show More
Reference in New Issue
Block a user