💄 style: Update siliconcloud models (#7072)

This commit is contained in:
sxjeru
2025-03-26 09:29:05 +08:00
committed by GitHub
parent a529da4e7a
commit 8a524d4a7b
4 changed files with 140 additions and 353 deletions
+49 -69
View File
@@ -26,6 +26,26 @@ const googleChatModels: AIChatModelCard[] = [
},
type: 'chat',
},
{
abilities: {
reasoning: true,
vision: true,
},
contextWindowTokens: 1_048_576 + 65_536,
description:
'Gemini 2.0 Flash Thinking Exp 是 Google 的实验性多模态推理AI模型,能对复杂问题进行推理,拥有新的思维能力。',
displayName: 'Gemini 2.0 Flash Thinking Experimental 01-21',
enabled: true,
id: 'gemini-2.0-flash-thinking-exp-01-21',
maxOutput: 65_536,
pricing: {
cachedInput: 0,
input: 0,
output: 0,
},
releasedAt: '2025-01-21',
type: 'chat',
},
{
abilities: {
functionCall: true,
@@ -101,41 +121,6 @@ const googleChatModels: AIChatModelCard[] = [
},
type: 'chat',
},
{
abilities: {
vision: true,
},
contextWindowTokens: 1_048_576 + 8192,
description: 'Gemini 2.0 Flash 模型变体,针对成本效益和低延迟等目标进行了优化。',
displayName: 'Gemini 2.0 Flash-Lite',
id: 'gemini-2.0-flash-lite',
maxOutput: 8192,
pricing: {
cachedInput: 0.018_75,
input: 0.075,
output: 0.3,
},
releasedAt: '2025-02-05',
type: 'chat',
},
{
abilities: {
imageOutput: true,
vision: true,
},
contextWindowTokens: 32_768,
description: 'Gemini 2.0 Flash 模型变体,针对成本效益和低延迟等目标进行了优化。',
displayName: 'Gemini 2.0 Flash Exp',
enabled: true,
id: 'gemini-2.0-flash-exp',
maxOutput: 8192,
pricing: {
input: 0,
output: 0,
},
releasedAt: '2025-02-05',
type: 'chat',
},
{
abilities: {
imageOutput: true,
@@ -154,6 +139,23 @@ const googleChatModels: AIChatModelCard[] = [
releasedAt: '2025-03-14',
type: 'chat',
},
{
abilities: {
vision: true,
},
contextWindowTokens: 1_048_576 + 8192,
description: 'Gemini 2.0 Flash 模型变体,针对成本效益和低延迟等目标进行了优化。',
displayName: 'Gemini 2.0 Flash-Lite',
id: 'gemini-2.0-flash-lite',
maxOutput: 8192,
pricing: {
cachedInput: 0.018_75,
input: 0.075,
output: 0.3,
},
releasedAt: '2025-02-05',
type: 'chat',
},
{
abilities: {
vision: true,
@@ -173,41 +175,19 @@ const googleChatModels: AIChatModelCard[] = [
},
{
abilities: {
reasoning: true,
imageOutput: true,
vision: true,
},
contextWindowTokens: 1_048_576 + 65_536,
description:
'Gemini 2.0 Flash Thinking Exp 是 Google 的实验性多模态推理AI模型,能对复杂问题进行推理,拥有新的思维能力。',
displayName: 'Gemini 2.0 Flash Thinking Experimental',
id: 'gemini-2.0-flash-thinking-exp',
maxOutput: 65_536,
contextWindowTokens: 32_768,
description: 'Gemini 2.0 Flash 模型变体,针对成本效益和低延迟等目标进行了优化。',
displayName: 'Gemini 2.0 Flash Exp',
id: 'gemini-2.0-flash-exp',
maxOutput: 8192,
pricing: {
cachedInput: 0,
input: 0,
output: 0,
},
releasedAt: '2025-01-21',
type: 'chat',
},
{
abilities: {
reasoning: true,
vision: true,
},
contextWindowTokens: 1_048_576 + 65_536,
description:
'Gemini 2.0 Flash Thinking Exp 是 Google 的实验性多模态推理AI模型,能对复杂问题进行推理,拥有新的思维能力。',
displayName: 'Gemini 2.0 Flash Thinking Experimental 01-21',
enabled: true,
id: 'gemini-2.0-flash-thinking-exp-01-21',
maxOutput: 65_536,
pricing: {
cachedInput: 0,
input: 0,
output: 0,
},
releasedAt: '2025-01-21',
releasedAt: '2025-02-05',
type: 'chat',
},
{
@@ -237,7 +217,7 @@ const googleChatModels: AIChatModelCard[] = [
contextWindowTokens: 1_008_192,
description: 'Gemini 1.5 Flash 002 是一款高效的多模态模型,支持广泛应用的扩展。',
displayName: 'Gemini 1.5 Flash 002',
id: 'gemini-1.5-flash-002',
id: 'gemini-1.5-flash-002', // Deprecated on 2025-09-24
maxOutput: 8192,
pricing: {
cachedInput: 0.018_75,
@@ -255,7 +235,7 @@ const googleChatModels: AIChatModelCard[] = [
contextWindowTokens: 1_008_192,
description: 'Gemini 1.5 Flash 001 是一款高效的多模态模型,支持广泛应用的扩展。',
displayName: 'Gemini 1.5 Flash 001',
id: 'gemini-1.5-flash-001',
id: 'gemini-1.5-flash-001', // Deprecated on 2025-05-27
maxOutput: 8192,
pricing: {
cachedInput: 0.018_75,
@@ -273,7 +253,7 @@ const googleChatModels: AIChatModelCard[] = [
description:
'Gemini 1.5 Pro 002 是最新的生产就绪模型,提供更高质量的输出,特别在数学、长上下文和视觉任务方面有显著提升。',
displayName: 'Gemini 1.5 Pro 002',
id: 'gemini-1.5-pro-002',
id: 'gemini-1.5-pro-002', // Deprecated on 2025-09-24
maxOutput: 8192,
pricing: {
cachedInput: 0.315,
@@ -291,7 +271,7 @@ const googleChatModels: AIChatModelCard[] = [
contextWindowTokens: 2_008_192,
description: 'Gemini 1.5 Pro 001 是可扩展的多模态AI解决方案,支持广泛的复杂任务。',
displayName: 'Gemini 1.5 Pro 001',
id: 'gemini-1.5-pro-001',
id: 'gemini-1.5-pro-001', // Deprecated on 2025-05-27
maxOutput: 8192,
pricing: {
cachedInput: 0.875,
@@ -309,7 +289,7 @@ const googleChatModels: AIChatModelCard[] = [
contextWindowTokens: 1_008_192,
description: 'Gemini 1.5 Flash 8B 是一款高效的多模态模型,支持广泛应用的扩展。',
displayName: 'Gemini 1.5 Flash 8B',
id: 'gemini-1.5-flash-8b',
id: 'gemini-1.5-flash-8b-latest',
maxOutput: 8192,
pricing: {
cachedInput: 0.02,
+11
View File
@@ -198,6 +198,17 @@ const novitaChatModels: AIChatModelCard[] = [
},
type: 'chat',
},
{
contextWindowTokens: 64_000,
displayName: 'Deepseek V3 0324',
enabled: true,
id: 'deepseek/deepseek-v3-0324',
pricing: {
input: 1.2,
output: 1.2,
},
type: 'chat',
},
{
abilities: {
reasoning: true,
+68 -269
View File
@@ -5,6 +5,7 @@ import { AIChatModelCard } from '@/types/aiModel';
const siliconcloudChatModels: AIChatModelCard[] = [
{
abilities: {
functionCall: true,
reasoning: true,
},
contextWindowTokens: 65_536,
@@ -22,14 +23,12 @@ const siliconcloudChatModels: AIChatModelCard[] = [
},
{
abilities: {
// Not support tool use, ref: https://cloud.siliconflow.cn/models?target=deepseek-ai%2FDeepSeek-V3
functionCall: false,
functionCall: true,
},
contextWindowTokens: 65_536,
description:
'DeepSeek-V3 是一款拥有 6710 亿参数的混合专家(MoE)语言模型,采用多头潜在注意力(MLA)和 DeepSeekMoE 架构,结合无辅助损失的负载平衡策略,优化推理和训练效率。通过在 14.8 万亿高质量tokens上预训练,并进行监督微调和强化学习,DeepSeek-V3 在性能上超越其他开源模型,接近领先闭源模型。',
displayName: 'DeepSeek V3',
enabled: true,
id: 'deepseek-ai/DeepSeek-V3',
pricing: {
currency: 'CNY',
@@ -40,6 +39,7 @@ const siliconcloudChatModels: AIChatModelCard[] = [
},
{
abilities: {
functionCall: true,
reasoning: true,
},
contextWindowTokens: 65_536,
@@ -70,23 +70,6 @@ const siliconcloudChatModels: AIChatModelCard[] = [
},
type: 'chat',
},
{
abilities: {
reasoning: true
},
contextWindowTokens: 32_768,
description:
"DeepSeek-R1-Distill-Llama-70B 是基于 Llama-3.3-70B-Instruct 经过蒸馏训练得到的模型。该模型是 DeepSeek-R1 系列的一部分,通过使用 DeepSeek-R1 生成的样本进行微调,在数学、编程和推理等多个领域展现出优秀的性能。模型在 AIME 2024、MATH-500、GPQA Diamond 等多个基准测试中都取得了优异的成绩,显示出强大的推理能力。",
displayName: "DeepSeek R1 Distill Llama 70B",
enabled: true,
id: "deepseek-ai/DeepSeek-R1-Distill-Llama-70B",
pricing: {
currency: "CNY",
input: 4.13,
output: 4.13
},
type: "chat"
},
{
abilities: {
reasoning: true
@@ -95,7 +78,6 @@ const siliconcloudChatModels: AIChatModelCard[] = [
description:
"DeepSeek-R1-Distill-Qwen-32B 是基于 Qwen2.5-32B 通过知识蒸馏得到的模型。该模型使用 DeepSeek-R1 生成的 80 万个精选样本进行微调,在数学、编程和推理等多个领域展现出卓越的性能。在 AIME 2024、MATH-500、GPQA Diamond 等多个基准测试中都取得了优异成绩,其中在 MATH-500 上达到了 94.3% 的准确率,展现出强大的数学推理能力。",
displayName: "DeepSeek R1 Distill Qwen 32B",
enabled: true,
id: "deepseek-ai/DeepSeek-R1-Distill-Qwen-32B",
pricing: {
currency: "CNY",
@@ -120,23 +102,6 @@ const siliconcloudChatModels: AIChatModelCard[] = [
},
type: "chat"
},
{
abilities: {
reasoning: true
},
contextWindowTokens: 32_768,
description:
"DeepSeek-R1-Distill-Llama-8B 是基于 Llama-3.1-8B 开发的蒸馏模型。该模型使用 DeepSeek-R1 生成的样本进行微调,展现出优秀的推理能力。在多个基准测试中表现不俗,其中在 MATH-500 上达到了 89.1% 的准确率,在 AIME 2024 上达到了 50.4% 的通过率,在 CodeForces 上获得了 1205 的评分,作为 8B 规模的模型展示了较强的数学和编程能力。",
displayName: "DeepSeek R1 Distill Llama 8B (Free)",
enabled: true,
id: "deepseek-ai/DeepSeek-R1-Distill-Llama-8B",
pricing: {
currency: "CNY",
input: 0,
output: 0
},
type: "chat"
},
{
abilities: {
reasoning: true
@@ -145,7 +110,6 @@ const siliconcloudChatModels: AIChatModelCard[] = [
description:
"DeepSeek-R1-Distill-Qwen-7B 是基于 Qwen2.5-Math-7B 通过知识蒸馏得到的模型。该模型使用 DeepSeek-R1 生成的 80 万个精选样本进行微调,展现出优秀的推理能力。在多个基准测试中表现出色,其中在 MATH-500 上达到了 92.8% 的准确率,在 AIME 2024 上达到了 55.5% 的通过率,在 CodeForces 上获得了 1189 的评分,作为 7B 规模的模型展示了较强的数学和编程能力。",
displayName: "DeepSeek R1 Distill Qwen 7B (Free)",
enabled: true,
id: "deepseek-ai/DeepSeek-R1-Distill-Qwen-7B",
pricing: {
currency: "CNY",
@@ -170,6 +134,38 @@ const siliconcloudChatModels: AIChatModelCard[] = [
},
type: "chat"
},
{
abilities: {
reasoning: true
},
contextWindowTokens: 32_768,
description:
"DeepSeek-R1-Distill-Qwen-7B 是基于 Qwen2.5-Math-7B 通过知识蒸馏得到的模型。该模型使用 DeepSeek-R1 生成的 80 万个精选样本进行微调,展现出优秀的推理能力。在多个基准测试中表现出色,其中在 MATH-500 上达到了 92.8% 的准确率,在 AIME 2024 上达到了 55.5% 的通过率,在 CodeForces 上获得了 1189 的评分,作为 7B 规模的模型展示了较强的数学和编程能力。",
displayName: "DeepSeek R1 Distill Qwen 7B (Pro)",
id: "Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B",
pricing: {
currency: "CNY",
input: 0.35,
output: 0.35
},
type: "chat",
},
{
abilities: {
reasoning: true
},
contextWindowTokens: 32_768,
description:
"DeepSeek-R1-Distill-Qwen-1.5B 是基于 Qwen2.5-Math-1.5B 通过知识蒸馏得到的模型。该模型使用 DeepSeek-R1 生成的 80 万个精选样本进行微调,在多个基准测试中展现出不错的性能。作为一个轻量级模型,在 MATH-500 上达到了 83.9% 的准确率,在 AIME 2024 上达到了 28.9% 的通过率,在 CodeForces 上获得了 954 的评分,显示出超出其参数规模的推理能力。",
displayName: "DeepSeek-R1-Distill-Qwen-1.5B (Pro)",
id: "Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B",
pricing: {
currency: "CNY",
input: 0.14,
output: 0.14
},
type: "chat"
},
{
abilities: {
functionCall: true,
@@ -261,7 +257,6 @@ const siliconcloudChatModels: AIChatModelCard[] = [
description:
'Qwen2.5-7B-Instruct 是阿里云发布的最新大语言模型系列之一。该 7B 模型在编码和数学等领域具有显著改进的能力。该模型还提供了多语言支持,覆盖超过 29 种语言,包括中文、英文等。模型在指令跟随、理解结构化数据以及生成结构化输出(尤其是 JSON)方面都有显著提升',
displayName: 'Qwen2.5 7B Instruct (Free)',
enabled: true,
id: 'Qwen/Qwen2.5-7B-Instruct',
pricing: {
currency: 'CNY',
@@ -270,19 +265,6 @@ const siliconcloudChatModels: AIChatModelCard[] = [
},
type: 'chat',
},
{
contextWindowTokens: 32_768,
description:
'Qwen2.5-7B-Instruct 是阿里云发布的最新大语言模型系列之一。该 7B 模型在编码和数学等领域具有显著改进的能力。该模型还提供了多语言支持,覆盖超过 29 种语言,包括中文、英文等。模型在指令跟随、理解结构化数据以及生成结构化输出(尤其是 JSON)方面都有显著提升',
displayName: 'Qwen2.5 7B Instruct (LoRA)',
id: 'LoRA/Qwen/Qwen2.5-7B-Instruct',
pricing: {
currency: 'CNY',
input: 0.53,
output: 0.53,
},
type: 'chat',
},
{
abilities: {
functionCall: true,
@@ -347,19 +329,6 @@ const siliconcloudChatModels: AIChatModelCard[] = [
},
type: 'chat',
},
{
contextWindowTokens: 32_768,
description:
'Qwen2.5-72B-Instruct 是阿里云发布的最新大语言模型系列之一。该 72B 模型在编码和数学等领域具有显著改进的能力。该模型还提供了多语言支持,覆盖超过 29 种语言,包括中文、英文等。模型在指令跟随、理解结构化数据以及生成结构化输出(尤其是 JSON)方面都有显著提升',
displayName: 'Qwen2.5 72B Instruct (LoRA)',
id: 'LoRA/Qwen/Qwen2.5-72B-Instruct',
pricing: {
currency: 'CNY',
input: 6.2,
output: 6.2,
},
type: 'chat',
},
{
abilities: {
functionCall: true,
@@ -508,7 +477,6 @@ const siliconcloudChatModels: AIChatModelCard[] = [
description:
'Qwen2-VL 是 Qwen-VL 模型的最新迭代版本,在视觉理解基准测试中达到了最先进的性能,包括 MathVista、DocVQA、RealWorldQA 和 MTVQA 等。Qwen2-VL 能够理解超过 20 分钟的视频,用于高质量的基于视频的问答、对话和内容创作。它还具备复杂推理和决策能力,可以与移动设备、机器人等集成,基于视觉环境和文本指令进行自动操作。除了英语和中文,Qwen2-VL 现在还支持理解图像中不同语言的文本,包括大多数欧洲语言、日语、韩语、阿拉伯语和越南语等',
displayName: 'Qwen2 VL 72B Instruct',
enabled: true,
id: 'Qwen/Qwen2-VL-72B-Instruct',
pricing: {
currency: 'CNY',
@@ -517,6 +485,39 @@ const siliconcloudChatModels: AIChatModelCard[] = [
},
type: 'chat',
},
{
abilities: {
vision: true,
},
contextWindowTokens: 32_768,
description:
'Qwen2.5-VL 是 Qwen 系列的新成员,具备强大的视觉理解能力,能分析图像中的文本、图表和布局,并能理解长视频和捕捉事件,它可以进行推理、操作工具,支持多格式物体定位和生成结构化输出,优化了视频理解的动态分辨率与帧率训练,并提升了视觉编码器效率。',
displayName: 'Qwen2.5 VL 7B Instruct (Pro)',
id: 'Pro/Qwen/Qwen2.5-VL-7B-Instruct',
pricing: {
currency: 'CNY',
input: 0.35,
output: 0.35,
},
type: 'chat',
},
{
abilities: {
vision: true,
},
contextWindowTokens: 32_768,
description:
'Qwen2.5-VL 是 Qwen2.5 系列中的视觉语言模型。该模型在多方面有显著提升:具备更强的视觉理解能力,能够识别常见物体、分析文本、图表和布局;作为视觉代理能够推理并动态指导工具使用;支持理解超过 1 小时的长视频并捕捉关键事件;能够通过生成边界框或点准确定位图像中的物体;支持生成结构化输出,尤其适用于发票、表格等扫描数据。',
displayName: 'Qwen2.5 VL 72B Instruct',
enabled: true,
id: 'Qwen/Qwen2.5-VL-72B-Instruct',
pricing: {
currency: 'CNY',
input: 4.13,
output: 4.13,
},
type: 'chat',
},
{
abilities: {
functionCall: true,
@@ -549,38 +550,6 @@ const siliconcloudChatModels: AIChatModelCard[] = [
},
type: 'chat',
},
{
abilities: {
vision: true,
},
contextWindowTokens: 32_768,
description:
'InternVL2-8B 是 InternVL 2.0 系列多模态大语言模型中的一员。该模型由 InternViT-300M-448px 视觉模型、MLP 投影层和 internlm2_5-7b-chat 语言模型组成。它在各种视觉语言任务上展现出了卓越的性能,包括文档和图表理解、场景文本理解、OCR、科学和数学问题解决等。InternVL2-8B 使用 8K 上下文窗口训练,能够处理长文本、多图像和视频输入,显著提升了模型在这些任务上的处理能力',
displayName: 'InternVL2 8B (Pro)',
id: 'Pro/OpenGVLab/InternVL2-8B',
pricing: {
currency: 'CNY',
input: 0.35,
output: 0.35,
},
type: 'chat',
},
{
abilities: {
vision: true,
},
contextWindowTokens: 32_768,
description:
'InternVL2-26B 是 InternVL 2.0 系列多模态大语言模型中的一员。该模型由 InternViT-6B-448px-V1-5 视觉模型、MLP 投影层和 internlm2-chat-20b 语言模型组成。它在各种视觉语言任务上展现出了卓越的性能,包括文档和图表理解、场景文本理解、OCR、科学和数学问题解决等。InternVL2-26B 使用 8K 上下文窗口训练,能够处理长文本、多图像和视频输入,显著提升了模型在这些任务上的处理能力',
displayName: 'InternVL2 26B',
id: 'OpenGVLab/InternVL2-26B',
pricing: {
currency: 'CNY',
input: 1,
output: 1,
},
type: 'chat',
},
{
abilities: {
functionCall: true,
@@ -626,160 +595,6 @@ const siliconcloudChatModels: AIChatModelCard[] = [
},
type: 'chat',
},
{
contextWindowTokens: 4096,
description:
'Yi-1.5-6B-Chat 是 Yi-1.5 系列的一个变体,属于开源聊天模型。Yi-1.5 是 Yi 的升级版本,在 500B 个高质量语料上进行了持续预训练,并在 3M 多样化的微调样本上进行了微调。相比于 Yi,Yi-1.5 在编码、数学、推理和指令遵循能力方面表现更强,同时保持了出色的语言理解、常识推理和阅读理解能力。该模型具有 4K、16K 和 32K 的上下文长度版本,预训练总量达到 3.6T 个 token',
displayName: 'Yi-1.5 6B Chat (Free)',
id: '01-ai/Yi-1.5-6B-Chat',
pricing: {
currency: 'CNY',
input: 0,
output: 0,
},
type: 'chat',
},
{
contextWindowTokens: 16_384,
description:
'Yi-1.5-9B-Chat-16K 是 Yi-1.5 系列的一个变体,属于开源聊天模型。Yi-1.5 是 Yi 的升级版本,在 500B 个高质量语料上进行了持续预训练,并在 3M 多样化的微调样本上进行了微调。相比于 Yi,Yi-1.5 在编码、数学、推理和指令遵循能力方面表现更强,同时保持了出色的语言理解、常识推理和阅读理解能力。该模型在同等规模的开源模型中表现最佳',
displayName: 'Yi-1.5 9B Chat 16K (Free)',
id: '01-ai/Yi-1.5-9B-Chat-16K',
pricing: {
currency: 'CNY',
input: 0,
output: 0,
},
type: 'chat',
},
{
contextWindowTokens: 16_384,
description:
'Yi-1.5-34B-Chat-16K 是 Yi-1.5 系列的一个变体,属于开源聊天模型。Yi-1.5 是 Yi 的升级版本,在 500B 个高质量语料上进行了持续预训练,并在 3M 多样化的微调样本上进行了微调。相比于 Yi,Yi-1.5 在编码、数学、推理和指令遵循能力方面表现更强,同时保持了出色的语言理解、常识推理和阅读理解能力。该模型在大多数基准测试中与更大的模型相当或表现更佳,具有 16K 的上下文长度',
displayName: 'Yi-1.5 34B Chat 16K',
id: '01-ai/Yi-1.5-34B-Chat-16K',
pricing: {
currency: 'CNY',
input: 1.26,
output: 1.26,
},
type: 'chat',
},
{
contextWindowTokens: 8192,
description:
'Gemma 是 Google 开发的轻量级、最先进的开放模型系列之一。它是一个仅解码器的大型语言模型,支持英语,提供开放权重、预训练变体和指令微调变体。Gemma 模型适用于各种文本生成任务,包括问答、摘要和推理。该 9B 模型是通过 8 万亿个 tokens 训练而成。其相对较小的规模使其可以在资源有限的环境中部署,如笔记本电脑、台式机或您自己的云基础设施,从而使更多人能够访问最先进的 AI 模型并促进创新',
displayName: 'Gemma 2 9B (Free)',
id: 'google/gemma-2-9b-it',
pricing: {
currency: 'CNY',
input: 0,
output: 0,
},
type: 'chat',
},
{
contextWindowTokens: 8192,
description:
'Gemma 是 Google 开发的轻量级、最先进的开放模型系列之一。它是一个仅解码器的大型语言模型,支持英语,提供开放权重、预训练变体和指令微调变体。Gemma 模型适用于各种文本生成任务,包括问答、摘要和推理。该 9B 模型是通过 8 万亿个 tokens 训练而成。其相对较小的规模使其可以在资源有限的环境中部署,如笔记本电脑、台式机或您自己的云基础设施,从而使更多人能够访问最先进的 AI 模型并促进创新',
displayName: 'Gemma 2 9B (Pro)',
id: 'Pro/google/gemma-2-9b-it',
pricing: {
currency: 'CNY',
input: 0.6,
output: 0.6,
},
type: 'chat',
},
{
contextWindowTokens: 8192,
description:
'Gemma 是由 Google 开发的轻量级、最先进的开放模型系列,采用与 Gemini 模型相同的研究和技术构建。这些模型是仅解码器的大型语言模型,支持英语,提供预训练和指令微调两种变体的开放权重。Gemma 模型适用于各种文本生成任务,包括问答、摘要和推理。其相对较小的规模使其能够部署在资源有限的环境中,如笔记本电脑、台式机或个人云基础设施,从而让所有人都能获得最先进的 AI 模型,促进创新',
displayName: 'Gemma 2 27B',
id: 'google/gemma-2-27b-it',
pricing: {
currency: 'CNY',
input: 1.26,
output: 1.26,
},
type: 'chat',
},
{
abilities: {
functionCall: true,
},
contextWindowTokens: 32_768,
description:
'Meta Llama 3.1 是由 Meta 开发的多语言大型语言模型家族,包括 8B、70B 和 405B 三种参数规模的预训练和指令微调变体。该 8B 指令微调模型针对多语言对话场景进行了优化,在多项行业基准测试中表现优异。模型训练使用了超过 15 万亿个 tokens 的公开数据,并采用了监督微调和人类反馈强化学习等技术来提升模型的有用性和安全性。Llama 3.1 支持文本生成和代码生成,知识截止日期为 2023 年 12 月',
displayName: 'Llama 3.1 8B Instruct (Free)',
id: 'meta-llama/Meta-Llama-3.1-8B-Instruct',
pricing: {
currency: 'CNY',
input: 0,
output: 0,
},
type: 'chat',
},
{
contextWindowTokens: 32_768,
description:
'Meta Llama 3.1 是由 Meta 开发的多语言大型语言模型家族,包括 8B、70B 和 405B 三种参数规模的预训练和指令微调变体。该 8B 指令微调模型针对多语言对话场景进行了优化,在多项行业基准测试中表现优异。模型训练使用了超过 15 万亿个 tokens 的公开数据,并采用了监督微调和人类反馈强化学习等技术来提升模型的有用性和安全性。Llama 3.1 支持文本生成和代码生成,知识截止日期为 2023 年 12 月',
displayName: 'Llama 3.1 8B Instruct (Pro)',
id: 'Pro/meta-llama/Meta-Llama-3.1-8B-Instruct',
pricing: {
currency: 'CNY',
input: 0.42,
output: 0.42,
},
type: 'chat',
},
{
abilities: {
functionCall: true,
},
contextWindowTokens: 32_768,
description:
'Meta Llama 3.1 是由 Meta 开发的多语言大型语言模型家族,包括 8B、70B 和 405B 三种参数规模的预训练和指令微调变体。该 70B 指令微调模型针对多语言对话场景进行了优化,在多项行业基准测试中表现优异。模型训练使用了超过 15 万亿个 tokens 的公开数据,并采用了监督微调和人类反馈强化学习等技术来提升模型的有用性和安全性。Llama 3.1 支持文本生成和代码生成,知识截止日期为 2023 年 12 月',
displayName: 'Llama 3.1 70B Instruct',
id: 'meta-llama/Meta-Llama-3.1-70B-Instruct',
pricing: {
currency: 'CNY',
input: 4.13,
output: 4.13,
},
type: 'chat',
},
{
contextWindowTokens: 32_768,
description:
'Meta Llama 3.1 是由 Meta 开发的多语言大型语言模型家族,包括 8B、70B 和 405B 三种参数规模的预训练和指令微调变体。该 405B 指令微调模型针对多语言对话场景进行了优化,在多项行业基准测试中表现优异。模型训练使用了超过 15 万亿个 tokens 的公开数据,并采用了监督微调和人类反馈强化学习等技术来提升模型的有用性和安全性。Llama 3.1 支持文本生成和代码生成,知识截止日期为 2023 年 12 月',
displayName: 'Llama 3.1 405B Instruct',
enabled: true,
id: 'meta-llama/Meta-Llama-3.1-405B-Instruct',
pricing: {
currency: 'CNY',
input: 21,
output: 21,
},
type: 'chat',
},
{
abilities: {
functionCall: true,
},
contextWindowTokens: 32_768,
description:
'Llama 3.3 是 Llama 系列最先进的多语言开源大型语言模型,以极低成本体验媲美 405B 模型的性能。基于 Transformer 结构,并通过监督微调(SFT)和人类反馈强化学习(RLHF)提升有用性和安全性。其指令调优版本专为多语言对话优化,在多项行业基准上表现优于众多开源和封闭聊天模型。知识截止日期为 2023 年 12 月',
displayName: 'Llama 3.3 70B Instruct',
enabled: true,
id: 'meta-llama/Llama-3.3-70B-Instruct',
pricing: {
currency: 'CNY',
input: 4.13,
output: 4.13,
},
type: 'chat',
},
{
contextWindowTokens: 8192,
description:
@@ -793,22 +608,6 @@ const siliconcloudChatModels: AIChatModelCard[] = [
},
type: 'chat',
},
{
abilities: {
vision: true,
},
contextWindowTokens: 32_768,
description:
'TeleMM多模态大模型是由中国电信自主研发的多模态理解大模型,能够处理文本、图像等多种模态输入,支持图像理解、图表分析等功能,为用户提供跨模态的理解服务。模型能够与用户进行多模态交互,准确理解输入内容,回答问题、协助创作,并高效提供多模态信息和灵感支持。在细粒度感知,逻辑推理等多模态任务上有出色表现',
displayName: 'TeleMM',
id: 'TeleAI/TeleMM',
pricing: {
currency: 'CNY',
input: 1.33,
output: 1.33,
},
type: 'chat',
},
];
export const allModels = [...siliconcloudChatModels];
+12 -15
View File
@@ -6,6 +6,7 @@ import { AIChatModelCard } from '@/types/aiModel';
const doubaoChatModels: AIChatModelCard[] = [
{
abilities: {
functionCall: true,
reasoning: true,
},
config: {
@@ -17,7 +18,7 @@ const doubaoChatModels: AIChatModelCard[] = [
displayName: 'DeepSeek R1',
enabled: true,
id: 'deepseek-r1',
maxOutput: 8000,
maxOutput: 16_384,
pricing: {
currency: 'CNY',
input: 4,
@@ -27,6 +28,7 @@ const doubaoChatModels: AIChatModelCard[] = [
},
{
abilities: {
functionCall: true,
reasoning: true,
},
config: {
@@ -37,7 +39,7 @@ const doubaoChatModels: AIChatModelCard[] = [
'DeepSeek-R1-Distill 模型是在开源模型的基础上通过微调训练得到的,训练过程中使用了由 DeepSeek-R1 生成的样本数据。',
displayName: 'DeepSeek R1 Distill Qwen 32B',
id: 'deepseek-r1-distill-qwen-32b',
maxOutput: 8000,
maxOutput: 8192,
pricing: {
currency: 'CNY',
input: 1.5,
@@ -47,6 +49,7 @@ const doubaoChatModels: AIChatModelCard[] = [
},
{
abilities: {
functionCall: true,
reasoning: true,
},
config: {
@@ -57,7 +60,7 @@ const doubaoChatModels: AIChatModelCard[] = [
'DeepSeek-R1-Distill 模型是在开源模型的基础上通过微调训练得到的,训练过程中使用了由 DeepSeek-R1 生成的样本数据。',
displayName: 'DeepSeek R1 Distill Qwen 7B',
id: 'deepseek-r1-distill-qwen-7b',
maxOutput: 8000,
maxOutput: 8192,
pricing: {
currency: 'CNY',
input: 0.6,
@@ -67,8 +70,7 @@ const doubaoChatModels: AIChatModelCard[] = [
},
{
abilities: {
// FC not supported yet, ref: https://www.volcengine.com/docs/82379/1262342#8c325d45
functionCall: false,
functionCall: true,
},
config: {
deploymentName: 'deepseek-v3-241226',
@@ -77,9 +79,8 @@ const doubaoChatModels: AIChatModelCard[] = [
description:
'DeepSeek-V3 是一款由深度求索公司自研的MoE模型。DeepSeek-V3 多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型,并在性能上和世界顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。',
displayName: 'DeepSeek V3',
enabled: true,
id: 'deepseek-v3',
maxOutput: 8000,
maxOutput: 16_384,
pricing: {
currency: 'CNY',
input: 2,
@@ -100,7 +101,7 @@ const doubaoChatModels: AIChatModelCard[] = [
displayName: 'Doubao 1.5 Pro 32k',
enabled: true,
id: 'doubao-1.5-pro-32k',
maxOutput: 12_000,
maxOutput: 12_288,
pricing: {
currency: 'CNY',
input: 0.8,
@@ -109,9 +110,6 @@ const doubaoChatModels: AIChatModelCard[] = [
type: 'chat',
},
{
abilities: {
functionCall: true,
},
config: {
deploymentName: 'doubao-1-5-pro-256k-250115',
},
@@ -119,9 +117,8 @@ const doubaoChatModels: AIChatModelCard[] = [
description:
'Doubao-1.5-pro-256k 基于 Doubao-1.5-Pro 全面升级版,整体效果大幅提升 10%。支持 256k 上下文窗口的推理,输出长度支持最大 12k tokens。更高性能、更大窗口、超高性价比,适用于更广泛的应用场景。',
displayName: 'Doubao 1.5 Pro 256k',
enabled: true,
id: 'doubao-1.5-pro-256k',
maxOutput: 12_000,
maxOutput: 12_288,
pricing: {
currency: 'CNY',
input: 5,
@@ -142,7 +139,7 @@ const doubaoChatModels: AIChatModelCard[] = [
displayName: 'Doubao 1.5 Lite 32k',
enabled: true,
id: 'doubao-1.5-lite-32k',
maxOutput: 12_000,
maxOutput: 12_288,
pricing: {
currency: 'CNY',
input: 0.3,
@@ -163,7 +160,7 @@ const doubaoChatModels: AIChatModelCard[] = [
displayName: 'Doubao 1.5 Vision Pro 32k',
enabled: true,
id: 'Doubao-1.5-vision-pro-32k',
maxOutput: 12_000,
maxOutput: 12_288,
pricing: {
currency: 'CNY',
input: 3,