当前分类 · 可选模型
DeepSeek V4 Pro
文本
价格:
/Token每万
input:0.00739
output:0.01479
DeepSeek 最新推理模型,支持 enable_thinking 与 reasoning_effort;按输入/输出Token计费。
千问-文生图
图像
价格:
0.51000 /张
千问-文生图模型(Qwen-Image)是一款通用图像生成模型,支持多种艺术风格,尤其擅长复杂文本渲染。模型支持多行布局、段落级文本生成以及细粒度细节刻画,可实现复杂的图文混合布局设计。
图像翻译 · 千问MT
图像
价格:
0.00510 /张
基于 qwen-mt-image,异步翻译图片中的文本并保持排版。
GPT-Image-2-All 文生图/编辑
图像
价格:
0.29250 /张
GPT 图像生成 ChatGPT 网页版官逆模型 gpt-image-2-all,约 30–60 秒出图,支持文生图、多图融合编辑、自然语言改图,文字还原度高、中文提示词友好。勿传 size/n/quality。
Tripo 3D 模型生成
图像
价格:
/piece
Tripo-P1.0|text-to-3d|no_texture:2.10000
Tripo-P1.0|image-to-3d|no_texture:2.80000
Tripo-P1.0|multi-image-to-3d|no_texture:2.80000
Tripo-P1.0|text-to-3d|standard:2.80000
Tripo-P1.0|image-to-3d|standard:3.50000
Tripo-P1.0|multi-image-to-3d|standard:3.50000
Tripo-P1.0|text-to-3d|detailed:3.50000
Tripo-P1.0|image-to-3d|detailed:4.20000
Tripo-P1.0|multi-image-to-3d|detailed:4.20000
Tripo 3D:支持文生3D、单图生3D、多图生3D(2~4张)。异步任务,结果含 GLB 与预览图(CDN 链接约2小时有效)。
图文续生视频 · 万相2.7
视频生成
价格:
/秒
720P:0.85000
1080P:1.36000
基于 wan2.7-t2v-2026-04-25,异步生成视频;提交后由后台轮询拉取结果。
图生视频
视频生成
价格:
/秒
720P:0.85000
1080P:1.36000
基于 wan2.7-i2v-2026-04-25,支持首帧/首尾帧/续写;异步生成视频,提交后后台轮询拉取结果并按秒计费。
数字人-图片+声音合成
视频生成
价格:
/秒
480P:0.85000
720P:1.53000
基于 wan2.2-s2v,输入单张图片+音频生成数字人视频;异步任务,按成功输出秒数计费。
数字人-生成人脸动态视频
视频生成
价格:
/秒
1:1:0.13600
3:4:0.27200
基于人物肖像图片和人声音频,生成人脸动态视频
纯文字生视频 · PixVerse C1
视频生成
价格:
/秒
360P_NO_AUDIO:0.42500
360P_AUDIO:0.55250
540P_NO_AUDIO:0.59500
540P_AUDIO:0.77350
720P_NO_AUDIO:0.85000
720P_AUDIO:1.10500
1080P_NO_AUDIO:1.36000
1080P_AUDIO:1.76800
基于 pixverse/pixverse-c1-t2v,异步生成视频;支持有声/无声,提交后由后台轮询拉取结果。
文生视频 · Veo 3.1
视频生成
价格:
/次
veo-3.1:2.43750
veo-3.1-fl:2.43750
veo-3.1-fast:1.46250
veo-3.1-fast-fl:1.46250
veo-3.1-landscape:2.43750
veo-3.1-landscape-fl:2.43750
veo-3.1-landscape-fast:1.46250
veo-3.1-landscape-fast-fl:1.46250
Veo 3.1 异步视频(apiyi);档位对应上游 model;参考图需选 -fl 变体。
语音合成-系统音色
音频
价格:
3.40000 /Token每万
语音合成-千问提供多种拟人音色,支持多语言及方言,并可在同一音色下输出多语言内容。系统可自适应语气,流畅处理复杂文本。
提示:源语种或目标语种必须至少有一种是中文或英文。不支持在两个非中、英语种之间直接翻译(例如:日语 → 韩语)。
图像翻译为异步任务,提交后请稍候;完成后自动写入会话