GPT-Image2 生图教程
GPT-Image2 生图教程
GPT-Image2 是平台主力图像生成模型,适合 产品图、海报、运营图、UI 原型、4K 商用图。它通过同一个生图接口同时支持文生图和图生图,平台已经在服务端预置了一批便利能力(默认高质量、尺寸自适应、4K 关键词自动放大、本地拖图自动上传等),客户侧只需要写好提示词就能出图。
接入结论
- API Base URL:
https://www.yuzhixiaolongxia.com/v1 - 文生图 / 图生图:
POST /images/generations - 图片编辑:
POST /images/edits - 认证方式:
Authorization: Bearer <你的 GPT-Image2 令牌> - 模型 ID:
image2或gpt-image-2(两个都可用,平台自动归一) - 令牌分组:
GPT-Image2 - 模型 ID / 价格:以 模型广场 实际显示为准
6 种典型用法
| 场景 | 怎么用 | 要点 |
|---|---|---|
| 产品图 / 商品主图 | 文生图 + 4K 横版 | 提示词写清主体、光线、背景;写 "4K" 自动 3840×2160 |
| 海报 / KV / 社媒封面 | 文生图,可加参考图 | 写清排版方向(横版 / 竖版)和主色调 |
| 头像 / 人像 | 文生图,1024×1024 | 写明发型、服饰、风格、光线 |
| 修图 / 图生图 | 传 image 字段或拖本地图 | 提示词写"要改成什么样子" |
| 4K 高清商用稿 | 提示词写 4K / 4k / 4K | 自动放大到 3840×2160(横)或 2160×3840(竖),加 15% 倍率 |
| 多比例适配 | 不传 size,让平台自适应 | 横幅参考图 → 横幅出图;竖幅参考图 → 竖幅出图 |
第一步:创建 GPT-Image2 令牌
去平台控制台 → 令牌管理 → 添加令牌,令牌分组选 "GPT-Image2",创建后复制令牌。
不熟悉创建令牌?先看 创建 API 令牌。
不要混用令牌
GPT-Image2 必须用单独建的【GPT-Image2】令牌。Claude / Codex / Gemini 等文本模型令牌不能用来生图,会直接 401。
也不要把这个令牌写进前端代码、Git 仓库、截图、日志或对外文档。
平台已实现的便利
下面这些都是平台在服务端预置好的能力,客户侧不需要自己处理,写好提示词就能命中。
1. 默认高质量参数
不传任何质量参数时,平台默认按 最高质量 生成。出图会更贴近参考图、细节更稳、文字更清晰。如果你想更快出图,可以显式传低分辨率 size。
2. 尺寸自适应
不传 size 字段 时,平台会按你提供的参考图比例自动选择输出尺寸:
- 参考图是横幅(如 1920×1080)→ 出横幅图
- 参考图是竖幅(如 1080×1920)→ 出竖幅图
- 参考图是方图(1:1)→ 出方图
- 没有参考图 → 走默认 1024×1024
3. 4K 关键词自动放大
提示词里写下面任意一种关键词,平台自动放大到 4K:
| 关键词 | 平台理解 | 实际输出尺寸 |
|---|---|---|
4K / 4k / 4K | 触发 4K,未写方向时默认横版 | 3840x2160 |
4K + 横版 / landscape / 16:9 | 横版 4K | 3840x2160 |
4K + 竖版 / portrait / 9:16 | 竖版 4K | 2160x3840 |
UHD / 3840x2160 | 横版 4K | 3840x2160 |
2160x3840 | 竖版 4K | 2160x3840 |
4K 模式额外加 15% 倍率
4K 输出比标准分辨率多 15% 计费倍率。如果只是试稿,建议先用标准分辨率确认提示词,最后定稿再走 4K。
4. 本地拖图自动上传
Cherry Studio 等支持文件拖拽的客户端,可以直接把本地图片拖进对话框。平台会自动通过中转接口完成上传,你不需要先把图传到图床或 OSS。直接 API 调用时,仍然推荐使用公网 URL。
5. 参考图错误提示(中文)
上传无效参考图(链接损坏、防盗链、URL 过期、不是图片格式等)时,平台会返回中文错误说明,告诉你具体是哪张图、哪种问题,方便排查。不会出现"上游英文报错堆栈丢回来"的情况。
请求参数
POST https://www.yuzhixiaolongxia.com/v1/images/generations
Authorization: Bearer <你的 GPT-Image2 令牌>
Content-Type: application/json请求体:
| 字段 | 类型 | 必填 | 说明 |
|---|---|---|---|
model | string | 是 | image2 或 gpt-image-2,二选一即可 |
prompt | string | 是 | 生图提示词,建议写清主体、场景、风格、构图、光线、关键词 |
image | string / string[] | 否 | 单张或多张参考图 URL(图生图 / 修图时传) |
images | string[] | 否 | 多图融合时传数组,效果同 image 传数组 |
size | string | 否 | 常用 1024x1024、1792x1024、1024x1792、3840x2160、2160x3840;不传时按参考图比例自适应 |
n | number | 否 | 生成数量,通常传 1 |
response_format | string | 否 | url 或 b64_json;服务端保存推荐 b64_json |
响应字段:
| 字段 | 说明 |
|---|---|
created | 生成时间戳 |
data[0].url | 图片 URL,适合直接展示或下载 |
data[0].b64_json | 图片 base64,适合服务端直接保存 |
data[0].revised_prompt | 模型可能返回的优化后提示词,有则保存,无则忽略 |
error.message | 失败时的错误信息(中文) |
curl 示例
文生图 + 4K 横版
curl -X POST "https://www.yuzhixiaolongxia.com/v1/images/generations" \
-H "Authorization: Bearer $YZX_IMAGE_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-image-2",
"prompt": "A realistic product photo of a premium tea bottle on a clean white table, soft studio light, sharp details, 4K landscape",
"n": 1,
"response_format": "b64_json"
}'注意:上面没有传
size,因为提示词里写了4K landscape,平台会自动输出 3840×2160。
图生图(修图 / 风格迁移)
curl -X POST "https://www.yuzhixiaolongxia.com/v1/images/generations" \
-H "Authorization: Bearer $YZX_IMAGE_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-image-2",
"prompt": "Replace the background with a sunset beach, keep the product unchanged",
"image": "https://your-cdn.com/source.jpg"
}'多图融合
curl -X POST "https://www.yuzhixiaolongxia.com/v1/images/generations" \
-H "Authorization: Bearer $YZX_IMAGE_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-image-2",
"prompt": "Combine the model from image 1 and the product from image 2 into a clean studio photo",
"image": [
"https://your-cdn.com/photo1.jpg",
"https://your-cdn.com/photo2.jpg"
]
}'不指定 size,让平台按参考图比例出图
curl -X POST "https://www.yuzhixiaolongxia.com/v1/images/generations" \
-H "Authorization: Bearer $YZX_IMAGE_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "image2",
"prompt": "Add warm golden hour lighting and a soft bokeh background",
"image": "https://your-cdn.com/portrait-vertical.jpg"
}'上面参考图是竖幅 → 出图自动是竖幅;客户端不需要自己判断。
Node.js 接入示例
import { writeFile } from "node:fs/promises";
const API_BASE_URL = process.env.YZX_IMAGE_BASE_URL ?? "https://www.yuzhixiaolongxia.com/v1";
const API_KEY = process.env.YZX_IMAGE_API_KEY;
if (!API_KEY) {
throw new Error("Missing YZX_IMAGE_API_KEY");
}
async function generateImage({ prompt, image, size, timeoutMs = 300000 }) {
if (!prompt || !prompt.trim()) {
throw new Error("prompt is required");
}
const controller = new AbortController();
const timer = setTimeout(() => controller.abort(), timeoutMs);
try {
const body = {
model: "gpt-image-2",
prompt,
n: 1,
response_format: "b64_json",
};
if (size) body.size = size;
if (image) body.image = image;
const response = await fetch(`${API_BASE_URL}/images/generations`, {
method: "POST",
headers: {
Authorization: `Bearer ${API_KEY}`,
"Content-Type": "application/json",
},
body: JSON.stringify(body),
signal: controller.signal,
});
const json = await response.json();
if (!response.ok) {
throw new Error(json?.error?.message || `HTTP ${response.status}`);
}
return json.data[0];
} finally {
clearTimeout(timer);
}
}
const image = await generateImage({
prompt: "A clean SaaS dashboard UI prototype, Chinese labels, 4K landscape, high detail",
});
if (image.b64_json) {
await writeFile("result.png", Buffer.from(image.b64_json, "base64"));
}客户端推荐:Cherry Studio
一句话:图形界面,点点就能出图
小白首选。配置时一定要把模型类型改成 Image,并关闭流式输出。
配置步骤
打开 Cherry Studio → 设置 → 模型服务 → 添加
填写:
字段 填什么 提供商名称 预制小龙虾-生图(随便起)API Key 你的【GPT-Image2】令牌 API 地址 https://www.yuzhixiaolongxia.com/v1模型列表里勾选或手动添加
gpt-image-2点该模型的"编辑"图标,把 "模型类型 / Type" 从 Chat 改为 Image,保存
助手设置 → 模型设置 → 关闭流式输出
输入提示词 → 发送 → 等待出图
生图失败时换个地址再试
如果 Cherry Studio 一直报路径错或 schema 校验失败,把 API 地址改成:
https://www.yuzhixiaolongxia.com/v1#
末尾加一个 # 是平台特性,用来绕过某些 SDK 的 schema 校验。这是 Cherry Studio 生图模式专用的备用写法。
费用说明
| 情况 | 客户感知 |
|---|---|
| 标准分辨率(1024×1024 等) | 按模型广场公示价格,单次扣费 |
| 4K 模式(提示词触发 4K 或显式传 4K size) | 在标准价基础上 额外加 15% 倍率 |
| 图生图 / 修图 | 与文生图同价 |
| 失败 / 超时 | 不扣费 |
省钱小贴士
- 试稿阶段用标准分辨率(提示词里不写 4K),定稿再加 4K。
- 批量出图、找方向的活儿交给 Nano Banana 更划算。
- 不要用 GPT-Image2 跑提示词盲测。
常见问题
参考图传不上 / 报"参考图无效"
平台会返回中文错误说明,常见原因:
- 链接已过期(图床有时效的临时 URL)
- 防盗链拦截(如某些社交媒体图)
- URL 不是直接图片地址(是网页链接)
- 文件已损坏或不是图片格式
解决:把图重新传到任意公网图床或 OSS,拿到直接可访问的图片 URL(用浏览器无痕模式打开能直接看到图)再用。
出图比例不对
- 没传
size且没参考图:默认 1024×1024。要竖版 / 横版请显式传size。 - 传了参考图但出图比例不对:检查参考图是不是确实是你想要的比例,平台是按参考图比例推断的。
- 要 4K 但出图是 1024:提示词里要包含
4K/4k/4K之一,或显式传"size": "3840x2160"。
4K 没生效
检查清单:
- 提示词里是否包含
4K/4k/4K/UHD/3840x2160/2160x3840之一 - 或显式传
"size": "3840x2160"(横版)/"2160x3840"(竖版) - 还不行就在提示词里追加
4K landscape, high detail
Cherry Studio 一直转圈
90% 是 没关流式输出。回到助手设置 → 模型设置,把"流式输出"关掉。
报 401 / 令牌无效
令牌分组选错。GPT-Image2 必须用 GPT-Image2 分组,不是 Claude / Codex / Gemini 的文本分组。
timeout
4K 生图耗时较长(30~120 秒),服务端超时建议设到 300000 毫秒(5 分钟),不要短超时反复重提。
返回了 url 但下载失败
URL 可能有有效期。优先使用 "response_format": "b64_json",由服务端直接保存图片字节,避免 URL 过期问题。
n8n 工作流速查
| 节点 | 怎么配 |
|---|---|
| HTTP Request | POST https://www.yuzhixiaolongxia.com/v1/images/generations |
| Authentication | Header Auth:Authorization: Bearer <你的令牌> |
| Body | model / prompt / size / response_format |
| Timeout | 300000(300 秒) |
上一步:绘图模型总览 | 下一步:Seedance 2.0 视频生成教程
