GPT-Image2 生图教程

大约 8 分钟

GPT-Image2 生图教程

GPT-Image2 是平台主力图像生成模型，适合 产品图、海报、运营图、UI 原型、4K 商用图。它通过同一个生图接口同时支持文生图和图生图，平台已经在服务端预置了一批便利能力（默认高质量、尺寸自适应、4K 关键词自动放大、本地拖图自动上传等），客户侧只需要写好提示词就能出图。

接入结论

API Base URL：https://www.yuzhixiaolongxia.com/v1
文生图 / 图生图：POST /images/generations
图片编辑：POST /images/edits
认证方式：Authorization: Bearer <你的 GPT-Image2 令牌>
模型 ID：image2 或 gpt-image-2（两个都可用，平台自动归一）
令牌分组：GPT-Image2
模型 ID / 价格：以模型广场实际显示为准

6 种典型用法

场景	怎么用	要点
产品图 / 商品主图	文生图 + 4K 横版	提示词写清主体、光线、背景；写 "4K" 自动 3840×2160
海报 / KV / 社媒封面	文生图，可加参考图	写清排版方向（横版 / 竖版）和主色调
头像 / 人像	文生图，1024×1024	写明发型、服饰、风格、光线
修图 / 图生图	传 `image` 字段或拖本地图	提示词写"要改成什么样子"
4K 高清商用稿	提示词写 `4K` / `4k` / `４Ｋ`	自动放大到 3840×2160（横）或 2160×3840（竖），加 15% 倍率
多比例适配	不传 `size`，让平台自适应	横幅参考图 → 横幅出图；竖幅参考图 → 竖幅出图

第一步：创建 GPT-Image2 令牌

去平台控制台 → 令牌管理 → 添加令牌，令牌分组选 "GPT-Image2"，创建后复制令牌。

不熟悉创建令牌？先看创建 API 令牌。

不要混用令牌

GPT-Image2 必须用单独建的【GPT-Image2】令牌。Claude / Codex / Gemini 等文本模型令牌不能用来生图，会直接 401。

也不要把这个令牌写进前端代码、Git 仓库、截图、日志或对外文档。

平台已实现的便利

下面这些都是平台在服务端预置好的能力，客户侧不需要自己处理，写好提示词就能命中。

1. 默认高质量参数

不传任何质量参数时，平台默认按 最高质量 生成。出图会更贴近参考图、细节更稳、文字更清晰。如果你想更快出图，可以显式传低分辨率 size。

2. 尺寸自适应

不传 size 字段 时，平台会按你提供的参考图比例自动选择输出尺寸：

参考图是横幅（如 1920×1080）→ 出横幅图
参考图是竖幅（如 1080×1920）→ 出竖幅图
参考图是方图（1:1）→ 出方图
没有参考图 → 走默认 1024×1024

3. 4K 关键词自动放大

提示词里写下面任意一种关键词，平台自动放大到 4K：

关键词	平台理解	实际输出尺寸
`4K` / `4k` / `４Ｋ`	触发 4K，未写方向时默认横版	`3840x2160`
`4K` + `横版` / `landscape` / `16:9`	横版 4K	`3840x2160`
`4K` + `竖版` / `portrait` / `9:16`	竖版 4K	`2160x3840`
`UHD` / `3840x2160`	横版 4K	`3840x2160`
`2160x3840`	竖版 4K	`2160x3840`

4K 模式额外加 15% 倍率

4K 输出比标准分辨率多 15% 计费倍率。如果只是试稿，建议先用标准分辨率确认提示词，最后定稿再走 4K。

4. 本地拖图自动上传

Cherry Studio 等支持文件拖拽的客户端，可以直接把本地图片拖进对话框。平台会自动通过中转接口完成上传，你不需要先把图传到图床或 OSS。直接 API 调用时，仍然推荐使用公网 URL。

5. 参考图错误提示（中文）

上传无效参考图（链接损坏、防盗链、URL 过期、不是图片格式等）时，平台会返回中文错误说明，告诉你具体是哪张图、哪种问题，方便排查。不会出现"上游英文报错堆栈丢回来"的情况。

请求参数

POST https://www.yuzhixiaolongxia.com/v1/images/generations
Authorization: Bearer <你的 GPT-Image2 令牌>
Content-Type: application/json

请求体：

字段	类型	必填	说明
`model`	string	是	`image2` 或 `gpt-image-2`，二选一即可
`prompt`	string	是	生图提示词，建议写清主体、场景、风格、构图、光线、关键词
`image`	string / string[]	否	单张或多张参考图 URL（图生图 / 修图时传）
`images`	string[]	否	多图融合时传数组，效果同 `image` 传数组
`size`	string	否	常用 `1024x1024`、`1792x1024`、`1024x1792`、`3840x2160`、`2160x3840`；不传时按参考图比例自适应
`n`	number	否	生成数量，通常传 `1`
`response_format`	string	否	`url` 或 `b64_json`；服务端保存推荐 `b64_json`

响应字段：

字段	说明
`created`	生成时间戳
`data[0].url`	图片 URL，适合直接展示或下载
`data[0].b64_json`	图片 base64，适合服务端直接保存
`data[0].revised_prompt`	模型可能返回的优化后提示词，有则保存，无则忽略
`error.message`	失败时的错误信息（中文）

curl 示例

文生图 + 4K 横版

curl -X POST "https://www.yuzhixiaolongxia.com/v1/images/generations" \
  -H "Authorization: Bearer $YZX_IMAGE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-2",
    "prompt": "A realistic product photo of a premium tea bottle on a clean white table, soft studio light, sharp details, 4K landscape",
    "n": 1,
    "response_format": "b64_json"
  }'

注意：上面没有传 size，因为提示词里写了 4K landscape，平台会自动输出 3840×2160。

图生图（修图 / 风格迁移）

curl -X POST "https://www.yuzhixiaolongxia.com/v1/images/generations" \
  -H "Authorization: Bearer $YZX_IMAGE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-2",
    "prompt": "Replace the background with a sunset beach, keep the product unchanged",
    "image": "https://your-cdn.com/source.jpg"
  }'

多图融合

curl -X POST "https://www.yuzhixiaolongxia.com/v1/images/generations" \
  -H "Authorization: Bearer $YZX_IMAGE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-2",
    "prompt": "Combine the model from image 1 and the product from image 2 into a clean studio photo",
    "image": [
      "https://your-cdn.com/photo1.jpg",
      "https://your-cdn.com/photo2.jpg"
    ]
  }'

不指定 size，让平台按参考图比例出图

curl -X POST "https://www.yuzhixiaolongxia.com/v1/images/generations" \
  -H "Authorization: Bearer $YZX_IMAGE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "image2",
    "prompt": "Add warm golden hour lighting and a soft bokeh background",
    "image": "https://your-cdn.com/portrait-vertical.jpg"
  }'

上面参考图是竖幅 → 出图自动是竖幅；客户端不需要自己判断。

Node.js 接入示例

import { writeFile } from "node:fs/promises";

const API_BASE_URL = process.env.YZX_IMAGE_BASE_URL ?? "https://www.yuzhixiaolongxia.com/v1";
const API_KEY = process.env.YZX_IMAGE_API_KEY;

if (!API_KEY) {
  throw new Error("Missing YZX_IMAGE_API_KEY");
}

async function generateImage({ prompt, image, size, timeoutMs = 300000 }) {
  if (!prompt || !prompt.trim()) {
    throw new Error("prompt is required");
  }

  const controller = new AbortController();
  const timer = setTimeout(() => controller.abort(), timeoutMs);

  try {
    const body = {
      model: "gpt-image-2",
      prompt,
      n: 1,
      response_format: "b64_json",
    };
    if (size) body.size = size;
    if (image) body.image = image;

    const response = await fetch(`${API_BASE_URL}/images/generations`, {
      method: "POST",
      headers: {
        Authorization: `Bearer ${API_KEY}`,
        "Content-Type": "application/json",
      },
      body: JSON.stringify(body),
      signal: controller.signal,
    });

    const json = await response.json();
    if (!response.ok) {
      throw new Error(json?.error?.message || `HTTP ${response.status}`);
    }
    return json.data[0];
  } finally {
    clearTimeout(timer);
  }
}

const image = await generateImage({
  prompt: "A clean SaaS dashboard UI prototype, Chinese labels, 4K landscape, high detail",
});

if (image.b64_json) {
  await writeFile("result.png", Buffer.from(image.b64_json, "base64"));
}

客户端推荐：Cherry Studio

一句话：图形界面，点点就能出图

小白首选。配置时一定要把模型类型改成 Image，并关闭流式输出。

配置步骤

打开 Cherry Studio → 设置 → 模型服务 → 添加
填写：
字段 填什么
提供商名称 预制小龙虾-生图（随便起）
API Key 你的【GPT-Image2】令牌
API 地址 https://www.yuzhixiaolongxia.com/v1
模型列表里勾选或手动添加 gpt-image-2
点该模型的"编辑"图标，把 "模型类型 / Type" 从 Chat 改为 Image，保存
助手设置 → 模型设置 → 关闭流式输出
输入提示词 → 发送 → 等待出图

字段	填什么
提供商名称	`预制小龙虾-生图`（随便起）
API Key	你的【GPT-Image2】令牌
API 地址	`https://www.yuzhixiaolongxia.com/v1`

生图失败时换个地址再试

如果 Cherry Studio 一直报路径错或 schema 校验失败，把 API 地址改成：

https://www.yuzhixiaolongxia.com/v1#

末尾加一个 # 是平台特性，用来绕过某些 SDK 的 schema 校验。这是 Cherry Studio 生图模式专用的备用写法。

费用说明

情况	客户感知
标准分辨率（1024×1024 等）	按模型广场公示价格，单次扣费
4K 模式（提示词触发 4K 或显式传 4K size）	在标准价基础上额外加 15% 倍率
图生图 / 修图	与文生图同价
失败 / 超时	不扣费

省钱小贴士

试稿阶段用标准分辨率（提示词里不写 4K），定稿再加 4K。
批量出图、找方向的活儿交给 Nano Banana 更划算。
不要用 GPT-Image2 跑提示词盲测。

常见问题

参考图传不上 / 报"参考图无效"

平台会返回中文错误说明，常见原因：

链接已过期（图床有时效的临时 URL）
防盗链拦截（如某些社交媒体图）
URL 不是直接图片地址（是网页链接）
文件已损坏或不是图片格式

解决：把图重新传到任意公网图床或 OSS，拿到直接可访问的图片 URL（用浏览器无痕模式打开能直接看到图）再用。

出图比例不对

没传 size 且没参考图：默认 1024×1024。要竖版 / 横版请显式传 size。
传了参考图但出图比例不对：检查参考图是不是确实是你想要的比例，平台是按参考图比例推断的。
要 4K 但出图是 1024：提示词里要包含 4K / 4k / ４Ｋ 之一，或显式传 "size": "3840x2160"。

4K 没生效

检查清单：

提示词里是否包含 4K / 4k / ４Ｋ / UHD / 3840x2160 / 2160x3840 之一
或显式传 "size": "3840x2160"（横版）/ "2160x3840"（竖版）
还不行就在提示词里追加 4K landscape, high detail

节点	怎么配
HTTP Request	`POST https://www.yuzhixiaolongxia.com/v1/images/generations`
Authentication	Header Auth：`Authorization: Bearer <你的令牌>`
Body	`model` / `prompt` / `size` / `response_format`
Timeout	`300000`（300 秒）

上一步：绘图模型总览 | 下一步：Seedance 2.0 视频生成教程

GPT-Image2 生图教程

GPT-Image2 生图教程

6 种典型用法

第一步：创建 GPT-Image2 令牌

平台已实现的便利

1. 默认高质量参数

2. 尺寸自适应

3. 4K 关键词自动放大

4. 本地拖图自动上传

5. 参考图错误提示（中文）

请求参数

curl 示例

文生图 + 4K 横版

图生图（修图 / 风格迁移）

多图融合

不指定 size，让平台按参考图比例出图

Node.js 接入示例

客户端推荐：Cherry Studio

配置步骤

费用说明

常见问题

参考图传不上 / 报"参考图无效"

出图比例不对

4K 没生效

Cherry Studio 一直转圈

报 401 / 令牌无效

timeout

返回了 url 但下载失败

n8n 工作流速查