图像生成
大约 4 分钟
图像生成
接入结论
- 文生图:
POST https://www.yuzhixiaolongxia.com/v1/images/generations - 图生图 / 图像编辑:
POST https://www.yuzhixiaolongxia.com/v1/images/edits(接受multipart/form-data,支持本地拖图) - 认证:
Authorization: Bearer <你的 API 令牌> - 令牌分组:图片
- 响应字段:
data[0].url(直链)或data[0].b64_json(base64) - 模型 ID 自动归一:
image2、gpt-image-2等常见别名都会归一到平台正式 ID - 4K 关键词识别:
prompt含4K/8K/超高清/HD等关键词时,平台按内容比例自动套高分辨率档位
请求参数
Headers
| 字段 | 必填 | 值 |
|---|---|---|
Authorization | 是 | Bearer 你的令牌 |
Content-Type | 是 | application/json(文生图)或 multipart/form-data(图像编辑) |
Body(文生图,JSON)
| 字段 | 类型 | 必填 | 说明 |
|---|---|---|---|
model | string | 是 | 图像模型 ID,平台会自动归一别名 |
prompt | string | 是 | 图片描述(英文表达更稳定,但中英文都支持) |
n | integer | 否 | 生成数量,默认 1 |
size | string | 否 | 例如 1024x1024、1792x1024;不填走平台 4K 自适应 |
response_format | string | 否 | url(默认)或 b64_json |
文生图最小示例
TypeScript
import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.YZX_API_KEY,
baseURL: "https://www.yuzhixiaolongxia.com/v1",
});
const resp = await client.images.generate({
model: "image2",
prompt: "A cozy coffee shop interior at golden hour, photorealistic, 4K",
n: 1,
});
console.log(resp.data[0].url);Python
from openai import OpenAI
client = OpenAI(
api_key="你的令牌",
base_url="https://www.yuzhixiaolongxia.com/v1",
)
resp = client.images.generate(
model="image2",
prompt="A cozy coffee shop interior at golden hour, photorealistic, 4K",
n=1,
)
print(resp.data[0].url)curl
curl https://www.yuzhixiaolongxia.com/v1/images/generations \
-H "Authorization: Bearer $YZX_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "image2",
"prompt": "A serene mountain lake at sunrise, watercolor style, 4K",
"n": 1
}'响应
{
"created": 1714000000,
"data": [
{
"url": "https://www.yuzhixiaolongxia.com/v1/files/img-abc123.png",
"revised_prompt": "A serene mountain lake at sunrise..."
}
]
}4K 关键词识别与自适应尺寸
不用自己算分辨率
Prompt 中只要带下面任意一类关键词,平台会按内容比例自动套到对应高分辨率档位:
- 英文:
4K、8K、HD、Ultra HD、high resolution、4096、8192 - 中文:
超高清、高清、8K 画质
写法示例:
A futuristic city skyline at night, neon lights, cinematic, 4K→ 自动横版 4K(约3840x2160)A portrait of an astronaut, soft studio light, 8K vertical→ 自动竖版 4K(约2160x3840)A square promotional banner, watercolor, HD→ 自动方形高清档位
如果你显式传 size,会以你传入的值为准;不传则走平台自适应。
本地拖图(图像编辑接口)
/v1/images/edits 接受 multipart/form-data,可以直接把本地图片传上去做"图生图 / 局部重绘 / 风格化"。
curl 直传本地图
curl https://www.yuzhixiaolongxia.com/v1/images/edits \
-H "Authorization: Bearer $YZX_API_KEY" \
-F "model=image2" \
-F "image=@./input.png" \
-F "prompt=Replace the background with a vibrant sunset sky, 4K"TypeScript(Node fs)
import fs from "node:fs";
import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.YZX_API_KEY,
baseURL: "https://www.yuzhixiaolongxia.com/v1",
});
const resp = await client.images.edit({
model: "image2",
image: fs.createReadStream("./input.png"),
prompt: "Replace background with a vibrant sunset sky, 4K",
});
console.log(resp.data[0].url);Python
from openai import OpenAI
client = OpenAI(
api_key="你的令牌",
base_url="https://www.yuzhixiaolongxia.com/v1",
)
with open("./input.png", "rb") as f:
resp = client.images.edit(
model="image2",
image=f,
prompt="Replace background with a vibrant sunset sky, 4K",
)
print(resp.data[0].url)上传体积
单张图片建议控制在 10MB 以内;超大文件需要先压缩或裁切,避免触发 413。
模型 ID 归一化
下面这些写法平台会自动归一到同一个模型,调用时可以放心混用:
| 你传的 ID | 平台实际命中 |
|---|---|
image2 | image2(平台正式名) |
gpt-image-2 | image2 |
gpt-image2 | image2 |
nano-banana / gemini-3.1-flash-image-preview | 当前 Banana 系列正式 ID |
最稳的做法仍然是先调 GET /v1/models 确认列表,避免拼写错误。
提示词组装建议
| 要素 | 示例 |
|---|---|
| 主体 | A woman reading a book |
| 风格 | watercolor / photorealistic / oil painting |
| 光线 | golden hour / warm studio light / soft natural daylight |
| 构图 | close-up / wide shot / bird's eye view |
| 色调 | muted / vibrant / monochrome |
| 分辨率提示 | 4K / 8K / Ultra HD |
把要素拼起来:
A minimalist home office with large windows, natural daylight,
Scandinavian style, clean and bright, 4K photography常见问题
返回空 / 报 403
确认令牌创建时选的是 图片 分组,而不是 Claude / Codex 等文本分组。
生成速度很慢
属正常现象。图像推理比文本慢得多,单张通常 10~30 秒,复杂提示词到 60 秒。需要批量时建议异步发起、再拉结果。
用桌面客户端调图像接口报错
很多客户端在 Base URL 后会自动追加 /v1,请按客户端文档填——例如某些工具填 https://www.yuzhixiaolongxia.com,某些填 https://www.yuzhixiaolongxia.com/v1。两端都不要带尾部 # 或多余 /。
4K 关键词写了但没生效
检查 prompt 是否在敏感截断之前。如果你显式传了 size,关键词会被忽略,按你的 size 走。
