Skip to content

图片生成指南

平台支持三种图片生成方式,适用于不同模型和场景。所有接口均在标准 OpenAI 格式基础上兼容扩展。

方式一:对话格式生成图片(v1/chat/completions)

直接在对话消息里描述图片,最简单的方式,支持图生图(传入底图)。

bash
curl https://www.llm-link.top/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-2",
    "messages": [
      { "role": "user", "content": "帮我画一只宇航猫在月球漫步[1024:1024]" }
    ]
  }'

指定尺寸

在提示词末尾用英文方括号指定宽高像素,例如 [1024:1024][1920:1080]。使用英文 prompt 效果更好。

图生图(传入底图)

格式与 OpenAI 官方视觉接口完全一致:

json
{
  "model": "gpt-image-2",
  "messages": [
    {
      "role": "user",
      "content": [
        { "type": "text", "text": "将图中的猫替换为一只狗" },
        { "type": "image_url", "image_url": { "url": "https://example.com/cat.jpg" } }
      ]
    }
  ]
}

方式二:专业文生图(v1/images/generations)

标准 DALL-E 格式,支持更多参数控制。

bash
curl https://www.llm-link.top/v1/images/generations \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "flux.1-kontext-dev",
    "prompt": "a futuristic city at night, cyberpunk style",
    "size": "1024x1024",
    "n": 1,
    "response_format": "url"
  }'
参数说明
model模型名称,如 flux.1-kontext-devgpt-image-2doubao-seedream-4-0
prompt描述图片内容的提示词
size图片尺寸,如 1024x1024;不同模型支持的格式见下方各节
n生成数量,默认 1
response_formaturl(返回图片链接)或 b64_json(返回 base64)

方式三:图片编辑(v1/images/edits)

对已有图片进行局部修改,使用 multipart/form-data 格式上传。

bash
curl https://www.llm-link.top/v1/images/edits \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "model=flux.1-kontext-dev" \
  -F "image=@/path/to/image.png" \
  -F "prompt=move the cat to a beach background" \
  -F "size=1024x1024" \
  -F "response_format=url"

各模型参数说明

Qwen 系列绘图模型

模型名:qwen-image-maxqwen-image-max-2025-12-30qwen-image-plus

  • 只支持按比例输入 size,不支持像素形式
  • 支持的比例:1:13:44:316:99:16
  • Chat 格式示例:在提示词中加入参数
json
{
  "model": "qwen-image-max",
  "messages": [{ "role": "user", "content": "画一只小猫 -size=16:9" }]
}
  • 编辑图片时不支持设置比例,输出尺寸与底图保持一致
  • 单次最多支持 3 张底图

豆包绘图模型(doubao-seedream)

模型名:doubao-seedream-4-0-250828doubao-seedream-3-0-t2i-250415

支持 chat 格式和 dalle 格式,参数通过 -key=value 方式在提示词或字段中传入。

支持的 size 形式:

输入形式示例说明
档位1k2k4k原样返回对应分辨率
像素1280x720宽 1280~4096,高 720~4096,宽高比 1/16~16
比例16:9自动映射到推荐像素

比例映射表:

比例推荐像素
1:12048×2048
4:32304×1728
3:41728×2304
16:92560×1440
9:161440×2560
3:22496×1664
2:31664×2496
21:93024×1296

Chat 格式完整示例(推荐):

json
{
  "model": "doubao-seedream-4-0-250828",
  "messages": [
    {
      "role": "user",
      "content": "画一只猫在草原上奔跑 -size=2k -n=2 -type=normal -watermark=false"
    }
  ],
  "stream": false
}

Chat 格式参数说明:

参数说明默认值
-type=normal出图类型:normal(最多4张)或 group(最多10张,分镜一致性更强)normal
-n=1出图数量1
-size=1k图片大小,支持档位/像素/比例三种形式1k
-watermark=false是否添加水印,true 表示右下角显示"AI生成"false

注意

参数之间必须有空格,否则会解析失败。例如 -size=2k -n=2 正确,-size=2k-n=2 错误。

DALL-E 格式完整示例:

bash
curl https://www.llm-link.top/v1/images/generations \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "doubao-seedream-4-0-250828",
    "prompt": "画一只猫在草原上奔跑",
    "size": "2k",
    "n": 1,
    "watermark": false,
    "type": "normal",
    "response_format": "url"
  }'

group 模式示例(多分镜一致性):

生成 6 张 3:4 比例的分镜图,整体画风为 Q 版治愈风,内容讲述王子与公主的故事,
每张图作为一个分镜,画风统一,人物形象保持一致,连贯成小故事。
-size=3:4 -n=6 -type=group

Grok 绘图模型

模型名:grok-4.2-image

  • 支持 chat 格式和 dalle 格式
  • 单次最多生成 8 张图片
  • size 仅支持比例形式

支持的比例:auto1:13:44:39:1616:92:33:29:19.519.5:99:2020:91:22:1

generations 接口示例:

json
{
  "model": "grok-4.2-image",
  "prompt": "a cat sitting on the moon",
  "size": "1:1",
  "n": 1,
  "response_format": "url"
}

传入底图(URL 或 base64,多图用数组):

json
{
  "model": "grok-4.2-image",
  "image": "https://example.com/photo.jpg",
  "prompt": "将背景替换为海边",
  "size": "1:1",
  "response_format": "url"
}

edits 接口(二进制上传):

bash
curl https://www.llm-link.top/v1/images/edits \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "model=grok-4.2-image" \
  -F "image=@/path/to/image.png" \
  -F "prompt=move to water" \
  -F "size=1:1" \
  -F "n=1" \
  -F "response_format=url"

返回结果处理

python
from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://www.llm-link.top/v1"
)

response = client.images.generate(
    model="flux.1-kontext-dev",
    prompt="a futuristic city at night",
    size="1024x1024",
    response_format="url",
)

# 获取图片 URL
image_url = response.data[0].url
print(image_url)

基于 New API 开源项目构建