LeapX API 文檔
通過統一接口調用多家主流大模型,支持文本對話、多模態理解、圖像/視頻/音頻生成、流式輸出等能力。完全兼容 OpenAI、Anthropic、Google Gemini 原生協議。
https://api.ai-leapx.com/v1
📖概述
LeapX 是一站式大模型 API 平臺,聚焦"降低模型應用門檻,加速場景智能化"。通過標準化接口與模塊化組件,將複雜的模型技術轉化爲可快速集成的能力積木。
核心能力
- 模型集成:聚合 GPT、Claude、Gemini、DeepSeek、Qwen、豆包、MiniMax、即夢、VEO、DALL·E 等數十個主流模型
- 多模態:文本、圖像、音頻、視頻跨模態理解與生成
- 協議兼容:同時兼容 OpenAI、Anthropic Messages、Google Gemini 原生協議,已有 SDK 改 Base URL 即可接入
- 統一計費:所有模型按 Token / 次數統一計費,可在控制臺查看實時賬單
典型場景
- 內容創作:新聞報道、商品介紹、短視頻腳本自動生成
- 智能客服:24 小時多輪問答、知識庫問答
- 文本翻譯:多語言互譯、本地化
- 摘要生成:長文檔、郵件、會議紀要自動摘要
- 圖像/視頻理解:圖像識別、視頻分析、文檔 OCR
- 圖像/視頻/音頻生成:文生圖、文生視頻、語音合成
🚀快速開始
三步開始調用
- 註冊賬號:訪問 ai-leapx.com,使用手機號驗證碼完成註冊,新用戶可領代金券。
- 開通模型:在控制臺「模型廣場」選擇需要的模型,開通按量付費或購買量包。
- 創建 API Key:進入「API Key 管理」創建專屬 Key,用於接口鑑權。
接入信息
| 項目 | 值 |
|---|---|
| Base URL | https://api.ai-leapx.com/v1 |
| Chat 接口 | https://api.ai-leapx.com/v1/chat/completions |
| 鑑權方式 | Authorization: Bearer ${API_KEY}(Messages 接口使用 x-api-key;Gemini 原生使用 ?key= URL 參數) |
| 請求類型 | Content-Type: application/json |
第一次調用
curl https://api.ai-leapx.com/v1/chat/completions \ -H "Content-Type: application/json" \ -H "Authorization: Bearer $LEAPX_API_KEY" \ -d '{ "model": "gpt-4o-mini", "messages": [ {"role": "user", "content": "你好"} ] }'
# pip install openai from openai import OpenAI client = OpenAI( api_key="YOUR_LEAPX_API_KEY", base_url="https://api.ai-leapx.com/v1", ) resp = client.chat.completions.create( model="gpt-4o-mini", messages=[{"role": "user", "content": "你好"}], ) print(resp.choices[0].message.content)
// npm i openai import OpenAI from "openai"; const client = new OpenAI({ apiKey: process.env.LEAPX_API_KEY, baseURL: "https://api.ai-leapx.com/v1", }); const resp = await client.chat.completions.create({ model: "gpt-4o-mini", messages: [{ role: "user", content: "你好" }], }); console.log(resp.choices[0].message.content);
base_url 改爲 https://api.ai-leapx.com/v1,API Key 換爲 LeapX Key,即可在保持原代碼不變的前提下調用所有 OpenAI 兼容模型。
🧭端點速覽
下表列出 LeapX 提供的全部 API 端點,按類別分組:
文本生成
| 方法 | 路徑 | 說明 |
|---|---|---|
| POST | /v1/chat/completions | OpenAI 兼容的對話/多模態接口(推薦) |
| POST | /v1/responses | OpenAI Responses API(GPT 系列) |
| POST | /v1/messages | Anthropic Messages 協議(Claude 等) |
| POST | /v1beta/models/{model}:generateContent | Google Gemini 原生協議 |
| POST | /v1beta/models/{model}:streamGenerateContent | Gemini 流式 |
圖片生成
| 方法 | 路徑 | 說明 |
|---|---|---|
| POST | /openai/v1/images/generations | 文生圖(OpenAI 兼容) |
| POST | /openai/v1/images/edits | 圖生圖/圖片編輯(OpenAI 兼容) |
| POST | /v1beta/models/{model}:generateContent | Gemini 圖片生成(Nano Banana 等) |
音頻與視頻
| 方法 | 路徑 | 說明 |
|---|---|---|
| POST | /v1/synthesis | 語音合成(TTS) |
| POST | /v1/videos | 視頻生成(Sora 兼容) |
| GET | /v1/videos/{video_id} | 查詢視頻生成狀態 |
| GET | /v1/videos/{video_id}/content | 下載視頻結果 |
平臺
| 方法 | 路徑 | 說明 |
|---|---|---|
| GET | /v1/models | 列出可用模型 |
| GET | /openApi/queryModelBill | 查詢用量賬單(AccessKey 籤名鑑權) |
💬Chat Completions
OpenAI 兼容的對話/多模態接口,支持文本生成、圖像理解、視頻理解、音頻處理、工具調用、流式輸出等能力。適用於 GPT、Claude、Gemini、DeepSeek、Qwen、豆包等幾乎所有模型。
典型應用:
- 內容創作:新聞報道、商品介紹、短視頻腳本
- 客戶服務:24 小時智能客服、常見問題解答
- 文本翻譯:多語言互譯
- 摘要生成:長篇文章、報告、郵件自動摘要
- 圖片/視頻理解:識別圖像內容、描述場景、分類打標
入參參數
| 參數 | 說明 | 必填 | 類型 |
|---|---|---|---|
| model | 模型 ID | 必填 | String |
| messages | 聊天上下文信息(詳見下方 Messages 參數說明),包含從頭到尾的對話歷史 | 必填 | Array |
| max_tokens | 本次請求返回的最大 Token 數(Claude 模型必填) | 可選 | Integer |
| temperature | 影響輸出多樣性,取值 [0.0, 2.0]。較高值更隨機,較低值更確定。模型有默認推薦值,不推薦修改。 | 可選 | Float |
| top_p | 影響輸出多樣性,取值 [0.0, 1.0]。值越大多樣性越強。模型有默認推薦值,不推薦修改。 | 可選 | Float |
| stream | 是否使用流式接口。true 流式 / false 非流式(默認 false) | 可選 | Boolean |
| 思考參數 | 各模型廠商思考參數不同,詳見下方 思考參數說明 | 可選 | — |
示例代碼(多模態 + 流式)
調用多模態模型描述圖片內容(流式輸出):
curl --location 'https://api.ai-leapx.com/v1/chat/completions' \ --header "Authorization: Bearer API_KEY" \ --header 'Content-Type: application/json' \ --data '{ "model": "qwen-vl-max", "messages": [ { "role": "system", "content": [{"type": "text", "text": "You are a helpful assistant."}] }, { "role": "user", "content": [ { "type": "image_url", "image_url": { "url": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20241022/emyrja/dog_and_girl.jpeg" } }, {"type": "text", "text": "圖中描繪的是什麼景象?"} ] } ], "stream": true }'
返回參數
| 參數 | 說明 | 類型 |
|---|---|---|
| created | Unix 時間戳(秒),示例:1705634032 | Integer |
| model | 模型 ID | String |
| usage | Token 統計:prompt_tokens / completion_tokens / total_tokens(按總 Token 計費) | Object |
| choices | 回復內容列表(詳見下方 choices 說明) | Array |
choices 字段
通常只含一個元素(n=1 時),每個元素包含:
| 字段 | 說明 | 類型 |
|---|---|---|
| index | 在 choices 中的索引,通常爲 0 | Integer |
| finish_reason | stop 自然停止 / length 達到最大 Token / content_filter 內容過濾 / tool_calls 工具調用 | String |
| message | 模型生成的消息,含 content / role / tool_calls | Object |
| delta | 流式返回時的增量內容 | Object |
返回示例
{
"choices": [
{
"delta": {
"content": "這張圖片展示了一位女士和一隻狗在海灘上互動...",
"role": "assistant"
},
"finish_reason": "stop",
"index": 0,
"logprobs": null
}
],
"object": "chat.completion",
"usage": {
"prompt_tokens": 1270,
"completion_tokens": 54,
"total_tokens": 1324
},
"created": 1725948561,
"model": "qwen-vl-max",
"id": "chatcmpl-0fd66f46-b09e-9164-a84f-3ebbbedbac15"
}
{
"choices": [
{
"message": {
"content": "這張圖片展示了一位女士和一隻狗在海灘上互動...",
"role": "assistant"
},
"finish_reason": "stop",
"index": 0,
"logprobs": null
}
],
"object": "chat.completion",
"usage": {
"prompt_tokens": 1270,
"completion_tokens": 54,
"total_tokens": 1324
},
"created": 1725948561,
"model": "qwen-vl-max",
"id": "chatcmpl-0fd66f46-b09e-9164-a84f-3ebbbedbac15"
}
🧩Responses
Responses API 是 OpenAI 最新推出的接口,原生支持高效的上下文管理,延續了 Chat API 的易用性,並提供模型的有狀態交互——將先前響應的輸出用作輸入。支持函數調用、MCP 調用等擴展能力。
普通對話
curl --location --request POST 'https://api.ai-leapx.com/v1/responses' \ --header 'Content-Type: application/json' \ --header 'Authorization: Bearer ${API_KEY}' \ --data-raw '{ "model": "gpt-4o-mini", "input": "你好" }'
{
"id": "resp_68b65ed1a3208191b78047adad685c8b0f24654d3ee42629",
"object": "response",
"status": "completed",
"model": "gpt-4o-mini",
"output": [
{
"id": "msg_...",
"type": "message",
"status": "completed",
"content": [
{"type": "output_text", "annotations": [], "text": "你好!有什麼我可以幫你的嗎?"}
],
"role": "assistant"
}
],
"usage": {
"input_tokens": 8,
"output_tokens": 10,
"total_tokens": 18
},
"created_at": 1756782289
}
圖片分析
curl --location --request POST 'https://api.ai-leapx.com/v1/responses' \ --header 'Content-Type: application/json' \ --header 'Authorization: Bearer ${API_KEY}' \ --data-raw '{ "input": [ { "role": "user", "content": [ {"type": "input_text", "text": "描述這張圖片中的內容"}, {"type": "input_image", "image_url": "https://example.com/image_1.png"} ] } ], "stream": false, "model": "gpt-4o-mini" }'
流式響應
curl --location --request POST 'https://api.ai-leapx.com/v1/responses' \ --header 'Content-Type: application/json' \ --header 'Authorization: Bearer ${API_KEY}' \ --data-raw '{ "model": "gpt-4o-mini", "instructions": "你是一個有幫助的助手。", "input": "你好", "stream": true }'
SSE 事件序列:response.created → response.in_progress → response.output_item.added → response.output_text.delta(多次)→ response.output_text.done → response.content_part.done → response.output_item.done → response.completed。
函數調用
curl --location --request POST 'https://api.ai-leapx.com/v1/responses' \ --header 'Content-Type: application/json' \ --header 'Authorization: Bearer ${API_KEY}' \ --data-raw '{ "input": [{"content": "今天合肥的天氣怎麼樣", "role": "user"}], "stream": false, "model": "gpt-4o-mini", "tools": [ { "name": "get_the_weather_info", "description": "get the weather info", "type": "function", "parameters": { "type": "object", "properties": { "city": {"description": "the city name", "type": "string"}, "day": {"description": "the day", "type": "string"} }, "required": ["city"] } } ] }'
MCP 調用
curl --location --request POST 'https://api.ai-leapx.com/v1/responses' \ --header 'Content-Type: application/json' \ --header 'Authorization: Bearer ${API_KEY}' \ --data-raw '{ "input": [{"content": "今天合肥的天氣怎麼樣", "role": "user"}], "model": "gpt-responses", "stream": false, "tools": [ { "server_label": "amap", "require_approval": "never", "server_url": "https://mcp.amap.com/mcp?key=**************", "type": "mcp" } ] }'
📨Messages
Anthropic Messages 協議。給定一組包含文本和/或圖像內容的結構化輸入消息列表,模型將生成對話中的下一條消息。Messages API 可用於單次查詢或無狀態的多輪對話。
鑑權方法
請求頭使用 x-api-key(注意:本接口與 Chat Completions 不同,不使用 Bearer Token):
x-api-key: ${API_KEY} Content-Type: application/json
普通對話
curl --location --request POST 'https://api.ai-leapx.com/v1/messages' \ --header 'Content-Type: application/json' \ --header 'x-api-key: ${API_KEY}' \ --data-raw '{ "messages": [ { "content": [{"type": "text", "text": "你好"}], "role": "user" } ], "model": "claude-sonnet-4-20250514" }'
{
"id": "msg_bdrk_01SW8FrxLH2ZgFMpgvSvkUsk",
"type": "message",
"role": "assistant",
"model": "claude-sonnet-4-20250514",
"content": [
{"type": "text", "text": "你好!很高興認識你。有什麼我可以幫助你的嗎?"}
],
"usage": {
"input_tokens": 10,
"output_tokens": 29,
"cache_creation_input_tokens": 0,
"cache_read_input_tokens": 0
},
"stop_reason": "end_turn",
"stop_sequence": null
}
圖片分析
curl --location --request POST 'https://api.ai-leapx.com/v1/messages' \ --header 'Content-Type: application/json' \ --header 'x-api-key: ${API_KEY}' \ --data-raw '{ "messages": [ { "content": [ {"text": "圖片描述的是什麼", "type": "text"}, { "source": { "data": "/9j/4gIcSUNDX1BSTN+M/V0l7qkPTek...", "media_type": "image/jpeg", "type": "base64" }, "type": "image" } ], "role": "user" } ], "model": "claude-sonnet-4-20250514" }'
流式響應
curl --location --request POST 'https://api.ai-leapx.com/v1/messages' \ --header 'Content-Type: application/json' \ --header 'x-api-key: ${API_KEY}' \ --data-raw '{ "stream": true, "messages": [{"content": [{"type": "text", "text": "你好"}], "role": "user"}], "model": "claude-sonnet-4-20250514" }'
SSE 事件序列:message_start → content_block_start → content_block_delta(多次)→ content_block_stop → message_delta → message_stop。
函數調用
curl --location --request POST 'https://api.ai-leapx.com/v1/messages' \ --header 'Content-Type: application/json' \ --header 'x-api-key: ${API_KEY}' \ --data-raw '{ "messages": [{"content": "今天合肥的天氣怎麼樣", "role": "user"}], "model": "claude-sonnet-4-20250514", "tools": [ { "input_schema": { "type": "object", "properties": { "city": {"description": "the city name", "type": "string", "enum": []} } }, "name": "get_the_weather_info", "description": "get the weather info" } ] }'
響應中 stop_reason 爲 "tool_use",content 數組包含 type: "tool_use" 內容塊。客戶端執行工具後,將結果以 tool_result 形式回傳以完成第二輪。
請求體參數
| 參數 | 類型 | 必填 | 說明 |
|---|---|---|---|
| model | String | 必填 | 要使用的模型名稱,1–256 字符。 |
| messages | Array | 必填 | 輸入消息列表(user / assistant 角色交替)。連續同角色消息會被合併。 |
| max_tokens | Integer | 必填 | 生成的最大 token 數量,> 1。不同模型上限不同。 |
| system | String | 可選 | 系統 prompt。Messages API 中沒有 system role,系統提示通過頂層 system 字段提供。 |
| temperature | Number | 可選 | 0.0 – 1.0,默認 1.0。分析任務建議接近 0,創造任務建議接近 1。 |
| top_p | Number | 可選 | 0 < x < 1。Nucleus 採樣。建議只調整 temperature 或 top_p 其中之一。 |
| top_k | Integer | 可選 | > 0。從 token 前 K 個選項中採樣。建議僅在高級場景使用。 |
| stream | Boolean | 可選 | 是否使用 SSE 增量返回。 |
| stop_sequences | Array | 可選 | 自定義停止序列。 |
| metadata | Object | 可選 | 請求元數據,含 user_id(不透明標識符,不要包含 PII,最大長度 256)。 |
| thinking | Object | 可選 | 擴展思考模式。{"type":"enabled","budget_tokens":2048} 啓用;{"type":"disabled"} 關閉。budget_tokens ≥ 1024 且小於 max_tokens。 |
| tool_choice | Object | 可選 | 工具選擇策略:auto/any/tool,可指定 disable_parallel_tool_use。 |
| tools | Array | 可選 | 工具定義列表,支持自定義工具 + 內置 Computer / Bash / TextEditor 工具。 |
內容塊類型
消息 content 可以是字符串,也可以是內容塊數組。支持的內容塊類型:
| 類型 | 關鍵字段 | 說明 |
|---|---|---|
text | text(最小長度 1), cache_control | 文本內容 |
image | source.type=base64, source.media_type, source.data | 圖片,支持 image/jpeg、png、gif、webp |
tool_use | id, name, input | 模型生成的工具調用 |
tool_result | tool_use_id, content, is_error | 客戶端回傳的工具執行結果 |
document | source | 文檔輸入 |
響應體參數
| 字段 | 類型 | 說明 |
|---|---|---|
| id | String | 響應唯一標識符 |
| type | String | 始終爲 "message" |
| role | String | 始終爲 "assistant" |
| model | String | 使用的模型名稱 |
| content | Array | 由內容塊(text / tool_use)組成的輸出列表 |
| stop_reason | String / null | end_turn / max_tokens / stop_sequence / tool_use |
| stop_sequence | String / null | 命中的自定義停止序列(如有) |
| usage | Object | input_tokens / output_tokens / cache_creation_input_tokens / cache_read_input_tokens |
✨Gemini 原生
Google Gemini API 是 Google 提供的大語言模型推理服務,支持文本生成、多模態理解、函數調用等能力。本文檔描述 Gemini API 的 REST 接口規範。
| 項目 | 說明 |
|---|---|
| Base URL | https://api.ai-leapx.com/v1 |
| API 版本 | v1beta |
| 認證 | 請求 URL 參數 ?key={API_KEY} |
| Content-Type | application/json |
請求體(Request Body)
{
"contents": [],
"systemInstruction": {},
"generationConfig": {},
"safetySettings": [],
"tools": [],
"toolConfig": {},
"cachedContent": ""
}
| 參數 | 類型 | 必填 | 說明 |
|---|---|---|---|
| contents | array<Content> | 必填 | 對話內容列表 |
| systemInstruction | Content | 可選 | 系統指令 |
| generationConfig | GenerationConfig | 可選 | 生成參數配置 |
| safetySettings | array<SafetySetting> | 可選 | 安全過濾設置 |
| tools | array<Tool> | 可選 | 工具/函數聲明 |
| toolConfig | ToolConfig | 可選 | 工具調用行爲配置 |
| cachedContent | string | 可選 | 緩存內容資源名稱 |
Content / Part 對象
Content 表示一條對話消息:role(user / model)和 parts(消息內容部分列表)。每個 Part 互斥地包含以下之一:
| 字段 | 類型 | 說明 |
|---|---|---|
| text | string | 文本內容 |
| inlineData | Blob | 內聯二進制數據(圖片/音頻/視頻等)。Blob: { mimeType, data (Base64) } |
| fileData | FileData | 通過 URI 引用的文件數據。FileData: { mimeType, fileUri } |
| functionCall | FunctionCall | 模型返回的函數調用(僅 model 角色)。{ name, args } |
| functionResponse | FunctionResponse | 用戶回傳的函數執行結果(僅 user 角色)。{ name, response } |
GenerationConfig 對象
| 字段 | 類型 | 默認值 | 說明 |
|---|---|---|---|
| temperature | number | 模型默認 | 控制隨機性,0.0–2.0 |
| topP | number | 模型默認 | 核採樣概率閾值,0.0–1.0 |
| topK | integer | 模型默認 | Top-K 採樣 |
| candidateCount | integer | 1 | 返回候選數量 |
| maxOutputTokens | integer | 模型默認 | 最大輸出 token 數 |
| stopSequences | array<string> | 無 | 停止序列(最多 5 個) |
| presencePenalty | number | 0.0 | 存在懲罰 |
| frequencyPenalty | number | 0.0 | 頻率懲罰 |
| responseMimeType | string | text/plain | 響應格式:text/plain / application/json |
| responseSchema | Schema | 無 | 結構化輸出的 JSON Schema 定義 |
| seed | integer | 無 | 隨機種子 |
| responseLogprobs | boolean | false | 是否返回 token 對數概率 |
| logprobs | integer | 無 | 返回的 top log probabilities 數量 |
| thinkingConfig | ThinkingConfig | 無 | 思考模式配置(Gemini 2.5+ 支持)。thinkingBudget 0–24576;thinkingLevel(僅 Gemini 3 支持,與 thinkingBudget 互斥)。 |
| audioTimestamp | boolean | false | 是否啓用音頻時間戳 |
| mediaResolution | string | 無 | 媒體分辨率控制 |
SafetySetting 對象
每個 HarmCategory 最多設置一個:{ category, threshold }。
- HarmCategory:HARM_CATEGORY_HARASSMENT / HATE_SPEECH / SEXUALLY_EXPLICIT / DANGEROUS_CONTENT / CIVIC_INTEGRITY
- HarmBlockThreshold:HARM_BLOCK_THRESHOLD_UNSPECIFIED / BLOCK_LOW_AND_ABOVE / BLOCK_MEDIUM_AND_ABOVE / BLOCK_ONLY_HIGH / BLOCK_NONE / OFF(Gemini 2.5+ 默認)
Tool / ToolConfig
工具通過 functionDeclarations 列表聲明,每項含 name / description / parameters(OpenAPI Schema 子集,type 取值 STRING / NUMBER / INTEGER / BOOLEAN / ARRAY / OBJECT)。
toolConfig.functionCallingConfig.mode:AUTO(默認)/ ANY(強制調用)/ NONE(禁止調用)。ANY 模式可通過 allowedFunctionNames 限制範圍。
基礎文本對話
curl -X POST \ "https://api.ai-leapx.com/v1beta/models/gemini-2.5-flash:generateContent?key=${API_KEY}" \ -H "Content-Type: application/json" \ -d '{ "contents": [ {"role": "user", "parts": [{"text": "你好,請介紹一下你自己"}]} ] }'
帶系統指令和生成配置
curl -X POST \ "https://api.ai-leapx.com/v1beta/models/gemini-2.5-flash:generateContent?key=${API_KEY}" \ -H "Content-Type: application/json" \ -d '{ "systemInstruction": { "parts": [{"text": "你是一個智能助手,回答簡潔友好。"}] }, "contents": [ {"role": "user", "parts": [{"text": "今天天氣怎麼樣?"}]} ], "generationConfig": { "temperature": 0.7, "topP": 0.95, "topK": 40, "maxOutputTokens": 1024 }, "safetySettings": [ {"category": "HARM_CATEGORY_HARASSMENT", "threshold": "BLOCK_MEDIUM_AND_ABOVE"}, {"category": "HARM_CATEGORY_DANGEROUS_CONTENT", "threshold": "BLOCK_MEDIUM_AND_ABOVE"} ] }'
多模態(圖片理解)
curl -X POST \ "https://api.ai-leapx.com/v1beta/models/gemini-2.5-flash:generateContent?key=${API_KEY}" \ -H "Content-Type: application/json" \ -d '{ "contents": [{ "role": "user", "parts": [ {"text": "描述這張圖片的內容"}, {"inlineData": {"mimeType": "image/jpeg", "data": "BASE64_ENCODED_IMAGE_DATA"}} ] }] }'
fileData.fileUri 引用 gs://...),存儲桶必須設置爲公開可讀,否則返回 403 PERMISSION_DENIED。fileData 文件上限 2GB(gemini-2.0-flash 及以上)。函數調用
curl -X POST \ "https://api.ai-leapx.com/v1beta/models/gemini-2.5-flash:generateContent?key=${API_KEY}" \ -H "Content-Type: application/json" \ -d '{ "contents": [{"role": "user", "parts": [{"text": "幫我打開微信"}]}], "tools": [{ "functionDeclarations": [{ "name": "launchApp", "description": "啓動指定的桌面應用程序", "parameters": { "type": "OBJECT", "properties": {"appName": {"type": "STRING", "description": "應用程序名稱"}}, "required": ["appName"] } }] }], "toolConfig": {"functionCallingConfig": {"mode": "AUTO"}} }'
響應體(Response Body)
{
"candidates": [
{
"content": {
"role": "model",
"parts": [{"text": "模型回復內容"}]
},
"finishReason": "STOP",
"index": 0,
"safetyRatings": [
{"category": "HARM_CATEGORY_HARASSMENT", "probability": "NEGLIGIBLE"}
]
}
],
"usageMetadata": {
"promptTokenCount": 10,
"candidatesTokenCount": 50,
"totalTokenCount": 60
},
"modelVersion": "gemini-2.5-flash"
}
FinishReason 枚舉:STOP / MAX_TOKENS / SAFETY / RECITATION / LANGUAGE / BLOCKLIST / PROHIBITED_CONTENT / FINISH_REASON_UNSPECIFIED。
HarmProbability 枚舉:NEGLIGIBLE / LOW / MEDIUM / HIGH。
流式生成(streamGenerateContent)
請求體與 generateContent 完全相同。響應以 text/event-stream 格式返回,每個 data: 行是一個 JSON 片段:
data: {"candidates":[{"content":{"role":"model","parts":[{"text":"你"}]},"index":0}]}
data: {"candidates":[{"content":{"role":"model","parts":[{"text":"好"}]},"index":0}]}
data: {"candidates":[{"content":{"role":"model","parts":[{"text":"!"}]},"finishReason":"STOP","index":0}],"usageMetadata":{"promptTokenCount":10,"candidatesTokenCount":3,"totalTokenCount":13}}
🖼️圖片生成 · OpenAI 兼容
兼容 OpenAI 協議標準,提供圖片生成(generations)和圖片編輯(edits)兩類能力。
圖片生成 — 請求參數
| 參數 | 說明 | 必填 | 類型 |
|---|---|---|---|
| model | 模型名稱 | 必填 | String |
| prompt | 圖片描述提示詞 | 必填 | String |
| n | 生成圖片數量,1–10,默認 1 | 可選 | Integer |
| size | 圖片尺寸(按模型不同有不同限制,詳見下文) | 可選 | String |
| quality | 圖像質量:DALL-E 支持 standard/hd;gpt-image-1 支持 low/medium/high/auto | 可選 | String |
| response_format | url(默認)/ b64_json | 可選 | String |
| style | DALL-E 3 風格:natural / vivid(默認) | 可選 | String |
| 其他參數 | 模型特有參數,支持透傳(如 seed、guidance_scale 等) | 可選 | Any |
size 取值參考:
- DALL-E 3:1024x1024 / 1792x1024 / 1024x1792
- gpt-image-1:1024x1024 / 1024x1536 / 1536x1024
- GPT-image-2 熱門尺寸:1024x1024(方形)/ 1536x1024(橫向)/ 1024x1536(豎屏)/ 2048x2048(2K 方形)/ 2048x1152(2K 橫屏)/ 3840x2160(4K 橫屏)/ 2160x3840(4K 豎屏)/
auto(默認) - 尺寸約束:最大邊長 ≤ 3840px;兩邊均爲 16px 倍數;長短邊比率不超過 3:1;總像素 655,360–8,294,400
示例代碼
curl -X POST https://api.ai-leapx.com/openai/v1/images/generations \ -H "Authorization: Bearer API_KEY" \ -H "Content-Type: application/json" \ -d '{ "model": "gpt-image-1", "prompt": "一條可愛的小狗在草地上奔跑", "n": 1, "size": "1024x1024", "quality": "medium", "response_format": "url", "style": "vivid" }'
返回參數
| 字段 | 說明 | 類型 |
|---|---|---|
| created | Unix 時間戳(秒) | Long |
| data | 生成的圖片列表 | List |
| data.revised_prompt | 模型修改後的提示詞 | String |
| data.url | 圖片 URL(response_format=url) | String |
| data.b64_json | 圖片 Base64(response_format=b64_json) | String |
| usage.input_tokens | 輸入 Token 總數(含 text_tokens / image_tokens 明細) | Integer |
| usage.output_tokens | 輸出 Token 總數(含 text_tokens / image_tokens 明細) | Integer |
| usage.total_tokens | Token 總計 | Integer |
圖片編輯(edits)
支持兩種請求格式:JSON 和 multipart/form-data(兼容 OpenAI 原廠 SDK 的文件上傳)。
方式一:JSON 請求
- image(必填,Array):圖片 URL 列表,或 Base64 列表(格式
data:image/<格式>;base64,<數據>)。每張 < 25MB,支持 PNG / WEBP / JPG。 - mask(可選):遮罩圖片(URL 或 Base64),用於指定需要編輯的區域。
- prompt(必填):編輯指令提示詞。
curl -X POST https://api.ai-leapx.com/openai/v1/images/edits \ -H "Authorization: Bearer API_KEY" \ -H "Content-Type: application/json" \ -d '{ "model": "gpt-image-1", "prompt": "在天空中添加一道彩虹", "image": ["https://example.com/original-image.png"], "n": 1, "size": "1024x1024", "response_format": "url" }'
方式二:multipart/form-data
curl -X POST https://api.ai-leapx.com/openai/v1/images/edits \ -H "Authorization: Bearer API_KEY" \ -F "model=gpt-image-1" \ -F "prompt=給人物添加一頂帽子" \ -F "image[]=@/path/to/image1.png" \ -F "image[]=@/path/to/image2.png" \ -F "mask=@/path/to/mask.png" \ -F "n=1" \ -F "size=1024x1024"
額外參數透傳
除標準字段外,接口支持透傳模型特有的額外參數(如 seed、guidance_scale),在 JSON 請求體中直接添加即可。
🎨圖片生成 · Gemini 兼容
當前接口僅支持 Gemini 系列圖片生成模型(如 Nano Banana / gemini-3-pro-image-preview-e)。imageConfig 控制分辨率:1K / 2K / 4K,aspectRatio 控制寬高比。
文生圖
curl --location --request POST \ 'https://api.ai-leapx.com/v1beta/models/gemini-3-pro-image-preview-e:generateContent?key=sk-xxxx' \ --header 'Content-Type: application/json' \ --header 'Authorization: Bearer sk-xxxx' \ --data-raw '{ "contents": [ {"role": "user", "parts": [{"text": "一條狗"}]} ], "generationConfig": { "responseModalities": ["TEXT", "IMAGE"], "imageConfig": {"aspectRatio": "16:9", "imageSize": "2K"} } }'
參考圖生圖
curl --location --request POST \ 'https://api.ai-leapx.com/v1beta/models/gemini-3-pro-image-preview-e:generateContent?key=sk-xxxx' \ --header 'Content-Type: application/json' \ --header 'Authorization: Bearer sk-xxxx' \ --data-raw '{ "contents": [{ "role": "user", "parts": [ {"text": "畫條狗"}, {"fileData": {"mimeType": "image/jpg", "fileUri": "https://cdn.pixabay.com/photo/.../tree-736885_1280.jpg"}} ] }], "generationConfig": { "responseModalities": ["TEXT", "IMAGE"], "imageConfig": {"aspectRatio": "16:9", "imageSize": "2K"} } }'
從返回結果的 candidates[].content.parts[] 中取出圖片的 Base64 數據:
{
"candidates": [{
"content": {"role": "...", "parts": [{}]},
"finishReason": "...",
"safetyRatings": [{}]
}],
"usageMetadata": {
"promptTokenCount": 0,
"candidatesTokenCount": 0,
"totalTokenCount": 0
}
}
🔊語音合成(TTS)
語音合成(Text-to-Speech)將文本轉換爲自然語音,基於學習大量語音樣本掌握韻律、語調和發音規則,生成接近真人的語音。
應用場景
- 智能客服:多行業多場景語音合成,定製個性化人聲
- 智能設備:智能家居、音箱、車載、可穿戴設備配音
- 有聲閱讀:故事、小說、新聞朗讀
- 新聞播報:多種發音風格的新聞播報
- 無障礙播報:面向各類人羣的文字轉語音
- 內容創作:自媒體、視頻配音
- 在線教育:復刻在線課堂老師的聲音
入參參數
| 參數 | 說明 | 必填 | 類型 |
|---|---|---|---|
| model | 模型 ID | 必填 | String |
| input | 合成參數對象 | 必填 | JSON |
| input.text | 合成文本 | 必填 | String |
| input.voice | 合成語音音色(在控制臺「開通管理 → 語音合成 → 我的音色」獲取) | 必填 | String |
示例代碼
<YOUR_MODEL_ID> 與 <YOUR_VOICE_ID> 必須替換爲您賬號下實際開通的模型 ID 與音色 ID。模型 ID 通過 GET /v1/models(filter type=speech_model)獲取;音色 ID 在控制臺「開通管理 → 語音合成 → 我的音色」獲取。curl -X POST https://api.ai-leapx.com/v1/synthesis \ -H "Authorization: Bearer API_KEY" \ -H "Content-Type: application/json" \ -d '{ "model": "<YOUR_MODEL_ID>", "input": { "text": "那我來給大家推薦一款T恤,這款呢真的是超級好看。推薦寶寶們下單哦。", "voice": "<YOUR_VOICE_ID>" } }'
返回示例
{
"code": 200,
"msg": "語音合成成功",
"data": {
"url": "https://api.ai-leapx.com/63d8ba50b8da4f3d9d41131b99583fb3.mp3"
}
}
🎬視頻生成(Sora 兼容)
GET /v1/models 查詢當前賬號下可用的視頻生成模型(type=visual_model),將下方示例中的 <YOUR_VIDEO_MODEL> 替換爲真實模型 ID 後再調用,否則可能返回"模型不可用"或"模型已下架"。生成流程
- 創建任務:調用
POST /v1/videos,返回包含id和初始status(queued/in_progress)的作業對象。 - 輪詢狀態:調用
GET /v1/videos/{video_id},每 10–20 秒一次,必要時使用指數退避。任務狀態:queued/in_progress/completed/failed。注意:狀態記錄只保留 5 小時。 - 下載結果:狀態變爲
completed後,調用GET /v1/videos/{video_id}/content,端點會流式傳輸二進制 MP4 數據。下載鏈接生成後最多有效 1 小時,請立即保存到自有存儲。
創建視頻任務
import OpenAI from 'openai'; const openai = new OpenAI({ apiKey: process.env.LEAPX_API_KEY, baseURL: 'https://api.ai-leapx.com/v1', }); let video = await openai.videos.create({ model: '<YOUR_VIDEO_MODEL>', prompt: "A video of the words 'Thank you' in sparkling letters", }); console.log('Video generation started: ', video);
{
"id": "video_68d7512d07848190b678d5",
"object": "video",
"created_at": 1758941485,
"status": "queued",
"model": "<YOUR_VIDEO_MODEL>",
"progress": 0,
"seconds": "8",
"size": "1280x720"
}
使用圖像參考(首幀)
可以傳入參考圖作爲視頻的第一幀,用於保留品牌資產、角色或環境外觀。圖像分辨率必須與 size 匹配,支持 image/jpeg、image/png、image/webp。
curl -X POST "https://api.ai-leapx.com/v1/videos" \ -H "Authorization: Bearer $LEAPX_API_KEY" \ -H "Content-Type: multipart/form-data" \ -F prompt="She turns around and smiles, then slowly walks out of the frame." \ -F model="<YOUR_VIDEO_MODEL>" \ -F size="1280x720" \ -F seconds="8" \ -F input_reference="@sample_720p.jpeg;type=image/jpeg"
Remix 已完成視頻
對現有視頻進行針對性調整,無需從頭重新生成。系統會在應用修改的同時重用原始視頻的結構、連貫性和構圖。最適合做單個、明確的更改。
curl -X POST "https://api.ai-leapx.com/v1/videos/<previous_video_id>/remix" \ -H "Authorization: Bearer $LEAPX_API_KEY" \ -H "Content-Type: application/json" \ -d '{ "prompt": "Shift the color palette to teal, sand, and rust, with a warm backlight." }'
📦模型列表
列出當前賬號可用的全部模型,包含每個模型的基本信息。
請求示例
curl --location --request GET 'https://api.ai-leapx.com/v1/models' \ --header 'Content-Type: application/json' \ --header "Authorization: Bearer API_KEY"
響應示例
{
"object": "list",
"data": [
{
"id": "model-id-0",
"object": "model",
"created": 1686935002,
"owned_by": "LeapX",
"type": "text_model"
}
]
}
返回參數
| 字段 | 說明 | 類型 |
|---|---|---|
| id | 模型標識符,可在 API 端點中引用 | String |
| object | 對象類型,固定爲 "model" | String |
| created | Unix 時間戳(秒) | Integer |
| owned_by | 模型所屬組織 | String |
| type | 模型類型,見下表 | String |
type 取值:
text_model— 文本模型image_generation— 圖像生成模型visual_model— 視頻模型speech_model— 語音合成模型transcription_model— 語音識別模型
🔑AccessKey 管理
AccessKey 是請求平臺 OpenAPI(如賬單接口)的憑證,與普通 API Key 不同。每個身份最多創建 5 對密鑰。
實踐建議
- 定期輪換:創建第二對密鑰替換第一對,輪換完成後禁用第一對。
- 清理閒置:對長期不使用的密鑰進行禁用或刪除。
- 避免泄露:勿將 AccessKey 寫入代碼或存儲在代碼倉庫中,避免將密鑰分享到公開環境(如 GitHub)。
創建入口
登錄平臺後,訪問控制臺「AccessKey 管理」頁面獲取 Access Key ID 與 Secret Access Key。
💳獲取賬單接口
按時間區間查詢賬戶用量賬單。在 AccessKey 管理頁面獲取 Access Key ID 與 Secret Access Key,使用 AccessKey 籤名鑑權。
請求示例
curl -X GET "https://api.ai-leapx.com/openApi/queryModelBill?startDate=20251118&endDate=20260225" \ --header 'X-Date: 20260227T035311Z' \ --header 'X-Access-Key-Id: kjvXZNzdlDIoC******wBd9306S9d6KlcIKFOc1Jz4' \ --header 'X-Signature: 0075105a5aa5bcccb37b0c73c211*******4a4589bd7a90c0b5d'
請求參數
| 參數 | 說明 | 必填 | 類型 |
|---|---|---|---|
| startDate | 賬單查詢開始時間,格式 YYYYMMDD | 必填 | String |
| endDate | 賬單查詢結束時間,格式 YYYYMMDD | 必填 | String |
| X-Date | UTC 時間,精確到秒,ISO 8601 格式:YYYYMMDD'T'HHMMSS'Z' | 必填 | String |
| X-Access-Key-Id | AccessKey 管理中獲取的 Access Key ID | 必填 | String |
| X-Signature | 方法籤名(使用 Secret Access Key 對請求計算) | 必填 | String |
響應字段
頂層包含用戶信息(nickName / accountId / accountType / phone / email)與賬單列表 modelBills。每條賬單含 billTime、orderNum、status(1 已結清 / 2 出賬中 / 3 欠費)以及 useInfo 用量明細。
每條 useInfo 含 apiKeyId / apiKeyName / totalPrice,以及多模型用量列表 modelDetails:modelName、model、serviceProvider、rateCardRate(刊例價)、totalPrice、modelAttribute(模型屬性同 type)、usage、usageUnit。
刊例價示例
- 文本模型:
文本輸入:14~28元/M tokens 文本輸出:84~126元/M tokens(有緩存計費時在後追加;價格區間表示當天實時變動) - 圖片生成:
0.2元/次或文本輸入:35元/M tokens 圖片輸入:70.5元/M tokens 輸出:280元/M tokens - 視頻生成:
標清:0.4375元/1秒/次 高清:0.9375元/1秒/次 超清:1元/1秒/次 - 語音合成:
3.5元/萬字符
👥企業子賬號管理
LeapX 支持企業子賬號共用,滿足團隊協作、企業主號付款的需求。
- 子賬號只能共享企業主號的餘額,無財務管理權限,無法充值
- 子賬號需要單獨開通所需模型或購買量包
一、轉爲企業號
如您已經是企業號,可忽略此步驟。登錄賬號後點擊「個人中心 → 賬戶管理 → 轉爲企業號」,填寫信息即可。
二、子賬號管理
- 賬號創建:「個人中心 → 子賬號管理」按要求填寫子賬號信息;使用子賬號登錄地址登錄後綁定員工本人手機號。
- 用戶組添加:在「用戶組」可添加部門、團隊、子公司等用戶組。
- 角色管理:添加角色,目前只需對非默認菜單進行授權即可,模型廣場等默認菜單已默認展示。
🤖Hermes Agent 接入
Hermes Agent 配置使用 LeapX。詳細的圖文配置步驟請聯繫 LeapX 客服或參考控制臺「使用教程」頁。
https://api.ai-leapx.com/v1,API Key 在控制臺「API Key 管理」獲取。⌨️LeapX × Claude Code
使用 LeapX 平臺爲 Claude Code(Anthropic 官方 CLI)提供模型能力。詳細的圖文配置步驟請參考控制臺「使用教程」中的「平臺 X Claude Code」專題文檔。
ANTHROPIC_BASE_URL 指向 https://api.ai-leapx.com/v1,ANTHROPIC_AUTH_TOKEN 設置爲您的 LeapX API Key,即可使用 LeapX 提供的 Claude 系列模型。📝Cursor 中使用 Claude
前提條件
- 擁有一個 Cursor Pro 賬號(免費版只能短期試用 API 配置功能)。
- 在 ai-leapx.com 獲取 API Key,並確保已開通 Claude 系列的模型服務。
model 名稱包含 "claude" 字樣會自動走 Anthropic 路徑。因此 LeapX 對 Claude 模型做了別名(例如 kld-o-4.6 對應 claude opus 4.6),方便在 Cursor 中調用。Cursor 配置步驟
- 進入 Cursor 後臺「Settings → Models」,滑動頁面展開「API Keys」。
- 依次填寫:
API Keys:LeapX 控制臺獲取的 API 密鑰Base URL:https://api.ai-leapx.com/v1(務必填寫正確) - 開啓 API Keys 開關,添加新模型,點擊 Verify 校驗。校驗時使用的模型必須是 LeapX 提供的可用模型。
- 在對話區選擇 ASK 模式 + 配置的模型,即可開始使用。
🧩在 Cline 中使用
安裝 Cline
在 VSCode 中搜索並安裝 Cline 插件。
打開 Cline 配置
在 VSCode 中通過 Ctrl/Command + Shift + P 打開命令工具,在新 tab 中打開 Cline 進行配置。
配置項
| 項目 | 值 |
|---|---|
| API Provider | 選擇 OpenAI Compatible |
| Base Url | https://api.ai-leapx.com/v1 |
| API Key | 從 ai-leapx.com 控制臺獲取(參考快速開始) |
| Model ID | 從 ai-leapx.com 控制臺「開通管理」獲取 |
點擊 Let's Go 即可使用。
⚡在 Dify 使用海外高速 GPT
使用前可先在 ai-leapx.com 註冊賬號,新用戶可領 15 元代金券。
配置步驟
- 打開 Dify「Settings」。
- 選擇導航欄「Model Provider」,添加兼容 OpenAI 接口的模型插件(如 GPUSTACK)。
- 在插件中填寫:
Model Name 從 LeapX 控制臺「開通管理」獲取(OpenAI 插件只支持 GPT 系列) API Key LeapX 控制臺獲取 API 端點 URL https://api.ai-leapx.com/v1 - 設置完成後,可在模型列表中看到新增的模型。
📄WPS · OfficeAI 插件
一、安裝 OfficeAI 助手插件
- 訪問下載地址:office-ai.cn 下載頁
- 根據自身習慣進行安裝。
二、配置 WPS
- 打開文檔後選擇「文件 → 選項 → 信任中心」,勾選「啓用所有第三方 COM 加載項」,點擊確認。
- 確認後關閉 WPS 重啓,出現 OfficeAI 工具項。
三、設置 LeapX 大模型 API
點擊 OfficeAI → 設置 → 大模型 → 選擇「ApiKey」項,按以下任一方式添加配置:
方式一
| APIURL | https://api.ai-leapx.com/v1/chat/completions |
| API Key & 模型 ID | 從 ai-leapx.com 獲取 |
添加模型後點擊左側選擇即可出現。
方式二(兼容性更好)
點擊「新增服務商」,配置同上。注意:不要點擊"智能檢查"——智能檢查目前只對已集成到插件內的服務商有效。
配置完成後點擊 OfficeAI 插件,根據下方出現的工具欄使用相關功能,支持文檔、表格等。
🖼️在 Dify 中使用 LeapX 生成圖片
第一步:創建工具
- 打開 Dify 工作室,點擊「創建 → 工作流」,輸入自定義工作流名稱。
- 點擊創建後,點擊「設置 → 導入 DSL」,選擇 LeapX 提供的圖片生成工作流 DSL 文件導入。
- 發布工作流爲工具。
第二步:在 AI 應用中使用
創建自己的 AI 應用時,在編排頁面添加節點,選擇「工具」,選擇剛才發布的工作流工具;點擊節點進行工具參數設置即可使用。
🌐接入納米 AI
前提條件
需獲取 LeapX API Key,並確保已開通對應模型服務。由於納米 AI 的功能可能發生變化,模型的支持情況以實際效果為準。
配置步驟
- 搜索"納米 AI",下載 PC 客戶端並安裝運行。
- 點擊「大模型」進入大模型使用頁面。
- 點擊「自定義模型」→「添加模型」。
- 按要求填寫參數。API 地址使用以
/結尾的根路徑或完整路徑:根路徑 https://api.ai-leapx.com/完整路徑 https://api.ai-leapx.com/v1/chat/completions - 點擊「檢測」,檢測通過後自動開啓。
- 回到大模型對話頁面,選擇配置好的模型即可體驗,可配合納米 AI 聯網搜索與知識庫使用。
🍒接入 Cherry Studio
前提條件
- 已獲取 LeapX API Key,並開通對應模型服務
- 使用 Cherry Studio 1.6.0 及以上版本
下載客戶端
訪問 cherry-ai.com/download,按客戶端版本下載並安裝。
客戶端配置
- 打開客戶端,點擊「設置 → 模型服務」,選擇 LeapX 服務商(如未內置,可選「OpenAI Compatible」自定義服務商)。
- 填寫 API Key 與 Base URL
https://api.ai-leapx.com/v1。 - 點擊「管理」,獲取模型列表,添加可用模型。
- 點擊「助手」按鈕,選擇配置的服務商和模型,即可進行對話。
🧭瀏覽器插件 — Sider
- 安裝 Sider 插件:在 Sider 官方網站下載並添加到瀏覽器。
- 進入通用配置:選擇「OpenAI API key」,打開「使用我自己的網址」、「使用自定義模型名稱」。
- 獲取 LeapX URL 與 Key:在 LeapX 控制臺點擊「API Key」獲取 Key;點擊「開通管理」獲取 URL 與 Model ID。
- 配置 Sider:將 URL、Key 與模型 ID 填入即可使用。
Base URL https://api.ai-leapx.com/v1
🔍瀏覽器插件 — Glarity
- 安裝 Glarity 插件:在 Glarity 官方網站下載並添加到瀏覽器。
- 進入通用配置:選擇「OpenAI API key」,打開「高級配置」。
- 填入 LeapX 配置:
API Key LeapX 控制臺獲取 Base URL https://api.ai-leapx.com/v1Model LeapX 控制臺「開通管理」獲取的 Model ID
🧠思考參數說明
各家模型廠商的思考(推理)參數不同,請按照所用模型選擇對應的參數配置。
僅適用於推理模型,約束推理工作量。減少推理工作可加快響應速度並減少 Token 消耗。
配置 Claude 的擴展思考功能。啓用時響應包含思考過程內容塊。需要至少 1024 token 預算,並計入 max_tokens 限制,開啓思考時 max_tokens ≥ 1024。type 爲必填值,開啓思考時 budget_tokens 爲必填值。
// 開啓思考 "thinking": {"type": "enabled", "budget_tokens": 1024} // 關閉思考 "thinking": {"type": "disabled"}
type 爲必填字段。
開啓後思考內容通過 reasoning_content 字段返回。
對於 Pro 版本,思考功能無法關閉。thinking_level 與 thinking_budget 不能同時存在(同時存在返回 400)。
// 開啓思考 "thinking_config": {"include_thoughts": true, "thinking_budget": 1024} // 關閉思考 "thinking_config": {"include_thoughts": false, "thinking_budget": 0} // Gemini 3 新參數(簡化級別,僅 Gemini 3 支持) "thinking_config": {"thinking_level": "low"}
thinking_budget 取值範圍(Gemini 2.5):
| 型號 | 最低 Token | 最高 Token |
|---|---|---|
| Gemini 2.5 Flash | 1 | 24,576 |
| Gemini 2.5 Pro | 128 | 32,768 |
| Gemini 2.5 Flash-Lite | 512 | 24,576 |
參考:Google 官方文檔
💬Messages 參數說明(Chat Completions)
本章節描述 /v1/chat/completions 接口中 messages 數組的字段結構。每條消息屬於一個角色(Role),消息列表按對話順序排列。
用於告知模型角色或行爲。默認值爲 "You are a helpful assistant"。也可以將此類指令放在 user message 中,但放在 system message 中會更有效。
- content必填 String — 系統消息內容
- role必填 String — 固定爲
"system" - name可選 String — 對話參與者名稱
用戶輸入給模型的內容。content 支持純文本或多模態數組(多模態數組僅多模態模型支持)。
- role必填 String — 固定爲
"user" - content必填 String | Array — 文本或多模態內容數組
- name可選 String — 對話參與者名稱
| 類型 | 關鍵字段 | 說明 | 支持模型 |
|---|---|---|---|
text | type, text | 文本內容 | 所有模型 |
image_url | type, image_url.url, image_url.detail | 圖片 URL 或 Base64 | 多模態模型 |
video_url | type, video_url.url, videoMetadata / fps | 視頻內容。doubao 系列最大 50M;Gemini HTTP 網址最大 15MB;GCS 存儲桶 URI 最大 2GB(gemini-2.0-flash 及以上) | Gemini、豆包 |
file | type, file.file_data, file.filename, file.file_type | 文件 Base64。亞馬遜廠商模型必傳 file_type,支持 pdf / csv / doc / docx / xls / xlsx / html / txt / md | 亞馬遜、谷歌雲 |
input_audio | type, input_audio.data, input_audio.format | 音頻 Base64 或谷歌存儲桶數據,例 audio/mp3 | Gemini |
模型的回覆;也可預填充作爲後續回復的示例。
- content必填* String — 助手消息內容(指定 tool_calls 時除外)
- role必填 String — 固定爲
"assistant" - name可選 String — 對話參與者名稱
- tool_calls可選 Array — 模型生成的工具調用列表,每項含 id / type(僅支持
"function")/ function(name + arguments)
📐返回格式化
OpenAI 系列 — response_format
對象類型,非必填,指定模型必須輸出的格式。
| 設置值 | 效果 |
|---|---|
{"type": "json_schema", "json_schema": {...}} | 結構化輸出,模型輸出匹配指定 JSON Schema |
{"type": "json_object"} | JSON 模式,輸出爲合法 JSON |
谷歌 Gemini 系列
| 參數 | 說明 |
|---|---|
| response_mime_type | text/plain(默認)/ application/json / text/x.enum |
| response_schema | 非必填,指定輸出結構。需配合非 text/plain 的 MIME 類型使用 |
Schema 對象屬性:
| 屬性 | 類型 | 必需 | 說明 |
|---|---|---|---|
| type | 枚舉 | 必填 | 數據類型 |
| description | 字符串 | 可選 | 字段描述 |
| enum | 數組 | 可選 | 枚舉值列表(type 爲 string 時) |
| example | 任意 | 可選 | 示例值 |
| nullable | 布爾 | 可選 | 是否可爲 null |
| format | 字符串 | 可選 | 字符串格式(如 date、date-time) |
| items | 對象 | 可選 | 數組項 Schema(type 爲 array 時) |
| properties | 對象 | 可選 | 對象屬性 Schema(type 爲 object 時) |
| required | 數組 | 可選 | 必需屬性名稱列表 |
| minimum / maximum | 數字 | 可選 | 數字範圍 |
| minItems / maxItems | 整數 | 可選 | 數組長度範圍 |
| minLength / maxLength | 整數 | 可選 | 字符串長度範圍 |
⚠️錯誤碼
通用錯誤格式(OpenAI / 圖片接口)
{
"error": {
"message": "錯誤描述信息",
"type": "錯誤類型",
"code": null
}
}
Gemini 錯誤格式
{
"error": {
"code": 400,
"message": "錯誤描述信息",
"status": "INVALID_ARGUMENT"
}
}
常見錯誤碼
| HTTP | status | 說明 |
|---|---|---|
| 400 | INVALID_ARGUMENT | 請求參數錯誤 |
| 401 | UNAUTHENTICATED | API Key 無效或缺失 |
| 403 | PERMISSION_DENIED | 無權訪問該模型或功能(含 GCS 私有桶訪問拒絕等) |
| 404 | NOT_FOUND | 模型不存在或已退役 |
| 429 | RESOURCE_EXHAUSTED | 超出速率限制 / 配額耗盡 |
| 500 | INTERNAL | 服務器內部錯誤 / 模型服務調用異常 |
| 503 | UNAVAILABLE | 服務暫時不可用 |