API 文档

统一接口说明、快速接入指南与错误处理参考。

概览

TokenColo 是统一的 AI 模型网关,聚合国产主流大模型。一次接入即可调用多家厂商,在控制台集中管理密钥、配额与路由策略。

核心能力:统一 API · 模型目录 · 用量统计 · 速率限制 · 智能路由与故障转移 · 密钥分级管理

Base URL

https://api.tokencolo.com/v1

认证方式

Authorization: Bearer <your_tokencolo_key>

接口概览

接口方法地址说明
对话补全POST/v1/chat/completions文本对话,支持流式输出、Tool Calling 与多模态
创建视频任务POST/v1/video/generations提交视频生成任务,返回 task_id
查询视频任务GET/v1/video/generations/{task_id}查询任务进度与生成结果
模型列表GET/v1/models获取当前账号可用的全部模型

快速开始

三步完成接入:注册账号 → 创建 API Key → 发起首次请求。协议兼容 OpenAI,现有客户端库无需改动。

1. 安装 OpenAI SDK

# Python
pip install openai

# Node.js
npm install openai

2. 设置 API Key

# macOS / Linux
export API_KEY="your_tokencolo_key"

# Windows PowerShell
$env:API_KEY="your_tokencolo_key"

3. 发起第一次请求

from openai import OpenAI
import os

client = OpenAI(
    base_url="https://api.tokencolo.com/v1",
    api_key=os.environ["API_KEY"]
)

response = client.chat.completions.create(
    model="glm-5",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "你好,请介绍一下 TokenColo"}
    ],
    max_completion_tokens=1024,
    temperature=0.7
)

print(response.choices[0].message.content)

cURL 示例

curl -sS "https://api.tokencolo.com/v1/chat/completions" \
  -H "Authorization: Bearer $API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "glm-5",
    "messages": [{"role": "user", "content": "你好"}],
    "max_completion_tokens": 256
  }'

流式响应

for chunk in client.chat.completions.create(
    model="glm-5",
    messages=[{"role": "user", "content": "给我讲个故事"}],
    stream=True
):
    if chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end="")
⚠️ 注意:流式响应在 [DONE] 之前可能包含一条 choices 为空、仅含 usage 的 chunk。解析时请跳过 choices 为空的片段,避免数组越界。

API 密钥

请在 TokenColo 控制台 创建与管理 API Key。密钥请存入环境变量,勿写入代码或提交至仓库。

调用须知:
  • API Key 须在控制台创建后方可使用
  • messages 为必填参数
  • 对话接口路径为 /v1/chat/completions

LLM 对话接口

适用于 glm-5、glm-5.1、kimi-k2.5、deepseek-v3.2、qwen3.6-plus、MiniMax-M2.5 等主流国产模型。

请求参数

参数类型必填默认值说明
modelstring模型 ID
messagesarray对话消息列表
streambooleanfalse是否流式返回
max_completion_tokensinteger1024最大生成 Token 数
temperaturefloat0.7采样温度(0-2)
response_formatobject{"type":"text"}设为 {"type":"json_object"} 启用 JSON 模式
toolsarray工具定义列表
tool_choicestringautoauto / none / required

响应字段

字段说明
choices[0].message.content回复文本(最终回答)
choices[0].message.reasoning_content思维链推理过程(仅 glm-5/5.1/qwen3.6-plus)
choices[0].message.tool_calls工具调用列表(Tool Calling 时)
usage.prompt_tokens输入 Token 数
usage.completion_tokens输出 Token 数

JSON Mode 示例

response = client.chat.completions.create(
    model="deepseek-v3.2",
    messages=[{"role": "user", "content": "列出3个AI应用场景"}],
    response_format={"type": "json_object"}
)

Tool Calling 示例

tools = [{
    "type": "function",
    "function": {
        "name": "get_weather",
        "description": "获取指定城市的天气",
        "parameters": {
            "type": "object",
            "properties": {"city": {"type": "string"}},
            "required": ["city"]
        }
    }
}]

response = client.chat.completions.create(
    model="kimi-k2.5",
    messages=[{"role": "user", "content": "北京天气怎么样?"}],
    tools=tools, tool_choice="auto"
)
⚠️ tool_call_id:不同模型返回的 ID 格式可能不同,回传工具结果时请原样使用模型返回的 tool_call_id

图片理解(仅 kimi-k2.5)

response = client.chat.completions.create(
    model="kimi-k2.5",
    messages=[{
        "role": "user",
        "content": [
            {"type": "text", "text": "描述这张图片"},
            {"type": "image_url", "image_url": {"url": "https://example.com/img.jpg"}}
        ]
    }]
)

Seedance 2.0 视频生成

Seedance 2.0 由字节跳动推出,支持文本、图片、音频、视频四种模态混合输入,适合复杂镜头与多素材参考场景。

模型规格

参数说明
模型 IDgenerate_video_seedance_v2_0
最大时长15 秒
分辨率720p / 1080p
宽高比16:9 / 9:16 / 1:1
参考图片上限9 张
参考视频上限3 段
参考音频上限3 段
⚠️ 调用须知:
  • 视频接口需单独开通权限,请联系官方获取 Key
  • prompt 为必填,不可为空
  • 接口路径为 /v1/video/generations

创建视频任务

curl -sS -X POST "https://api.tokencolo.com/v1/video/generations" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_KEY" \
  -d '{
    "model": "generate_video_seedance_v2_0",
    "prompt": "一只猫在雪地里奔跑,慢动作,电影感",
    "service_tier": "default"
  }'
# 返回:{"task_id": "task_xxx..."}

查询任务状态

curl -sS "https://api.tokencolo.com/v1/video/generations/{task_id}" \
  -H "Authorization: Bearer YOUR_KEY"
# status: PENDING / RUNNING / COMPLETED / FAILED
# data.data.content.video_url: 视频地址(24小时有效)

用例速查

用例输入模态角色(role)
纯文生视频prompt
仅首帧图片 × 1first_frame
参考图图片 × 1reference_image
首帧 + 尾帧图片 × 2first_frame + last_frame
视频 + 音频视频 + 音频reference_video + reference_audio
多参考图图片 × 9reference_image
三模态混合图 + 视频 + 音频全三种 role

使用限制

限制项说明
视频 URL 有效期24 小时
并发任务数建议每次 ≤ 2 个
生成耗时纯文生 2-5 分钟,带素材 5-10 分钟

错误码

HTTP错误码说明解决方案
400invalid_request请求参数不合法检查 messages、model、prompt 等字段
400model_not_found模型不存在或未开通核对 model 名称与账号权限
401API Key 无效或过期在控制台重新创建或更换 Key
403无权访问该接口确认已开通对应模型/能力
429请求频率超限降低 QPS 或申请提额
500服务端内部错误稍后重试;持续出现请联系支持
503model_not_found当前无可用路由更换模型或联系管理员

FAQ

哪些模型会返回 reasoning_content?

glm-5、glm-5.1、qwen3.6-plus 等推理模型会返回思维链内容;最终回复请以 content 为准。

Seedance 任务失败或认证报错?

建议将并发控制在 2 个任务以内,失败后间隔约 5 秒重试。