Lime
LLM API

用同一个 Lime 入口调用云端模型

面向开发者的 OpenAI / Anthropic 兼容入口。客户端只需要接入 Lime Base URL 和 Lime API Key,模型目录、套餐权限、额度预占和用量结算由 Lime 统一处理。

Base URL

https://llm.limeai.run

鉴权

API Key + X-Lime-Tenant-ID

模型来源

GET /v1/models 返回当前租户可见目录

公网入口

只接入 limecore gateway-svc

Quick start

先列模型,再发起一次流式请求

模型名不要硬编码。先从当前租户的模型目录读取可用模型,再把模型 id 填入兼容协议请求。

获取模型目录
curl "https://llm.limeai.run/v1/models" \
  -H "Authorization: Bearer $LIME_API_KEY" \
  -H "X-Lime-Tenant-ID: $LIME_TENANT_ID"

OpenAI-compatible

Chat Completions

OpenAI SDK 或兼容 HTTP 客户端可把 Base URL 指向 Lime。Chat、Responses、Models 和 Embeddings 属于首期主路径。

curl -N "https://llm.limeai.run/v1/chat/completions" \
  -H "Authorization: Bearer $LIME_API_KEY" \
  -H "X-Lime-Tenant-ID: $LIME_TENANT_ID" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "<model-id-from-/v1/models>",
    "messages": [
      { "role": "user", "content": "你好,Lime" }
    ],
    "stream": true
  }'

Anthropic-compatible

Messages

Anthropic 兼容请求可以使用 x-api-key,网关会保留必要协议 header,并在内部替换为真实 upstream 鉴权。

curl -N "https://llm.limeai.run/v1/messages" \
  -H "x-api-key: $LIME_API_KEY" \
  -H "X-Lime-Tenant-ID: $LIME_TENANT_ID" \
  -H "anthropic-version: 2023-06-01" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "<model-id-from-/v1/models>",
    "max_tokens": 1024,
    "messages": [
      { "role": "user", "content": "用三句话解释 Lime LLM API" }
    ]
  }'

统一入口

OpenAI SDK、Anthropic SDK 和普通 HTTP 客户端都先进入同一个 Lime 网关,客户端无需感知后面的供应层。

商业闭环

API Key、租户、套餐、积分、额度预占和用量提交都在 Lime 侧完成,不暴露 upstream key。

流式代理

Chat、Responses 和 Messages 主路径支持 JSON 与 SSE,响应体尽量按原协议透传。

私网上游

new-api、sub2api 和 direct upstream 只作为内部路由候选,不作为开发者公网 Base URL。

首期主路径

协议Endpoint级别说明
ModelsGET /v1/modelsP0返回 Lime 可见模型目录
Chat CompletionsPOST /v1/chat/completionsP0OpenAI-compatible 主路径
ResponsesPOST /v1/responsesP0新项目推荐主路径
Anthropic MessagesPOST /v1/messagesP0Anthropic-compatible 主路径
EmbeddingsPOST /v1/embeddingsP0非流式输入侧计费

边界要清楚

开发者只接 Lime 网关

llm.limeai.run 是 current 公网入口。客户端不要直接访问 new-api、sub2api 或其他供应层。

模型目录以租户为准

不同套餐、租户和品牌配置会看到不同模型。真实可用性以 /v1/models 返回为准。

长尾协议按需求开放

Files、Batches、Fine-tuning 等能力不作为首期官网承诺,具体排期看协议覆盖矩阵。

深入资料

官网只放接入入口和稳定边界。协议细节、部署拓扑和治理分类继续以仓库文档为事实源。

返回开发者入口