# 阶梯定价说明

官方直连按照模型厂商的定价格式定价。

对话的输入消耗采用阶梯定价机制：**根据当前对话的输入 token 判断档位，采用不同的定价。**&#x20;

针对各家模型厂商的缓存机制做了适配，最大程度减少重复输入的实际计费。

每次对话请求，输入部分会被拆分为三种计费类型：

* **非缓存输入**：首次出现的新内容，按输入原价计费
* **缓存写入**：新内容写入缓存时产生的费用，略高于输入原价（为后续请求节省成本）
* **缓存命中**：之前已缓存的内容被复用，价格远低于原价

随着对话推进，前面的上下文会逐渐被缓存覆盖，实际新增输入占比越来越小，大部分内容走缓存命中，整体输入成本显著低于全量计费。

> **阶梯判定依据**：以当前对话已积累的输入 token 数为准。即：非缓存、缓存读取、缓存写入总和。

### 千问 3.5 Plus

<table><thead><tr><th width="92.390625">阶梯</th><th width="149.71875">输入费用</th><th width="151.28125">输出费用</th><th width="172.53515625">缓存读取</th><th>缓存写入</th></tr></thead><tbody><tr><td>0~128k</td><td><p>罐头0.5 </p><p>猫粮1.5</p></td><td><p>罐头3 </p><p>猫粮9</p></td><td><p>罐头0.05 </p><p>猫粮0.15</p></td><td><p>罐头0.63 </p><p>猫粮1.88</p></td></tr></tbody></table>

### GLM - 5

芝士菜谱渠道

<table><thead><tr><th width="92.390625">阶梯</th><th width="170.3125">输入费用</th><th width="168.01171875">输出费用</th><th width="157.35546875">缓存读取</th><th>缓存写入</th></tr></thead><tbody><tr><td>0~32k</td><td><p>罐头3.5 </p><p>猫粮13.5</p></td><td><p>罐头15.75 </p><p>猫粮60.75</p></td><td><p>罐头 0.88</p><p>猫粮 3.38</p></td><td>-</td></tr><tr><td>32k+</td><td><p>罐头5 </p><p>猫粮20.5</p></td><td><p>罐头18.33</p><p>猫粮75.17</p></td><td><p>罐头1.25 </p><p>猫粮5.13</p></td><td>-</td></tr></tbody></table>

阿丽云吞渠道

<table><thead><tr><th width="92.390625">阶梯</th><th width="170.3125">输入费用</th><th width="165.55078125">输出费用</th><th width="157.35546875">缓存读取</th><th>缓存写入</th></tr></thead><tbody><tr><td>0~32k</td><td><p>罐头 2.5 </p><p>猫粮 9.5</p></td><td><p>罐头 11.25 </p><p>猫粮 42.75</p></td><td><p>罐头 0.5 </p><p>猫粮 1.9</p></td><td>-</td></tr><tr><td>32k+</td><td><p>罐头 3.5 </p><p>猫粮 14.5</p></td><td><p>罐头 12.83 </p><p>猫粮 53.17</p></td><td><p>罐头 0.7 </p><p>猫粮 2.9</p></td><td>-</td></tr></tbody></table>

### Doubao Seed 2.0 pro

<table><thead><tr><th width="92.390625">阶梯</th><th width="170.3125">输入费用</th><th width="165.55078125">输出费用</th><th width="157.35546875">缓存读取</th><th>缓存写入</th></tr></thead><tbody><tr><td>0~32k</td><td><p>罐头 2.5 </p><p>猫粮 10</p></td><td><p>罐头 12.50 </p><p>猫粮 50.00</p></td><td><p>罐头 0.5 </p><p>猫粮 2.0</p></td><td>-</td></tr><tr><td>32k+</td><td><p>罐头 3.7</p><p>猫粮 15</p></td><td><p>罐头 18.50 </p><p>猫粮 75.00</p></td><td><p>罐头 0.74</p><p>猫粮 3.0</p></td><td>-</td></tr></tbody></table>

### Doubao Seed 2.0 lite

<table><thead><tr><th width="92.390625">阶梯</th><th width="170.3125">输入费用</th><th width="165.55078125">输出费用</th><th width="157.35546875">缓存读取</th><th>缓存写入</th></tr></thead><tbody><tr><td>0~32k</td><td><p>罐头 0.5</p><p>猫粮 2</p></td><td><p>罐头 3.00 </p><p>猫粮 12.00</p></td><td><p>罐头 0.1 </p><p>猫粮 0.4</p></td><td>-</td></tr><tr><td>32k+</td><td><p>罐头 0.7</p><p>猫粮 2.8</p></td><td><p>罐头 4.20 </p><p>猫粮 16.80</p></td><td><p>罐头 0.14 </p><p>猫粮 0.56</p></td><td>-</td></tr></tbody></table>


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.mufy.ai/model/jie-ti-ding-jia-shuo-ming.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
