由于很多大模型 API 有 requests per second 这类请求速率限制,因此 vibe coding 了一个小代理,设置好模型的 rpm ,它会帮你管理请求,太快的,就排队,这样就不会触发 429 错误。
用的 Python ,应该可以在 Linux/MacOS/Windows 上运行使用。
Open Source repo:
https://github.com/adrianzhang/LimitRateAPI
缘由:
使用 Hermes+免费 API ,很频繁遇到 429 ,一个小事情做着做着就断了,非常烦人。有了这个代理,Hermes 可以顺畅运行了。
这是我第一个 vibe coding 项目,希望能帮助有同样需求的人。代码是 GLM5.2 写的,如果有问题,去喷智谱:)
用的 Python ,应该可以在 Linux/MacOS/Windows 上运行使用。
Open Source repo:
https://github.com/adrianzhang/LimitRateAPI
缘由:
使用 Hermes+免费 API ,很频繁遇到 429 ,一个小事情做着做着就断了,非常烦人。有了这个代理,Hermes 可以顺畅运行了。
这是我第一个 vibe coding 项目,希望能帮助有同样需求的人。代码是 GLM5.2 写的,如果有问题,去喷智谱:)