爱意满满的作品展示区。
adrianzhang

LimitRateAPI,避免 429

  •  
  •   adrianzhang · 1 day ago · 848 views
    由于很多大模型 API 有 requests per second 这类请求速率限制,因此 vibe coding 了一个小代理,设置好模型的 rpm ,它会帮你管理请求,太快的,就排队,这样就不会触发 429 错误。

    用的 Python ,应该可以在 Linux/MacOS/Windows 上运行使用。

    Open Source repo:
    https://github.com/adrianzhang/LimitRateAPI

    缘由:
    使用 Hermes+免费 API ,很频繁遇到 429 ,一个小事情做着做着就断了,非常烦人。有了这个代理,Hermes 可以顺畅运行了。

    这是我第一个 vibe coding 项目,希望能帮助有同样需求的人。代码是 GLM5.2 写的,如果有问题,去喷智谱:)
    4 replies    2026-06-20 19:42:50 +08:00
    slowman
        1
    slowman  
       1 day ago
    等待,还不如手动 fallback 到其他可用后端
    adrianzhang
        2
    adrianzhang  
    OP
       1 day ago
    @slowman 好主意。但是只有几个免费 API 的时候就经常把全部 API 都超了。Hermes 这类 agent 经常大量发请求。
    getadoggie
        3
    getadoggie  
       22h 40m ago via iPhone
    hermes 不会自动重试吗
    adrianzhang
        4
    adrianzhang  
    OP
       22h 0m ago
    @getadoggie 不会呀,至少我用的时候不会,它只会 fallback ,还是我设置了它才能。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2595 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 38ms · UTC 09:43 · PVG 17:43 · LAX 02:43 · JFK 05:43
    ♥ Do have faith in what you're doing.