V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
wgit
V2EX  ›  程序员

怎么实现对翻译引擎的术语库进行自定义

  •  
  •   wgit · 2022-11-05 21:28:30 +08:00 · 1079 次点击
    这是一个创建于 509 天前的主题,其中的信息可能已经有所发展或是发生改变。
    场景:
    对翻译引擎给出的翻译答案不满意
    但有大量的翻译需求,不得不使用免费的 api

    需求:
    想某些单词使用预设的解释 或某些单词选择不翻译

    当前的想法:
    为了一劳永逸,客户端通过 host 指向代理服务器
    后端服务器对数据进行正则标记,然后发送给 api 服务器
    得到的结果再正则进行内容替换,返回给客户端最终结果
    (见下方的图 1 )

    遇到的困难:
    希望支持高并发
    后端只会一些 python ,需要每秒接受大概至少 10 个请求,并对这些内容进行处理
    api 服务器有速率限制,太快会返回无效内容,要对请求分发到多个 api
    术语库少的话应该不难,如果术语定义了比如上千条或更多,可能会遇到各种瓶颈


    时间上还有几个月,希望能完成这个项目
    希望得到一些的建议或指点





    图一




    图二
    5 条回复    2022-11-05 22:40:40 +08:00
    l0o0
        1
    l0o0  
       2022-11-05 21:44:30 +08:00
    小牛翻译是支持自定义词汇的,我试过,自定义效果可以
    wgit
        2
    wgit  
    OP
       2022-11-05 21:48:42 +08:00
    @l0o0 #1 好像挺贵的,我是个人使用经济能力有限....
    每个月需要翻译大概几千万字符
    bigtear
        3
    bigtear  
       2022-11-05 22:09:59 +08:00
    刚好看到在用的这个翻译插件支持自定义翻译源,你可以看看
    https://github.com/chunibyocola/sc-translator-crx/discussions/50
    bigtear
        4
    bigtear  
       2022-11-05 22:22:20 +08:00
    @bigtear 对了,这个翻译插件还支持自定义词汇,正则替换词汇,应该能满足你的需求。
    https://github.com/chunibyocola/sc-translator-crx
    wgit
        5
    wgit  
    OP
       2022-11-05 22:40:40 +08:00
    @bigtear #2#3 非常感谢,我去研究研究
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   1048 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 22:35 · PVG 06:35 · LAX 15:35 · JFK 18:35
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.