V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
shebaoting
V2EX  ›  程序员

[沉浸式翻译] 这个浏览器扩展的翻译原理是什么样子的

  •  
  •   shebaoting · 67 天前 · 2471 次点击
    这是一个创建于 67 天前的主题,其中的信息可能已经有所发展或是发生改变。

    我使用的是 [沉浸式翻译] 这个浏览器扩展。然后使用的某个 AI 的 api 。

    我想请教一下各位,他是一段一段的发送给 AI 翻译,还是整篇发给 AI 进行翻译?

    如果是整篇翻译,很容易超出 AI 的限定长度。

    如果是一小段一小段的发给 AI 翻译,怎么能保证上下文连贯,语义一致并且意思相通呢?

    17 条回复    2024-09-14 09:31:52 +08:00
    z7356995
        1
    z7356995  
       67 天前 via Android
    应该是一段一段的,如果你看油管上的视频英语字幕,你会发现上下句之间并不能连接翻译,
    xu33
        2
    xu33  
       67 天前
    这个应该不是 ai 翻译的吧,感觉翻译质量很差,和 gpt 甚至 kimi 之类的都没法比
    shebaoting
        3
    shebaoting  
    OP
       67 天前
    如果是一段一段,做到上下文语义连贯就是个很麻烦的事情了。
    shebaoting
        4
    shebaoting  
    OP
       67 天前
    @xu33 可以在设置里面设置你喜欢的 ai 。用自己的 api 密钥。
    xu33
        5
    xu33  
       67 天前
    @shebaoting 原来如此,我试试
    ao99
        6
    ao99  
       67 天前
    不知道具体怎么实现的,如果想实现上下文连贯的话可以几段一起翻译,然后每次总结下之前的翻译内容,当做上下文给下次翻译输入
    IDKAFK
        7
    IDKAFK  
       67 天前
    我记得是可以自定义段落数和文本长度的
    XIU2
        8
    XIU2  
       67 天前
    你可以看一下另一个功能类似但开源的 fishjar/kiss-translator 代码是怎么实现的。
    我记得这个作者好像也在 V2EX ?反正我也是在 V2EX 里发现这个项目的。
    moudy
        9
    moudy  
       67 天前
    @shebaoting #3 有没有可能重叠发送呢?发送段落 1 2 3 4 5 , 显示 1 2 3 4 5 。 在发送 4 5 6 7 8 , 显示 6 7 8 ?
    iX8NEGGn
        10
    iX8NEGGn  
       67 天前
    设置里不是有说明吗,可以一段一个请求的,也可以多段一个请求,多段的时候用提示要求返回固定的格式,但这对模型的指令遵循性要求比较高。
    msrcatn203
        11
    msrcatn203  
       67 天前
    内置 prompt 呗 有个上下文长度加上要求流利自然什么的 GPT 翻译不都是这么做的吗
    aitianci
        12
    aitianci  
       67 天前   ❤️ 1
    作者有个新闻项目叫 Buzzing ,那个项目的 TG 群可以问他
    GrayXu
        13
    GrayXu  
       67 天前
    可以一段发,也可以小 batch 发。对应不同的 prompt ,你看设置就知道了。
    lmdown
        14
    lmdown  
       67 天前
    ai 会自动关联上文啊😂
    baidishenjian
        15
    baidishenjian  
       66 天前
    肯定不是整篇,而是一段一段处理的,如果是整篇都没有办法和对应的文本对齐啊。沉浸式翻译不是一段中文一段英文吗,那应该就是那一堆英文送进去得到一段中文,然后把中文附加到段落后面。整个流程应该不复杂,遍历网页上的标签( p div span )然后把段落中的文本翻译,然后附加到句子后面。我之前做过有点类似的功能插件 https://github.com/woniu9524/dingdang-extension
    ily433664
        16
    ily433664  
       65 天前
    可以分成多段一起发,比如
    {
    第一段:xxx
    第二段:xxx
    第 N 端:xxx
    }
    放在一起发过去,写好 prompt 就行了
    iorilu
        17
    iorilu  
       65 天前   ❤️ 1
    很简单

    先分段

    然后将每段发给 ai , 做两件事
    1. 翻译
    2. 总结

    然后发下一段时, 带上前 1,2 段的总结, 让 ai 参考翻译下一段
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1387 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 23:44 · PVG 07:44 · LAX 15:44 · JFK 18:44
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.