V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
FaiChou
V2EX  ›  程序员

OCR 识别转 Excel 并将 cm 转成 inch

  •  
  •   FaiChou ·
    FaiChou · 2021-02-23 14:39:00 +08:00 · 1735 次点击
    这是一个创建于 1151 天前的主题,其中的信息可能已经有所发展或是发生改变。

    excel

    这样一个图片形式的表格(单位 cm), 经过工具处理得到一个以 inch 为单位的表格文件. 有工具可以完成吗?

    目前我的习惯是:

    1. 使用白描网页版识别表格
    2. 复制到 Excel
    3. 使用公式将数据转为 inch 单位 =ROUND(x / 2.54, 1)

    但图片中有些数据是区间的, 比如 82~92, 所以要么取一个平均值, 要么分离这倆数据再进行转换, 但都需要人工去处理 Excel, 很花时间..

    所以有没有工具可以处理这种情况? OCR -> cm to inch -> 可以复制到 excel 的格式数据

    (做外贸会经常做这种表格)

    第 1 条附言  ·  2021-02-24 10:22:52 +08:00

    群里大佬给的公式, tql:

    =ROUND(LEFT(H2,SEARCH("-",H2)-1)/2.54,1)&"-"&ROUND(RIGHT(H2,SEARCH("-",H2)-1)/2.54,1)
    
    5 条回复    2021-02-24 11:35:11 +08:00
    Latin
        1
    Latin  
       2021-02-23 15:18:37 +08:00
    学下 Python 不到一天你就能解决
    milk97
        2
    milk97  
       2021-02-23 18:17:30 +08:00   ❤️ 1
    拿来直接就来用的工具不清楚有没有,如果自己代码实现的话我有个思路

    1. 通过表格识别 API 接口识别图片,拿到结果。这里可以将结果保存到 excel 文件中
    2. 读取结果并处理,如果结果在第一步保存到了 excel 那么用 pandas 读取就行。然后用公式转一下,对于有区间的,先以 - 分隔得到两个数字然后分别处理再组合再一起就行。
    3. 把处理后的结果保存到 excel 中。

    Python 做应该是最简单的。如果到时候可能分享给其他同事用,也可以用 Golang,可以直接打包成 exe 文件。
    YouMoeYi
        3
    YouMoeYi  
       2021-02-23 18:50:36 +08:00 via Android
    LZ 是做 AliExpress 的吗,现成的工貌似没有,但是写一个很容易,思路楼上有说了
    renmu123
        4
    renmu123  
       2021-02-23 19:23:57 +08:00 via Android
    第一步是最麻烦的,你不知道 ocr 工具是否正确,以及是否完美转换成表格形式,需要人工介入审查
    fanyingmao
        5
    fanyingmao  
       2021-02-24 11:35:11 +08:00
    我之前开发一个可根据配置灵活提取图片内容,然后做一些简单的内容拼接的工具,最后后进行自动填入第三方的工具,不过这个场景我没想到所以你可以参考看下,代码开源了。
    https://www.bilibili.com/video/BV1Vy4y1J7c6/
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   1629 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 16:46 · PVG 00:46 · LAX 09:46 · JFK 12:46
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.