很高频的一个需求,领导不知道从哪发了一张表格的照片给你,要你做一个电子版出来。
市面上有些能图片转 Word ,Excel 的工具,但是效果都不理想。AI 模型 OCR 识别率超高,但是都是给你输出 Markdown 的格式,所以有能直接吐文件的 AI 吗
|      1nulIptr      296 天前 那不就是扫描全能王这种软件么,ios 付费榜常年第一 | 
|      2ccraohng      296 天前 夸克的也不错 | 
|  |      3maymay5      296 天前 | 
|      4ijk0      295 天前 via iPhone ChatGPT 应该可以吧 python 转完给你下载地址 | 
|      5Leon1234567      239 天前 正好今天有需求,要转一个大几十页的 PDF 里的全部模糊表格(表格应该是拍照后 merge 成 PDF 的),市场上一个好用的 AI 工具都没有(试了 Grok, ChatGPT, Perplexity, Gemini, Claude, Kimi, 文小言, ds, 元宝, 通义, 豆包)。倒是都能转成网页显示的表格(Grok 会输出 HTML 代码,预览后就是表格),复制黏贴到 Excel 就行了。白描也试了,数据识别没问题,文字识别很差(一条文字经常被分割成好几条)。ChatGPT 可以生成直接下载的 Excel 表格,可惜没用,因为数据都能少一列,其他内容也识别的一塌糊涂。国外工具识别简中真的差。不过最离谱的是百度,输出的表格和提供的完全就不是一个东西,没有一条能对上的,张三李四王五这些东西都出来了,一切随心所欲,有一条能对上算我输。 最后 Kimi+腾讯混元结合用的,表头一旦复杂(涉及到合并等形式)所有 AI 工具都失效,比如 15 列给你输出 13 列,只能截图(没表头的数据)识别,而且每次输出还得肉眼仔细核对(因为经常有出入)。 | 
|  |      6lurui45 OP @Leon1234567 怎么结合使用 | 
|      7Leon1234567      239 天前 @lurui45 就是针对不同类型的表格,有时候 Kimi 好用,有时候混元好用,纯玄学。总的来说就一条建议吧,复杂表格最好是简单的一行一行的,没有任何合并操作,每个行列只对应一条数据,然后再去识别吧,不然真是有的搞了。。。 |