V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
huntzhan
V2EX  ›  分享创造

vkit,一个面向计算机视觉(特别是文档图像分析与识别方向)开发者的工具包

  •  2
     
  •   huntzhan ·
    huntzhan · 2021-11-30 12:56:59 +08:00 · 1874 次点击
    这是一个创建于 849 天前的主题,其中的信息可能已经有所发展或是发生改变。

    传送门: https://github.com/vkit-dev/vkit

    一图胜千言😄:

    camera_cubic_curve.gif
    gaussion_noise.gif

    项目简介

    vkit 是一个面向计算机视觉(特别是文档图像分析与识别方向)开发者的工具包,特性如下:

    • 丰富的数据增强策略支持
      • 支持常见的光度畸变策略,如各类色彩空间操作、各类噪音操作
      • ⭐ 支持常见的几何畸变策略,如各类仿射变换、各类非线性变换(如 Similarity MLS ,基于相机模型的 3D 曲面、翻折效果等)
      • ⭐ 支持在几何畸变过程中,图片与各种标注数据类型的一致变换。例如,在旋转图片的同时,vkit 也可以同时旋转关联标注的位置信息
    • 较为全面的数据类型封装与可视化支持
      • 图片类型(基于 PIL 的封装,支持各类图片的读写)
      • 标注类型:蒙板( mask )、评分图( score map )、框( box )、多边形( polygon ) 等
    • 工业级代码质量
      • 友好的代码自动补全与类型检查支持,为开发体验保驾护航
      • 成熟的包管理与依赖管理机制
      • 自动化风格检查(基于 flake8 )与静态类型分析(基于 pyright )

    注:

    • 🚧 表示施工中,未完全支持
    • ⭐ 表示本项目的亮点(其他项目没有,或是做得不够好的地方)

    项目愿景

    作者作为一名 CV/NLP 算法工程师,希望可以通过 vkit 这个项目,从以下几个方面给大家提供便利:

    • 将开发者从繁琐的数据治细节中解放出来,将宝贵的时间放在更有价值的工作上,如数据治理策略、算法模型设计与调优等
    • 整合常见的数据增强策略,助力文档图像分析与识别方向的科研工作、构建工业级场景数据方案(即工业界算法落地所需的那点 "secret sauce")
    • 构建工业级开源文档图像分析与识别解决方案(如扭曲复原、超分辨率、OCR 、版面分析等)
    7 条回复    2022-07-04 00:20:57 +08:00
    huntzhan
        1
    huntzhan  
    OP
       2021-11-30 13:19:09 +08:00
    自己打破零回复
    hvsy
        2
    hvsy  
       2021-11-30 13:39:52 +08:00
    先 star 为敬
    huntzhan
        3
    huntzhan  
    OP
       2021-11-30 13:47:34 +08:00
    @hvsy 感谢支持
    code4you
        4
    code4you  
       2021-11-30 21:14:28 +08:00
    问个初学者问题
    移动端开发 杂用这个
    huntzhan
        5
    huntzhan  
    OP
       2021-11-30 21:42:05 +08:00
    @code4you 目前 vkit 的设计运行环境还是 Linux 与 macOS 。原理上 vkit 基于 OpenCV 与 Numpy ,如果移动端有类似的 CV 库与科学计算库,基于这些库也能实现同样的算法,达到相似的效果
    haidaotao
        6
    haidaotao  
       2022-07-03 23:42:24 +08:00
    项目没了?
    huntzhan
        7
    huntzhan  
    OP
       2022-07-04 00:20:57 +08:00
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   3310 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 13:20 · PVG 21:20 · LAX 06:20 · JFK 09:20
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.