V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
739953126
V2EX  ›  程序员

有个图像识别的需求,请大佬帮忙给点建议

  •  
  •   739953126 · 2 天前 · 1550 次点击
    需求:手头上有几个 G 的数据,是道路检测摄像头俯拍路面的照片。被采集的路面类型主要分为 2 类:水泥混凝土路面和沥青混凝土路面。想通过什么样的办法/工具,自动将两种不同路面的照片拆分出来。
    备注:
    两种路面照片的不同点:明暗不同(沥青发黑,水泥发白)、纹理不同
    两种路面照片的相同点:部分路面存在不同形态的病害纹理

    最好有相关的案例,之前简单了解了一下 YOLO5 ,没找到门路,请各位大佬指点,感激不尽。
    13 条回复    2024-06-30 10:37:49 +08:00
    StinkyTofus
        1
    StinkyTofus  
       2 天前
    这种图片分类简直是 YOLO8 的强项啊, 随便训练个几百张图片。 估计就能达到不错的效果了。
    8620
        2
    8620  
       2 天前 via Android
    如果颜色差异这么大而且内容只有路面,可以灰度以后算一下图像强度的中位数,然后选一个阈值区分。
    mightybruce
        3
    mightybruce  
       2 天前
    不要上来就 yolo, yolo 作为物体检测,并不是一上来就合适,

    看你说的处理更像是计算机视觉的轮廓和纹理的分析。

    给一个链接吧, 梳理一下计算机视觉从简单的点线面到复杂的物体识别的过程。
    https://ziqingzhao.github.io/%E8%AE%A1%E7%AE%97%E6%9C%BA%E8%A7%86%E8%A7%89-%E7%AE%97%E6%B3%95%E4%B8%8E%E5%BA%94%E7%94%A8/
    739953126
        4
    739953126  
    OP
       2 天前
    @StinkyTofus 好的,谢谢您,我再了解下 YOLO8.
    739953126
        5
    739953126  
    OP
       2 天前
    @8620 谢谢您,我找找案例
    739953126
        6
    739953126  
    OP
       2 天前
    @mightybruce 谢谢您,系统学习下。
    vivisidea
        7
    vivisidea  
       2 天前
    如果有接口,且不嫌处理慢的话可以发给 gpt4o……我试过其它场景的识别,理解能力挺强的,可以试试直接问“这张图上的路面是水泥混凝土路面还是沥青混凝土路面?”
    inframe
        8
    inframe  
       2 天前
    这种经典的问题,传统的机器学习的二分类、聚类算法也行,
    就是要预处理一下提取特征指标,比如占比的颜色分布直方图曲线,然后丢模型去训练就好了
    coolfan
        9
    coolfan  
       2 天前
    同 1 楼,可以试试 yolo ,v8 的脚本非常简单啊,唯一费时间的就是构建数据集
    https://docs.ultralytics.com/tasks/classify/
    syx0310
        10
    syx0310  
       2 天前 via iPhone
    可以试试看直接用 clip 做
    Hzzone
        11
    Hzzone  
       2 天前
    直接设计一下 Prompt ,让多模态大模型二选一吧
    buaacss
        12
    buaacss  
       1 天前 via iPhone
    最简单的方案用 embedding ,clip 和 vit 都行。两类照片分别找 5 个,算出 embedding 保存到向量数据库。然后对给定的新照片计算一个 embedding ,从数据库找最相近的 5 个,出来的哪个分类多就是哪个分类
    739953126
        13
    739953126  
    OP
       1 天前
    谢谢各位,炒鸡感谢!
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1224 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 23:24 · PVG 07:24 · LAX 16:24 · JFK 19:24
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.