V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
sonnyclarity492
V2EX  ›  机器学习

图像识别求助!

  •  
  •   sonnyclarity492 · 246 天前 · 1468 次点击
    这是一个创建于 246 天前的主题,其中的信息可能已经有所发展或是发生改变。

    现在的任务大概如下: 提供图片,要求检测出属于猫、狗、人类或其他,并在此基础上,给出对象属于猫的什么种类,狗的种类等等。最后,将父类(一级标签)和子类(二级标签)一起返回

    图像识别算法不限,算力资源暂不考虑,检测时间尽可能快。


    目前打算用 yolo v8 来实现,但是以前没接触过 CV 相关,看了文档 “二级标签” 也不知道咋整 +_+

    我的想法是:给图片打同级双标签,不知道是否可行;一级标签过滤,二级标签再训练一遍感觉可行;只打一个标签,但是标签文本同时含有父类和子类,感觉也可行。

    请各方大佬不吝赐教!

    7 条回复    2024-04-25 09:48:34 +08:00
    DocHelper
        1
    DocHelper  
       246 天前   ❤️ 1
    flymemory
        2
    flymemory  
       246 天前 via iPhone   ❤️ 1
    如果一级父类不多,没有特别高的分类速度要求,可以先训练一个总的一级标签的模型,再分别训练各自的二级标签的模型,这通常来说是最稳的,yolov8 是个比较快上手的选择
    indexError
        3
    indexError  
       246 天前 via Android   ❤️ 1
    检测到分类应该是固定的吧。
    训练二级,手动把二级和一级组成字典。
    ktyang
        4
    ktyang  
       246 天前   ❤️ 1
    要我的话只训练二级,一级去数据库里查,一把梭看天命。不过训练两个模型也可以,也可以互相确认一下,但是结果不一致的时候的融合逻辑得想清楚。
    sonnyclarity492
        5
    sonnyclarity492  
    OP
       246 天前
    @DocHelper 老哥不愧是 DcoHelper 待我研究研究
    sonnyclarity492
        6
    sonnyclarity492  
    OP
       246 天前
    @flymemory @ktyang @indexError
    我现在准备先分二级标签梭哈,然后字典 map 。

    一级标签有 20 个,二级有 180 个
    DocHelper
        7
    DocHelper  
       245 天前
    @sonnyclarity492 不过简单一点做就直接一个分类头+两个 loss
    一个分类头估计所有二级标签的概率
    第一个 loss 计算 二级标签分类的交叉熵
    然后再把属于同一一级标签的所有二级标签的 logits 加起来 得到所有一级标签的 logits 在这之上再算一个交叉熵
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5625 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 03:22 · PVG 11:22 · LAX 19:22 · JFK 22:22
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.