(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210596298.1
(22)申请日 2022.05.30
(65)同一申请的已公布的文献号
申请公布号 CN 114677573 A
(43)申请公布日 2022.06.28
(73)专利权人 上海捷勃特机 器人有限公司
地址 201207 上海市浦东 新区中国 (上海)
自由贸易试验区芳春路40 0号1幢3层
(72)发明人 范东平 李峰
(74)专利代理 机构 上海专利商标事务所有限公
司 31100
专利代理师 骆希聪
(51)Int.Cl.
G06V 10/80(2022.01)
G06V 10/764(2022.01)
G06V 10/82(2022.01)
G06N 3/08(2006.01)
G06K 9/62(2022.01)(56)对比文件
CN 110826450 A,2020.02.21
CN 114092742 A,202 2.02.25
CN 112446418 A,2021.0 3.05
CN 111017429 A,2020.04.17
CN 113642639 A,2021.1 1.12
CN 102147851 A,201 1.08.10
CN 108090485 A,2018.0 5.29
CN 111626363 A,2020.09.04
WO 2022082999 A1,202 2.04.28
CN 113505802 A,2021.10.15
周星 等. 《分类 器集成算法研究》 . 《武汉大
学学报》 .2015,
刘佶鑫 等.压缩感知稀疏识别用于多视角
图像目标分类. 《应用科 学学报》 .2013, (续)
审查员 曹青
(54)发明名称
视觉分类方法、 系统、 装置及计算机可读介
质
(57)摘要
本申请涉及一种视觉分类方法、 系统、 装置
及计算机可读介质, 该方法包括: 获取同一物体
的m个视角的 图像, m为大于等于2的正整数; 将图
像分别输入基础分类器模型中进行分类, 得到每
个图像对应的基础分类结果, 基础分类结果包括
位置、 类别和置信度的列表; 将m个图像的基础分
类结果中类别相同的项进行置信度融合计算, 得
到第一分类结果, 第一分类结果包括类别和置信
度的列表; 根据第一分类结果中的置信度确定物
体的类别。 本申请的视觉分类方法通过采用多视
角的图像, 能够获取到更多视角的信息, 且对多
视角的图像的基础分类结果中类别相同的项进
行置信度融合计算, 有效地增强了分类的准确性
和可信度。
[转续页]
权利要求书2页 说明书11页 附图5页
CN 114677573 B
2022.08.26
CN 114677573 B
(56)对比文件
Di W 等.Active Learn ing via Multi-
View and L ocal Proximity Co-
Regularizati on for Hyperspect ral Image
Classificati on. 《IEEE Journal of Selected
Topics i n Signal Proces sing》 .2011,
Shivang Ag arwal 等.A-Stack ing and A-Bagging: Adaptive versi ons of ensemble
learning algorithm s for spo of fingerprint
detection. 《Expert System s With
Applications》 .2020,
Feng Z 等.Bagging based plan kton
image classificati on. 《IEEE Internati onal
Conference o n Image Proces sing》 .2010,2/2 页
2[接上页]
CN 114677573 B1.一种视 觉分类方法, 其特 征在于, 包括:
获取同一物体的m个视角的图像, m为大于等于2的正整数;
将所述图像分别输入基础分类器模型中进行分类, 得到每个图像对应的基础分类结
果, 所述基础分类结果包括 位置、 类别和置信度的列表;
将m个图像的基础 分类结果中类别相同的项进行置信度融合计算, 得到第 一分类结果,
所述第一分类结果包括类别和置信度的列表; 以及
根据所述第一分类结果中的置信度确定所述物体的类别;
其中, 使用如下公式将m个图像的基础分类结果中类别相同的项 进行置信度融合计算:
其中, m为视角数目, n为类别数目,
为第m个视角在第n种类别上的置信度, a是对数
函数的底数且
,
是一维数组, 表示各种类别下的置信度。
2.如权利要求1所述的视觉分类方法, 其特征在于, 所述m个视角的图像之间的视差角
为60°~180°。
3.如权利要求1所述的视觉分类方法, 其特征在于, 所述基础 分类器模型是基于深度 学
习的目标检测模型。
4.如权利要求1所述的视觉分类方法, 其特征在于, 每个所述视角对应一个所述基础分
类器模型, 各个所述视角对应的所述基础分类 器模型使用相同的模型。
5.如权利要求1所述的视觉分类方法, 其特征在于, 根据 所述第一分类结果中的置信度
确定所述物体的类别的步骤 包括:
从所述第一分类结果中取置信度最高的项作为第 一候选项, 如果所述第 一候选项的置
信度大于等于第一阈值, 则将所述第一 候选项的类别作为所述物体的类别。
6.如权利要求5所述的视 觉分类方法, 其特 征在于, 还 包括:
如果所述第一候选项的置信度小于所述第一阈值, 则继续取置信度第二高的项, 求所
述第一候选项的置信度与所述第二高的项的置信度的差值;
如果所述差值小于第二阈值, 则根据所述m个图像的基础 分类结果计算输入特征, 将所
述输入特征输入到冲突判别器中进行判别, 得到第二分类结果, 所述第二分类结果包括类
别和置信度的列表;
从所述第二分类结果中取置信度最高的项作为第 二候选项, 如果所述第 二候选项的置
信度大于等于第三阈值, 则将所述第二 候选项的类别作为所述物体的类别。
7.如权利要求6所述的视觉分类方法, 其特征在于, 所述输入特征包括以下之一或其组
合: 各个所述图像的基础分类结果中位置之间的交并比, 各个图像的基础分类结果中最高
的置信度以及模型混淆矩阵。
8.如权利要求6所述的视觉分类方法, 其特征在于, 所述冲突判别器是由支持向量机、
人工神经网络或随机森林的方式构建的分类 器模型。权 利 要 求 书 1/2 页
2
CN 114677573 B
3
专利 视觉分类方法、系统、装置及计算机可读介质
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 12:50:52上传分享