专利 视觉分类方法、系统、装置及计算机可读介质

(19)国家知识产权局 (12)发明专利 (10)授权公告号 (45)授权公告日 (21)申请号 202210596298.1 (22)申请日 2022.05.30 (65)同一申请的已公布的文献号申请公布号 CN 114677573 A (43)申请公布日 2022.06.28 (73)专利权人上海捷勃特机器人有限公司地址 201207 上海市浦东新区中国（上海）自由贸易试验区芳春路40 0号1幢3层 (72)发明人范东平　李峰　 (74)专利代理机构上海专利商标事务所有限公司 31100 专利代理师骆希聪 (51)Int.Cl. G06V 10/80(2022.01) G06V 10/764(2022.01) G06V 10/82(2022.01) G06N 3/08(2006.01) G06K 9/62(2022.01)(56)对比文件 CN 110826450 A,2020.02.21 CN 114092742 A,202 2.02.25 CN 112446418 A,2021.0 3.05 CN 111017429 A,2020.04.17 CN 113642639 A,2021.1 1.12 CN 102147851 A,201 1.08.10 CN 108090485 A,2018.0 5.29 CN 111626363 A,2020.09.04 WO 2022082999 A1,202 2.04.28 CN 113505802 A,2021.10.15 周星等. 《分类器集成算法研究》 . 《武汉大学学报》 .2015, 刘佶鑫等.压缩感知稀疏识别用于多视角图像目标分类. 《应用科学学报》 .2013, (续) 审查员曹青 (54)发明名称视觉分类方法、系统、装置及计算机可读介质 (57)摘要本申请涉及一种视觉分类方法、系统、装置及计算机可读介质，该方法包括：获取同一物体的m个视角的图像， m为大于等于2的正整数；将图像分别输入基础分类器模型中进行分类，得到每个图像对应的基础分类结果，基础分类结果包括位置、类别和置信度的列表；将m个图像的基础分类结果中类别相同的项进行置信度融合计算，得到第一分类结果，第一分类结果包括类别和置信度的列表；根据第一分类结果中的置信度确定物体的类别。本申请的视觉分类方法通过采用多视角的图像，能够获取到更多视角的信息，且对多视角的图像的基础分类结果中类别相同的项进行置信度融合计算，有效地增强了分类的准确性和可信度。 [转续页] 权利要求书2页说明书11页附图5页 CN 114677573 B 2022.08.26 CN 114677573 B (56)对比文件 Di W 等.Active Learn ing via Multi- View and L ocal Proximity Co- Regularizati on for Hyperspect ral Image Classificati on. 《IEEE Journal of Selected Topics i n Signal Proces sing》 .2011, Shivang Ag arwal 等.A-Stack ing and A-Bagging: Adaptive versi ons of ensemble learning algorithm s for spo of fingerprint detection. 《Expert System s With Applications》 .2020, Feng Z 等.Bagging based plan kton image classificati on. 《IEEE Internati onal Conference o n Image Proces sing》 .2010,2/2 页 2[接上页] CN 114677573 B1.一种视觉分类方法，其特征在于，包括：获取同一物体的m个视角的图像， m为大于等于2的正整数；将所述图像分别输入基础分类器模型中进行分类，得到每个图像对应的基础分类结果，所述基础分类结果包括位置、类别和置信度的列表；将m个图像的基础分类结果中类别相同的项进行置信度融合计算，得到第一分类结果，所述第一分类结果包括类别和置信度的列表；以及根据所述第一分类结果中的置信度确定所述物体的类别；其中，使用如下公式将m个图像的基础分类结果中类别相同的项进行置信度融合计算：其中， m为视角数目， n为类别数目，为第m个视角在第n种类别上的置信度， a是对数函数的底数且，是一维数组，表示各种类别下的置信度。 2.如权利要求1所述的视觉分类方法，其特征在于，所述m个视角的图像之间的视差角为60°~180°。 3.如权利要求1所述的视觉分类方法，其特征在于，所述基础分类器模型是基于深度学习的目标检测模型。 4.如权利要求1所述的视觉分类方法，其特征在于，每个所述视角对应一个所述基础分类器模型，各个所述视角对应的所述基础分类器模型使用相同的模型。 5.如权利要求1所述的视觉分类方法，其特征在于，根据所述第一分类结果中的置信度确定所述物体的类别的步骤包括：从所述第一分类结果中取置信度最高的项作为第一候选项，如果所述第一候选项的置信度大于等于第一阈值，则将所述第一候选项的类别作为所述物体的类别。 6.如权利要求5所述的视觉分类方法，其特征在于，还包括：如果所述第一候选项的置信度小于所述第一阈值，则继续取置信度第二高的项，求所述第一候选项的置信度与所述第二高的项的置信度的差值；如果所述差值小于第二阈值，则根据所述m个图像的基础分类结果计算输入特征，将所述输入特征输入到冲突判别器中进行判别，得到第二分类结果，所述第二分类结果包括类别和置信度的列表；从所述第二分类结果中取置信度最高的项作为第二候选项，如果所述第二候选项的置信度大于等于第三阈值，则将所述第二候选项的类别作为所述物体的类别。 7.如权利要求6所述的视觉分类方法，其特征在于，所述输入特征包括以下之一或其组合：各个所述图像的基础分类结果中位置之间的交并比，各个图像的基础分类结果中最高的置信度以及模型混淆矩阵。 8.如权利要求6所述的视觉分类方法，其特征在于，所述冲突判别器是由支持向量机、人工神经网络或随机森林的方式构建的分类器模型。权　利　要　求　书 1/2 页 2 CN 114677573 B 3

专利 视觉分类方法、系统、装置及计算机可读介质

专利视觉分类方法、系统、装置及计算机可读介质