说明:收录全文最新的团体标准 提供单次或批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210566658.3 (22)申请日 2022.05.24 (71)申请人 东北大学 地址 110819 辽宁省沈阳市和平区文化路3 号巷11号 (72)发明人 郭楠 李婧源 高天寒 (74)专利代理 机构 沈阳东大知识产权代理有限 公司 21109 专利代理师 李在川 (51)Int.Cl. G06V 10/26(2022.01) G06V 10/774(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 面向位姿 估计的遮挡场景目标检测方法 (57)摘要 本发明提供一种面向位姿估计的遮挡场景 目标检测方法, 该方法基于单阶段目标检测模型 YOLOv5进行设计检测模型; 采用特征融合的网络 结构, 对卷积层的浅层特征和深层特征进行了提 取和融合, 增加了相应的头部检测层, 提高了模 型的准确率和鲁棒性; 在 原始YOLOv5模型的基础 上还对目标检测的优化算法进行了更改, 使用了 Soft NMS优化算法能够更好地避免YOLOv5模型 在遮挡情况下存在的漏检问题, 为了满足在资源 有限设备上的部署, 本发明还通过修改普通卷积 层为深度可分离卷积, 减小了模型的大小, 不仅 提高了检测模型的效率, 检测结果更加准确有 效。 权利要求书2页 说明书7页 附图2页 CN 115100405 A 2022.09.23 CN 115100405 A 1.一种面向位姿估计的遮挡场景目标检测方法, 其特 征在于, 包括: 步骤1: 根据真实数据集和合成数据集制作数据集; 步骤2: 基于支持移动端的最小化模型YOLOv5n设计神经网络模型, 作为目标检测模型; 步骤3: 对待检测图像进行预处理后作为目标检测模型的输入, 通过目标检测模型预测 目标物体。 2.根据权利要求1所述的一种面向位姿估计的遮挡场景目标检测方法, 其特征在于, 所 述步骤1包括: 步骤1.1: 基于Un ity制作合成数据集; 步骤1.2: 利用数据集 LineMOD数据集制作真实数据集; 步骤1.3: 划分训练集和测试集数据, 其中训练集包括合成数据与真实数据, 测试集为 真实数据。 3.根据权利要求2所述的一种面向位姿估计的遮挡场景目标检测方法, 其特征在于, 所 述步骤1.1包括: 步骤1.1.1: 将LineMOD数据集中提供的.ply文件转换为.obj文件, 获取目标物体的3D 模型并导入到Un ity 3D中; 步骤1.1.2: 调用Un ity Percepti on为背景设置位置随机化和旋转随机化 来制作背景; 步骤1.1.3: 调用Un ity Percepti on为步骤1.1.1中导入的模型制作标签。 4.根据权利要求1所述的一种面向位姿估计的遮挡场景目标检测方法, 其特征在于, 所 述步骤2包括: 步骤2.1: 对数据集中的图像进行 预处理; 步骤2.2: 基于支持移动端的最小化模型YOLOv5n设计神经网络模型; 步骤2.3: 将步骤2.1处 理后的图像作为神经网络模型的输入进行网络训练。 5.根据权利要求4所述的一种面向位姿估计的遮挡场景目标检测方法, 其特征在于, 所 述步骤2.1具体表 述为: 为了保证原始图像的目标物体不会产生形变, 将图像进 行等比例缩 放后, 再进行图像边缘的填充, 使其缩放为640 ×640尺寸; 随机选取4张缩放后的图像, 并对 4张图像进行剪 裁; 拼接剪裁后的4张图像为1张图像。 6.根据权利要求4所述的一种面向位姿估计的遮挡场景目标检测方法, 其特征在于, 所 述步骤2.2包括: 步骤2.2.1: 设计Pose ‑YOLOv5特 征提取网络, 具体表述 为: 主干网络包括CBS、 C3和SPP模块, 其中SPP模块用于将局部特征和全局特征进行融合, CBS模块包含卷积层、 批归一化层和SiLU激活层用来实现网络的下采样功能, C3模块包含 C3_1、 C3_2和C3_3三种模块, 分别对应具备1个、 2个和3个的残差模块, 能够构建更深的网 络, 提升网络的特 征提取能力; 颈部网络包括上采样模块、 连接模块、 C3模块和CBS模块, 其中, 上采样模块用于恢复下 采样后的图像特征, 连接模块用于融合浅层特征和深层特征, C3模块和CBS模块用于实现卷 积融合来获取最终的图像特 征; 头部网络作为Pose ‑YOLOv5网络的输出端, 所述头部网络包括CBS模块、 卷积层, 用于预 测物体的位置信息和类别 信息; 深度可分离卷积层: 逐通道卷积中一个卷积核对一个通道进行卷积, 保证输入输出的权 利 要 求 书 1/2 页 2 CN 115100405 A 2通道数一 致; 逐点卷积对深度方向的特 征进行加权组合, 获取 特征图; 步骤2.2.2: 利用Soft NMS算法来进行目标检测优化, 实现对物体出现的多个冗余包围 框的去除。 7.根据权利要求4所述的一种面向位姿估计的遮挡场景目标检测方法, 其特征在于, 所 述步骤2.3包括: 1)初始化网络参数; 2)损失函数选择CIOU损失函数, 表示 为: 其中, w为预测包围框的宽度, h为预测包围框的高度, wgt为真实包围框的宽度, hgt为真 实包围框的高度; 3)设置迭代次数对神经网络模型进行训练。权 利 要 求 书 2/2 页 3 CN 115100405 A 3
专利 面向位姿估计的遮挡场景目标检测方法
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助1.5元下载(无需注册)
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助1.5元下载
本文档由 人生无常 于
2024-03-18 12:51:20
上传分享
举报
下载
原文档
(611.2 KB)
分享
友情链接
GB-T 33061.4-2023 塑料 动态力学性能的测定 第4部分 非共振拉伸振动法.pdf
GB-T 37090-2018 信息安全技术 病毒防治产品安全技术要求和测试评价方法.pdf
许天翔 人工智能与网络空间安全.pdf
GA-T 1776-2021 警用机器人系统通用技术要求.pdf
T-YAIMH 002—2022 互联网诊疗电子病历基本规范.pdf
DB4403-T 422.1—2024 诚信计量管理规范 第1部分:通则 深圳市.pdf
T-WAPIA 045.3—2021 信息技术 系统间远程通信和信息交换 原子密钥建立与实体鉴别 第3部分:采用证书的原子密钥建立与实体鉴别.pdf
T-CI 032—2022 矿山酸性污染全过程控制与治理技术指南.pdf
法律法规 南通市科技创新促进条例2023-12-11.pdf
GB-T 15609-2008 彩色显示器色度测量方法.pdf
GB-T 22561-2023 真空热处理.pdf
GB-T 5462-2015 工业盐.pdf
NY-T 2207-2019 轮式拖拉机能效等级评价.pdf
GB-T 28032-2011 静电成像墨粉用树脂.pdf
GB-T 21053-2023 信息安全技术 公钥基础设施 PKI系统安全技术要求.pdf
信通院 2020人工智能医疗产业发展蓝皮书.pdf
GB-T 5169.24-2018 电工电子产品着火危险试验 第24部分:着火危险评定导则 绝缘液体.pdf
GB-T 38634.3-2020 系统与软件工程 软件测试 第3部分:测试文档.pdf
GB-T 37971-2019 信息安全技术 智慧城市安全体系框架.pdf
DB44-T 2389-2022 计量检测数据与结果数字化处理系统技术要求 广东省.pdf
1
/
3
12
评价文档
赞助1.5元 点击下载(611.2 KB)
回到顶部
×
微信扫码支付
1.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。