(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210603119.2
(22)申请日 2022.05.30
(71)申请人 上海商汤临港智能科技有限公司
地址 200232 上海市自由贸易试验区临港
新片区泥城镇秋山路1775弄29、 30号2
楼01室
(72)发明人 黄洋逸 杨国润 卢乐炜 王哲
(74)专利代理 机构 北京中知恒瑞知识产权代理
事务所(普通 合伙) 11889
专利代理师 袁忠林
(51)Int.Cl.
G06N 3/08(2006.01)
G06N 3/04(2006.01)
G06V 10/774(2022.01)
G06V 10/82(2022.01)G06V 10/80(2022.01)
G06V 20/56(2022.01)
(54)发明名称
神经网络的量 化方法、 目标检测方法及装置
(57)摘要
本公开提供了一种神经网络的量化方法、 目
标检测方法及装置, 其中, 神经网络的量化方法
包括: 获取待量化神经网络和训练数据, 并对待
量化神经网络的待量化网络层 进行量化处理, 得
到初始量化网络; 针对初始量化网络中待调整的
第一目标网络层, 基于第一目标网络层之前的经
过调整后的第二目标网络层, 对训练数据进行处
理得到中间输出数据, 并基于第一目标网络层对
中间输出数据进行处理得到第一输出数据; 基于
待量化神经网络中, 与第一目标网络层和第二目
标网络层分别对应的待量化网络层, 对训练数据
进行处理得到第二输出数据; 基于第一输出数据
和第二输出数据对第一目标网络层的网络参数
进行调整, 得到待量化网络对应的量化后的目标
神经网络 。
权利要求书3页 说明书19页 附图7页
CN 115018070 A
2022.09.06
CN 115018070 A
1.一种神经网络的量 化方法, 其特 征在于, 包括:
获取待量化神经网络和训练数据, 并对所述待量化神经网络的待量化网络层进行量化
处理, 得到初始量 化网络;
针对所述初始量化网络 中待调整的第 一目标网络层, 基于所述第 一目标网络层之前的
经过调整后的第二 目标网络层, 对所述训练数据进行处理得到中间输出数据, 并基于所述
第一目标网络层对所述中间输出 数据进行处 理得到第一输出 数据;
基于所述待量化神经网络 中, 与所述第一目标网络层和所述第 二目标网络层分别对应
的待量化网络层, 对所述训练数据进行处 理得到第二输出 数据;
基于所述第一输出数据和所述第二输出数据对所述第一目标网络层的网络参数进行
调整, 得到所述待量 化网络对应的量 化后的目标神经网络 。
2.根据权利要求1所述的方法, 其特征在于, 在对所述待量化神经网络的待量化网络层
进行量化处理之前, 所述方法还 包括:
基于边界参数, 对所述待量化神经网络的待量化网络层的网络参数进行初步范围调
整, 其中, 所述 边界参数为所述待量 化神经网络的初始训练过程中的训练参数。
3.根据权利要求1或2所述的方法, 其特征在于, 所述对所述待量化神经网络的待量化
网络层进行量 化处理, 包括:
对所述待量 化网络层的权 重值、 偏置值以及激活值中的至少一个进行量 化处理。
4.根据权利要求1~3任一所述的方法, 其特征在于, 所述对所述待量化神经网络的待
量化网络层进行量 化处理, 得到初始量 化网络, 包括:
针对任一所述待量化网络层, 分别基于与 该待量化网络层对应的多个预设量化参数对
该待量化网络层进行量化处理, 得到与该待量化网络层 对应的量化处理后的多个待筛选网
络层;
分别确定各待筛选网络层对应的量化损 失, 并基于所述量化损 失, 从所述多个待筛选
网络层中确定该待量化网络层 对应的量化后的目标网络层, 各待量化网络层对应的量化后
的目标网络层构成所述初始量 化网络。
5.根据权利要求4所述的方法, 其特征在于, 根据以下方法确定所述待筛选网络层对应
的量化损失:
基于所述待筛选网络层的输出数据和所述待筛选网络层对应的待量化网络层的输出
数据, 确定所述 量化损失;
其中, 所述待筛选网络层的输出数据 是基于所述待筛选网络层之前的经过量化处理后
的目标网络层的输出 数据确定的。
6.根据权利要求1~5任一所述的方法, 其特征在于, 所述基于所述第一输出数据和所
述第二输出 数据对所述第一目标网络层的网络参数进行调整, 包括:
基于所述第一输出数据和所述第二输出数据对所述第一目标网络层的偏置值进行调
整; 和/或, 基于所述第一输出数据、 所述第二输出数据以及待训练的取整掩模参数对所述
第一目标网络层的权重值进行调整, 其中, 所述取整掩模参数用于对所述第一目标网络层
的权重值进行 取整处理。
7.根据权利要求6所述的方法, 其特征在于, 所述基于所述第 一输出数据和所述第 二输
出数据对所述第一目标网络层的偏置值进行调整, 包括:权 利 要 求 书 1/3 页
2
CN 115018070 A
2基于所述第 一输出数据和所述第 二输出数据, 确定所述第 一目标网络层对应的偏置调
整值;
基于所述偏置调整值对所述第一目标网络层的偏置值进行调整;
确定所述第 一目标网络层的第 一损失值, 并在所述第 一损失值不满足第 一预设条件的
情况下, 基于偏置值调整后的第一目标网络层对所述第一输出 数据进行 更新;
基于更新后的第一输出数据和所述第二输出数据, 返回执行确定偏置调整值的步骤,
直至所述第一损失值满足所述第一预设条件。
8.根据权利要求7所述的方法, 其特征在于, 所述训练数据包括样本 图像, 所述第一输
出数据包括第一特 征图, 所述第二输出 数据包括第二特 征图;
所述基于所述第 一输出数据和所述第 二输出数据, 确定所述第 一目标网络层对应的偏
置调整值, 包括:
将所述第二特征图中各通道的第一均值与所述第一特征图中各通道的第二均值之差
作为所述偏置调整值; 或者,
基于所述第 一特征图和所述第 二特征图各通道经过激活处理后的取值以及掩模, 确定
所述偏置调整值, 其中, 所述掩模用于筛选所述第一特征图和所述第二特征图在计算所述
偏置调整值时的通道 值, 所述掩模是基于所述第一目标网络层在进行初步范围调整时的边
界参数确定的。
9.根据权利要求6所述的方法, 其特征在于, 所述基于所述第一输出数据、 所述第二输
出数据以及待训练的取整掩 模参数对所述第一目标网络层的权 重值进行调整, 包括:
基于所述第一目标网络层对应的量化参数对所述第一目标网络层中的各权重值进行
取整处理, 确定各权 重值分别对应的目标权 重值;
基于所述取整掩模参数对各权重值分别对应的目标权重值进行更新, 并基于更新后的
各权重值对所述第一输出 数据进行 更新;
基于更新后的第 一输出数据以及所述第 二输出数据确定第 二损失值, 并在所述第 二损
失值不满足第二预设条件的情况下, 返回执行确定目标权重值的步骤, 直至所述第二损失
值满足所述第二预设条件。
10.根据权利要求1~9任一所述的方法, 其特征在于, 在得到所述待量化网络对应的量
化后的目标神经网络后, 所述方法还 包括:
基于所述训练数据和所述训练数据的标注数据, 对所述目标神经网络进行训练。
11.一种目标检测方法, 其特 征在于, 包括:
获取待检测点云数据;
基于如权利要求1~10任一所述的神经网络的量化方法量化得到的目标神经网络对所
述待检测点云数据进行检测, 确定所述待检测点云数据的检测结果;
基于所述检测结果控制目标 车辆行驶。
12.一种神经网络的量 化装置, 其特 征在于, 包括:
量化模块, 用于获取待量化神经网络和训练数据, 并对所述待量化神经网络的待量化
网络层进行量 化处理, 得到初始量 化网络;
确定模块, 用于针对所述初始量化网络中待调整的第一目标网络层, 基于所述第一目
标网络层之前的经过调整后的第二目标网络层, 对所述训练数据进行 处理得到中间输出数权 利 要 求 书 2/3 页
3
CN 115018070 A
3
专利 神经网络的量化方法、目标检测方法及装置
文档预览
中文文档
30 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共30页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 12:50:34上传分享