专利 神经网络的量化方法、目标检测方法及装置

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210603119.2 (22)申请日 2022.05.30 (71)申请人上海商汤临港智能科技有限公司地址 200232 上海市自由贸易试验区临港新片区泥城镇秋山路1775弄29、 30号2 楼01室 (72)发明人黄洋逸　杨国润　卢乐炜　王哲　 (74)专利代理机构北京中知恒瑞知识产权代理事务所(普通合伙) 11889 专利代理师袁忠林 (51)Int.Cl. G06N 3/08(2006.01) G06N 3/04(2006.01) G06V 10/774(2022.01) G06V 10/82(2022.01)G06V 10/80(2022.01) G06V 20/56(2022.01) (54)发明名称神经网络的量化方法、目标检测方法及装置 (57)摘要本公开提供了一种神经网络的量化方法、目标检测方法及装置，其中，神经网络的量化方法包括：获取待量化神经网络和训练数据，并对待量化神经网络的待量化网络层进行量化处理，得到初始量化网络；针对初始量化网络中待调整的第一目标网络层，基于第一目标网络层之前的经过调整后的第二目标网络层，对训练数据进行处理得到中间输出数据，并基于第一目标网络层对中间输出数据进行处理得到第一输出数据；基于待量化神经网络中，与第一目标网络层和第二目标网络层分别对应的待量化网络层，对训练数据进行处理得到第二输出数据；基于第一输出数据和第二输出数据对第一目标网络层的网络参数进行调整，得到待量化网络对应的量化后的目标神经网络。权利要求书3页说明书19页附图7页 CN 115018070 A 2022.09.06 CN 115018070 A 1.一种神经网络的量化方法，其特征在于，包括：获取待量化神经网络和训练数据，并对所述待量化神经网络的待量化网络层进行量化处理，得到初始量化网络；针对所述初始量化网络中待调整的第一目标网络层，基于所述第一目标网络层之前的经过调整后的第二目标网络层，对所述训练数据进行处理得到中间输出数据，并基于所述第一目标网络层对所述中间输出数据进行处理得到第一输出数据；基于所述待量化神经网络中，与所述第一目标网络层和所述第二目标网络层分别对应的待量化网络层，对所述训练数据进行处理得到第二输出数据；基于所述第一输出数据和所述第二输出数据对所述第一目标网络层的网络参数进行调整，得到所述待量化网络对应的量化后的目标神经网络。 2.根据权利要求1所述的方法，其特征在于，在对所述待量化神经网络的待量化网络层进行量化处理之前，所述方法还包括：基于边界参数，对所述待量化神经网络的待量化网络层的网络参数进行初步范围调整，其中，所述边界参数为所述待量化神经网络的初始训练过程中的训练参数。 3.根据权利要求1或2所述的方法，其特征在于，所述对所述待量化神经网络的待量化网络层进行量化处理，包括：对所述待量化网络层的权重值、偏置值以及激活值中的至少一个进行量化处理。 4.根据权利要求1～3任一所述的方法，其特征在于，所述对所述待量化神经网络的待量化网络层进行量化处理，得到初始量化网络，包括：针对任一所述待量化网络层，分别基于与该待量化网络层对应的多个预设量化参数对该待量化网络层进行量化处理，得到与该待量化网络层对应的量化处理后的多个待筛选网络层；分别确定各待筛选网络层对应的量化损失，并基于所述量化损失，从所述多个待筛选网络层中确定该待量化网络层对应的量化后的目标网络层，各待量化网络层对应的量化后的目标网络层构成所述初始量化网络。 5.根据权利要求4所述的方法，其特征在于，根据以下方法确定所述待筛选网络层对应的量化损失：基于所述待筛选网络层的输出数据和所述待筛选网络层对应的待量化网络层的输出数据，确定所述量化损失；其中，所述待筛选网络层的输出数据是基于所述待筛选网络层之前的经过量化处理后的目标网络层的输出数据确定的。 6.根据权利要求1～5任一所述的方法，其特征在于，所述基于所述第一输出数据和所述第二输出数据对所述第一目标网络层的网络参数进行调整，包括：基于所述第一输出数据和所述第二输出数据对所述第一目标网络层的偏置值进行调整；和/或，基于所述第一输出数据、所述第二输出数据以及待训练的取整掩模参数对所述第一目标网络层的权重值进行调整，其中，所述取整掩模参数用于对所述第一目标网络层的权重值进行取整处理。 7.根据权利要求6所述的方法，其特征在于，所述基于所述第一输出数据和所述第二输出数据对所述第一目标网络层的偏置值进行调整，包括：权　利　要　求　书 1/3 页 2 CN 115018070 A 2基于所述第一输出数据和所述第二输出数据，确定所述第一目标网络层对应的偏置调整值；基于所述偏置调整值对所述第一目标网络层的偏置值进行调整；确定所述第一目标网络层的第一损失值，并在所述第一损失值不满足第一预设条件的情况下，基于偏置值调整后的第一目标网络层对所述第一输出数据进行更新；基于更新后的第一输出数据和所述第二输出数据，返回执行确定偏置调整值的步骤，直至所述第一损失值满足所述第一预设条件。 8.根据权利要求7所述的方法，其特征在于，所述训练数据包括样本图像，所述第一输出数据包括第一特征图，所述第二输出数据包括第二特征图；所述基于所述第一输出数据和所述第二输出数据，确定所述第一目标网络层对应的偏置调整值，包括：将所述第二特征图中各通道的第一均值与所述第一特征图中各通道的第二均值之差作为所述偏置调整值；或者，基于所述第一特征图和所述第二特征图各通道经过激活处理后的取值以及掩模，确定所述偏置调整值，其中，所述掩模用于筛选所述第一特征图和所述第二特征图在计算所述偏置调整值时的通道值，所述掩模是基于所述第一目标网络层在进行初步范围调整时的边界参数确定的。 9.根据权利要求6所述的方法，其特征在于，所述基于所述第一输出数据、所述第二输出数据以及待训练的取整掩模参数对所述第一目标网络层的权重值进行调整，包括：基于所述第一目标网络层对应的量化参数对所述第一目标网络层中的各权重值进行取整处理，确定各权重值分别对应的目标权重值；基于所述取整掩模参数对各权重值分别对应的目标权重值进行更新，并基于更新后的各权重值对所述第一输出数据进行更新；基于更新后的第一输出数据以及所述第二输出数据确定第二损失值，并在所述第二损失值不满足第二预设条件的情况下，返回执行确定目标权重值的步骤，直至所述第二损失值满足所述第二预设条件。 10.根据权利要求1～9任一所述的方法，其特征在于，在得到所述待量化网络对应的量化后的目标神经网络后，所述方法还包括：基于所述训练数据和所述训练数据的标注数据，对所述目标神经网络进行训练。 11.一种目标检测方法，其特征在于，包括：获取待检测点云数据；基于如权利要求1～10任一所述的神经网络的量化方法量化得到的目标神经网络对所述待检测点云数据进行检测，确定所述待检测点云数据的检测结果；基于所述检测结果控制目标车辆行驶。 12.一种神经网络的量化装置，其特征在于，包括：量化模块，用于获取待量化神经网络和训练数据，并对所述待量化神经网络的待量化网络层进行量化处理，得到初始量化网络；确定模块，用于针对所述初始量化网络中待调整的第一目标网络层，基于所述第一目标网络层之前的经过调整后的第二目标网络层，对所述训练数据进行处理得到中间输出数权　利　要　求　书 2/3 页 3 CN 115018070 A 3

专利 神经网络的量化方法、目标检测方法及装置

专利神经网络的量化方法、目标检测方法及装置