说明:收录全文最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211294780.6 (22)申请日 2022.10.21 (71)申请人 青岛科技大 学 地址 266000 山东省青岛市崂山区松岭路 99号 (72)发明人 冯宇平 刘宁  (74)专利代理 机构 青岛发思特专利商标代理有 限公司 37212 专利代理师 江鹏飞 (51)Int.Cl. G06V 40/16(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06V 10/774(2022.01) G06V 10/82(2022.01) (54)发明名称 ResNet18与胶囊网络结合并进行剪枝的人 脸表情识别方法 (57)摘要 本发明公开了一种ResNet18与胶囊网络结 合并进行剪枝的人脸表情识别方法, 属于人脸识 别技术领域。 其步骤包括: 构建胶囊网络、 调整 ResNet18网络模型、 在调整后的ResNet18网络模 型的四个残差块中加入注意力机制、 利用调整后 的ResNet18网络模型替换胶囊网络的单卷积层、 利用调整后的ResNet18网络模型从输入特征中 提取训练特征图、 将训练特征图输入至胶囊网络 中进行训练得到网络模型、 针对网络模型, 采用 L2范数进行剪枝处理、 利用数据集进行人脸表情 识别。 本发 明利用结合后的网络模 型进行人脸表 情识别, 可以避免出现池化层丢失特征数据的问 题, 以及避免出现胶囊网络自身卷积层特征提取 不足的问题。 权利要求书2页 说明书9页 附图8页 CN 115471899 A 2022.12.13 CN 115471899 A 1.一种ResNet18与胶囊网络结合并进行剪枝 的人脸表情识别方法, 其特征在于, 包括 如下步骤: 步骤一、 构建胶囊网络: 所述胶囊网络包括: 卷积层、 初级胶囊层、 数字胶囊层, 所述卷 积层是通道数为256, 卷积核大小为9 ×9, 步长为1的单卷积层, 所述初级胶囊层包括: 通道 数为256、 卷积核大小为9 ×9、 步长为2的单卷积层, 所述数字胶囊层 包含7个胶囊, 且所述数 字胶囊层由所述初级胶囊层经 过路由机制得到; 步骤二、 调整 ResNet18网络模型: 去除ResNet18网络模型的全连接层, 剔除ResNet18网 络模型的全局平均池化层, 将ResNet18网络模 型的第一个卷积层的卷积核大小由3 ×3修改 为5×5, ResNet18网络模型的第一个残差块保持不变, 将ResNet18网络模型的第二个残差 块和第三个残差块的步长调整为1, 将所述ResNet的第四个残差块的通道数修改为25 6; 步骤三、 在调整后的ResNet18网络模型的四个残差块中加入注意力机制; 步骤四、 利用调整后的ResNet18网络模型替换 所述胶囊网络的单 卷积层; 步骤五、 利用调整后的ResNet 18网络模型从输入特征中提取训练特征图; 包括: 在所述 输入特征上进 行全局最大池化和全局平均池化得到两个一维向量, 所述两个一维向量经过 共享MLP层处理后相加, 再经过Sigmoid激活函数, 得到通道注 意力权重, 在所述通道注 意力 权重和输入特征 的乘积上进行最大池化和平均池化, 得到两个特征图, 所述两个特征图经 过卷积核大小为7 ×7的卷积层处理, 得到一个新的特征图, 再经过BN层和Sigmoid激活函 数, 得到空间注意力权重, 将所述空间注意力权重与所述通道注意力权重和输入特征 的乘 积相乘得到所述训练特 征图; 步骤六、 将所述训练特 征图输入至所述胶囊网络中进行训练, 得到网络模型; 步骤七、 针对所述网络模型, 采用L2范 数进行剪枝处 理: 具体包括如下步骤: S1、 通过L2范数评估所述网络模型每一层卷积的通道; 其 中, 所述L2范数的计算公式如 下: 式中: x为输入向量, n 为输入向量总的维度, i 为当前输入向量的维数; S2、 判断所述通道是否满足L2范数, 所述网络模型的卷积层中不满足L2范数的通道进 行删减, 并将所述训练特 征图重新输入到所述网络模型中进行训练; S3、 重复执 行上述步骤S1、 S2, 直至所述网络模型每一层卷积的通道满足L2范 数; S4、 对所述网络模型的参数进行微调; 步骤八、 利用数据 集进行人脸表情识别: 所述数据 集至少包括: CK+数据 集、 RAF‑db数据 集、 FER+数据集。 2.根据权利要求1所述的ResNet18与胶囊网络结合并进行剪枝的人脸表情识别方法, 其特征在于, 所述步骤一中, 路由机制为所述胶囊网络的核心, 低层特征和高层特征之 间通 过所述路由机制更新权重系 数, 且所述胶囊网络中采用的是动态路由机制, 所述胶囊网络 中的动态路由机制迭代3次。 3.根据权利要求1或2所述的ResNet18与胶囊网络结合并进行剪枝 的人脸表情识别方 法, 其特征在于, 所述步骤一中, 胶囊网络的初级胶囊层将提取到的特征封装为32个胶囊,权 利 要 求 书 1/2 页 2 CN 115471899 A 2每个胶囊含有8个卷积单 元。 4.根据权利要求1所述的ResNet18与胶囊网络结合并进行剪枝的人脸表情识别方法, 其特征在于, 所述步骤二中, ResNet18网络模型的四个残差块中加入的注意力机制为混合 域的注意力机制, 所述混合 域的注意力机制包 含通道域注意力机制和空间域注意力机制。 5.根据权利要求1所述的ResNet18与胶囊网络结合并进行剪枝的人脸表情识别方法, 其特征在于, 所述步骤 六中, 胶囊网络采用ReLU激活函数; 将所述胶 囊网络采用的ReLU激活 函数修改为ReLU6 激活函数。 6.根据权利要求1所述的ResNet18与胶囊网络结合并进行剪枝的人脸表情识别方法, 其特征在于, 所述方法还 包括如下模块: 网络模型构建模块, 用于构建胶囊网络; 所述胶囊 网络包括: 卷积层、 初级胶囊层、 数字 胶囊层, 所述卷积层是通道数为256, 卷积核大小为9 ×9, 步长为1的单卷积层, 所述初级胶 囊层包括: 通道数为256、 卷积核大小为9 ×9、 步长为2的单卷积层, 所述数字胶囊层包含 7个 胶囊, 且所述数字胶囊层由所述初级胶囊层经 过路由机制得到; 网络模型调整模块, 用于调整ResNet18网络模型, 包括: 去除ResNet18网络模型的全连 接层, 剔除ResNet18网络模型的全局平均池化层, 将ResNet18网络模型的第一个卷积层的 卷积核大小由3 ×3修改为5 ×5, ResNet18网络模型的第一个残差块保持不变, 将ResNet18 网络模型的第二个残差块和第三个残差块的步长调整为1, 将所述ResNet的第四个残差块 的通道数修改为25 6; 注意力融入模块, 用于在调整后的ResNet18网络模型的四个残差块中加入注意力机 制; 卷积层替换模块, 利用调整后的ResNet18网络模型替换 所述胶囊网络的单 卷积层; 特征图提取模块, 利用调整后的ResNet18网络模型从输入特征中提取训练特征图; 包 括: 在所述输入特征上进行全局 最大池化和全局平均池化得到两个一维向量, 所述两个一 维向量经过共享MLP层处理后相加, 再经过Sigmoid激活函数, 得到通道注 意力权重, 在所述 通道注意力权重和输入特征 的乘积上进行最大池化和平均池化, 得到两个特征图, 所述两 个特征图经过卷积核大小为7 ×7的卷积层处理, 得到一个新的特征图, 再经过BN层和 Sigmoid激活函数, 得到空间注 意力权重, 将所述空间注 意力权重与所述通道注 意力权重和 输入特征的乘积相乘得到所述训练特 征图; 网络模型训练模块, 用于将所述训练特征图输入至所述胶囊网络中进行训练, 得到网 络模型; 剪枝处理模块, 用于针对所述网络模型, 采用L2范 数进行剪枝处 理; 人脸表情识别 模块, 利用数据集进行人脸表情识别: 所述数据集至少包括: CK+数据集、 RAF‑db数据集、 FER+数据集。权 利 要 求 书 2/2 页 3 CN 115471899 A 3

PDF文档 专利 ResNet18与胶囊网络结合并进行剪枝的人脸表情识别方法

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 ResNet18与胶囊网络结合并进行剪枝的人脸表情识别方法 第 1 页 专利 ResNet18与胶囊网络结合并进行剪枝的人脸表情识别方法 第 2 页 专利 ResNet18与胶囊网络结合并进行剪枝的人脸表情识别方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:24:22上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。