专利 一种停车场全景安全监控方法

(19)国家知识产权局 (12)发明专利 (10)授权公告号 (45)授权公告日 (21)申请号 202210535421.9 (22)申请日 2022.05.18 (65)同一申请的已公布的文献号申请公布号 CN 114639171 A (43)申请公布日 2022.06.17 (73)专利权人松立控股集团股份有限公司地址 266000 山东省青岛市市南区宁夏路 288号软件园6号楼1 1层 (72)发明人刘寒松　王永　王国强　刘瑞　翟贵乾　李贤超　焦安健　谭连胜　董玉超　 (74)专利代理机构青岛高晓专利事务所(普通合伙) 37104 专利代理师黄晓敏 (51)Int.Cl. G06V 40/20(2022.01) G06V 20/52(2022.01) G06V 20/40(2022.01)G06T 7/269(2017.01) G06V 10/46(2022.01) (56)对比文件 CN 105303571 A,2016.02.0 3 CN 113920468 A,202 2.01.11 CN 113128344 A,2021.07.16 CN 106878674 A,2017.0 6.20 US 20213982 94 A1,2021.12.23 US 2016086052 A1,2016.0 3.24 Xiaoqi Zhao et.al.Multi-Source Fusi on and Automatic Predictor Selecti on for Zero-Shot Video Object Segmentati on. 《Proceedings of the 2 9th ACM Internati onal Conference o n Multimedia》 .2022, 卢晶等.融合运动信息的三维视觉显著性算法研究. 《计算机工程》 .2018,(第01期), 审查员李晗 (54)发明名称一种停车场全景安全监控方法 (57)摘要本发明属于停车场安全监控技术领域，涉及一种停车场全景安全监控方法，先基于人眼注意机制，采用基于运动信息、对比信息和声音信息的多模态显著性区域推荐算法检测人眼关注区域，同时结合事件重要性权重制定监控内容处理优先级排名，对非关注区域降低分辨率的方式节省资源占用，从而达到实时全景安全监控的目的，并基于安全检测权重以及监控帧间连续性，制定停车场全景安全监控，加快传输和节省保存空间，节约成本。权利要求书2页说明书6页附图1页 CN 114639171 B 2022.07.29 CN 114639171 B 1.一种停车场全景安全监控方法，其特征在于，具体包括如下步骤： (1)采集全景摄像头视频段，根据采集到的全景摄像头视频段构建停车场全景安全监控视频数据集； (2)根据停车场全景监控视频数据集分别基于运动信息、对比信息和声音信息显著性进行检测；其中运动信息显著性基于物体在监控视频中前后帧之间的位移关系，获得物体相对于背景区域运动的快慢来判断物体状态，通过FlowNet2计算相邻两帧(I1， I2)之间的光流信息获得视频间的运动信息，光流信息(u， v)为计算两个像素点之间的速度差： I(x， y， t)＝ I(x+Δx， y+Δy， t+Δt)， Δx， Δy是像素分别沿x轴和y轴移动的距离， Δt是像素从I1到I2所用的时间， x， y为初始像素点的坐标位置， t 为移动Δx， Δy需要的时间；得到光流信息之后，通过设计光流感知显著性检测网络MotionNet，采用DAVSOD作为运动信息感知训练数据集，将光流特征转化为运动显著性特征： Salmotion＝MotionNet(Flow2Color(u， v))， Flow2Color代表将光流图转化为RGB图，不同颜色表示不同的运动方向，深浅表示运动的快慢， Moti onNet将RGB图作为输入， Salmotion为输出的运动显著性检测结果图；对比信息显著性是基于物体所处的位置、颜色和纹理特征，通过与背景信息以及物体间的对比突出物体，采用MSRA10K作为对比信息感知训练数据集，基于图片的显著性检测算法ContrastNet通过网络层的不同层侧输出感知物体的尺度对比信息， Salcontrest＝ContrastNet(Mutiscale(Co lor， Texture， Edge) )， Color、 Texture、 Edge分别代表颜色信息、纹理信息、边缘信息， Mutiscale代表多尺度信息， ContrastNet将MSRA10K 的RGB图作为输入， S alcontrast为输出的对比显著性检测结果图；声音信息显著性检测是将声音作为视觉信息的辅助，采用AVEDataset作为声音信息感知训练数据集，将音频信息通过傅立叶变换转化为声谱图，将声谱图输入到网络中，判定当前输入中是否含有声音信息，从而决定当前帧的重要性，具体为： Salaudio＝AudioNet(MFCC(Audio))，其中， MFCC为傅立叶变换， AudioNet将傅立叶变化图作为输入， Salaudio为输出声音显著性检测结果图； (3)基于运动信息、对比信息和声音信息的显著性检测结果查找出相应的重要物体，对查找出的重要物体进行重要性排名；物体重要性排名通过以下公式实现：其中Rankk代表第k个物体的排名， N为像素个数， Norm为矩阵最大最小归一化函数， Confidence为物体置信度，物体置信度Confidence以及物体编号k通过物体检测YoloV5得到； (4)对排名后的物体进行全景监控视频帧间一致性平滑，将帧间相同物体连接起来形成平滑的窗口运动轨迹； (5)根据步骤(4)形成的不同物体运动轨迹，将点转化为平面，通过屏幕的方式提供单权　利　要　求　书 1/2 页 2 CN 114639171 B 2窗口单一物体或者多窗口的全景安全内容； (6)针对步骤(5)输出的窗口内容进行动态调节和人工干预监控内容，如窗口内容不是想关注的内容，只需将鼠标移动到需要关注的物体上，并点击该物体，此时以鼠标标记点为中心，形成针对中心为投影中心的投影窗口，并基于此窗口提供后续监控。 2.根据权利要求1所述停车场全景安全监控方法，其特征在于，步骤(1)所述停车场全景安全监控视频数据集采用显著性检测数据集作为训练集，在构建训练集的过程中，先在完整数据集上训练，然后再挑选车辆相关的数据集作为微调数据，使得模型关注车辆、行人和障碍物显著性区域，显著性检测数据集包括最符合人眼视觉特征且最大的视频显著性检测数据集DAVSOD、最符合人眼视觉特征且最大的音对比显著性检测数据集MSRA10K和最符合人眼视觉特征且最大的音频显著性检测数据集A VEDataset。 3.根据权利要求2所述停车场全景安全监控方法，其特征在于，步骤(4)中帧间一致性信息为窗口坐标变化5个像素内，对于超出范围的坐标变化看作超出运动范围的内容，形成的运动轨迹为： Locus＝Smo oth(∑m∈CLocus′(x1， y1， xm， ym))， Locus’代表点的初始轨迹， Locus代表点平滑后的轨迹， Smooth代表轨迹求均值平滑， C 为点x1， y1周围c＝5领域， xm， ym为点x1， y1周围c＝5领域内的像素点。 4.根据权利要求3所述停车场全景安全监控方法，其特征在于，步骤(5)中通过下式将点转化为平面： Window＝Projecti on(Locus)，其中， windows代表输出窗口， Projecti on代表基于点轨迹Locus的perspective投影。权　利　要　求　书 2/2 页 3 CN 114639171 B 3

专利 一种停车场全景安全监控方法

专利一种停车场全景安全监控方法