现代社会的信息量正以飞快的速度增长,这些信息里又积累着大量的数据。预计到2025年,每年产生的数据信息将会有超过1/3的内容驻留在云平台中或借助云平台处理。我们需要对这些数据进行分析和处理,以获取更多有价值的信息。在未来的“智慧城市”中,会有越来越大的结构化以及非结构化的数据。那么我们如何高效地存储和管理这些数据,如何分析这些数据呢?答案是,我们需要强有力的大数据处理系统进行支撑。
作为目前最火热的词汇之一,大数据在各个领域都已有了较为成熟的应用。在视频监控领域,大数据时代正悄悄来临。在城市安全、交通管理中将部署大量的视频监控设备,这些视频监控设备将产生大量的视频及其相关的数据,如交通卡口数据达到十亿条甚至更大级别,人脸库数据量达到千万条甚至更大级别。针对如此大级别的数据量,当前系统会逐渐暴露出数据检索速度越来越慢;数据统计、分析效率越来越低等问题,这些问题都需要一个成熟的技术来解决。
随着“智慧城市”中城市安全、智慧交通等的迅速发展,城市中非结构化的数据量越来越大。视频大数据技术侧重帮助各类客户从日趋海量的非结构化视频数据中快速发掘高价值的信息,协助客户提升其决策的效率和精准度。因此,视频大数据的处理好坏成了客户关注的焦点,视频大数据的处理技术也成了厂家能力的体现。针对“智慧城市”建设中大量视频数据的快速检索、统计分析的需求,海康威视等视频领域的领军企业已有了成熟的视频大数据的解决方案,目前已应用多个“智慧城市”的建设中。
一、视频大数据平台技术
针对结构化或半结构化数据的数据量特别大的场景,大数据平台作为应用平台的支撑平台,提供海量数据的高效处理能力。通过大数据平台,应用能够对这些数据进行高效地存储、检索(秒级)、分析和统计,切实地提高效率,提升用户体验度。
视频大数据平台一般以分布式集群的方式进行建设,集群能够对数据处理进行负载均衡,同时,集群能够方便地进行扩展,能够通过增加集群节点来提升平台整体性能。数据存储需要考虑以下几个方面:一、哪些数据需要保存到视频大数据平台;二、如果对原有系统进行改造,原有系统中已存在的那些数据该如何处理;三、如何保证数据的可靠性。视频大数据平台采用分布式计算,同时结合内存加速、负载均衡、本地处理,提供高效的数据计算能力。
视频大数据处理系统,在应对视频大数据处理中的存储问题,采用了分布式存储方式,提高了读写速度,并扩大了存储容量;在应对视频大数据处理中的计算问题,采用分布式计算系统,提高了数据分析和挖掘能力。视频大数据处理系统总体架构如下图所示,包括资源层、平台层、应用层三个层次。
资源层:包括IT基础资源、数据资源、视频资源等。能够产生、存储、处理海量数据的资源如过车数据、人脸数据、案事件数据等。
平台层:即视频大数据平台,包括数据存储、数据处理、数据迁移、集群管理等功能,同时为上层应用提供接口。视频大数据平台地位类似于数据库,但是它比数据库的处理能力要强大很多,可以对海量数据进行处理。
应用层:基于视频大数据平台提供的高效数据处理服务,行业应用平台(公安、交通、司法、能源、教育等)能够为用户提供海量数据的高效存储、检索、分析和统计等功能。
二、视频大数据技术在智慧交通中的应用
在智慧交通的道路交通应用中,卡口过车数据呈爆炸式增长。对于一个城市,每个卡口每天会经过成千上万辆车,假设一个城市有1000个卡口,每个卡口每天平均过车记录数为10000次,需要对一年内的数据进行处理,则过车记录总数为36.5亿。当卡口过车数据规模达到十亿级别甚至更大后,当前系统的运行速度越来越慢,过车信息检索、研判和分析的耗时越来越长,用户体验越来越差。使用传统的关系型数据库解决方案会使效率大大降低,或者在保证效率的情况下,会使软件、硬件投入成本大大增加,如采用小型机等。针对此类场景,可采用大数据技术,数据量特别大的过车数据由视频大数据平台来处理,视频大数据平台可提供足够大的内存和本地存储,同时,采用分布式计算,各节点并行进行计算,极大地提高数据处理的能力。视频大数据平台具有系统可靠、数据安全、数据处理能力高效、投入成本低、扩展能力强等特点。
交通卡口大数据应用的不同之处在于后端子系统的设计。传统方案中,只有一个智慧交通平台;而大数据方案中,智慧交通平台之下多了一个视频大数据平台,海量的过车数据存储于视频大数据平台中,大数据平台为上层平台提供海量数据的高效处理服务。以10亿条数据为例,在检索、研判和统计分析等应用中传统方案检索时间是分钟级,采用大数据技术检索时间可以达到秒级。基于视频大数据平台,智慧交通平台实现了高效的检索、分析、统计等功能,能够为用户提供更好的服务。以下是目前可实现应用功能主要功能:
1)快速检索
能够根据精确条件/模糊条件快速查询出过车数据记录。大数据方案可以从数十亿条数据中快速筛选出目标过车记录,提高交通管理部门的执勤效率。
2)研判分析
研判分析包括频度研判、特定时间段车辆研判、初次入城、行车轨迹、跟车研判等应用。大数据方案可以迅速及时的发现事件信息,提高交通管理部门的快速响应能力。
3)统计分析
统计分析包括车流量统计、车流量对比、车辆违法统计、特定时段车流量、行车轨迹统计等应用。大数据方案可以实现更大范围的交通流量数据统计,可以更加全面完整的反应一个城市的交通状况,为交通管理部门决策提供数据支撑。
三、视频大数据技术在智慧安全中的应用
在智慧安全的案件侦缉等应用中,经常需要进行人员信息的查询,人员信息库中的一个重要组成部分是人脸库,人脸库包括人员的基本信息、头像图片以及根据头像建模而得的人脸特征向量。其中案件侦缉中一个重要的应用是人脸检索,即从视频图像中提取人带人脸的特征向量跟人脸库中的数据进行比对,查询出来此人的基本信息。当人脸库数量达到1000万级别甚至更大后,目前人脸检索方式会出现瓶颈。因为在人脸的检索过程中需要检索整个人脸库,需要将整个人脸库导入到内存中以提高检索效率,对服务器内存要求高,而当前大多人脸检索方案不支持集群架构,只能增加单服务器的内存以满足需求,容易出现瓶颈。针对此类场景,可采用人脸检索的大数据解决方案,人脸库保存于视频大数据平台中,视频大数据平台采用集群架构,并且可平滑扩展,可以提供足够大的内存,同时,采用分布式计算,各节点并行进行计算,极大地提高数据处理的能力。
人脸检索大数据应用的不同之处在于后端子系统中加入了视频大数据平台。智慧安全应用平台为用户提供人脸检索功能;视频大数据平台存储人脸库数据,进行高效的人脸分析比对,为应用平台提供人脸检索服务。以1000万条数据为例。如果传统的方式数据库需要管理员进行手动的分库分表操作,随着数据的增长维护工作量会越来越大,同时也很难保证系统的正常运行;采用视频大数据技术可以轻松的做到系统的横向扩展,保证系统高效的运行。基于视频大数据平台,智慧安全应用平台能够为用户提供快速的人脸检索功能。
四、总结展望
视频大数据技术能够解决当前系统处理海量视频及相关数据能力不足的问题,帮助客户从海量的视频数据中快速挖掘高价值的信息,协助客户提升其决策的效率和精准度。可以预见在未来的“智慧城市”建设中,视频的数据量会爆炸性增长,对海量视频数据处理系统的要求会越来越高,对视频数据挖掘的能力要求越来越强,视频大数据平台将引入越来越多的机器学习、图算法等尖端技术来提高整个系统的智能化水平。