安防行业的8K会来吗?
在广电行业,8K已经到来了,8K超高清的生态链已日趋完善。专门针对8K超高清的新一代编码技术标准(H.266以及国内的AVS3)已发布,CCTV的超高清频道(CCTV-8K)已于2021年2月1日开始试验播出,5G发展步伐明显加快,电视芯片厂商推出8K电视解决方案(比如海思8K端侧全系列解决方案),中国超高清视频产业联盟成立并发布多项相关标准。从前端视频采集制作,编码,到传输,到最后终端用户显示呈现,8K在广电行业的应用已落地并且前景越来越明朗。那安防行业的8K呢?在技术革新发展上始终略微落后广电行业的安防行业的8K要来了吗?
答案是肯定的,好像又不是。写到这里,想起秦晖先生评价辛亥革命的一段话:演员越来越清晰,剧本越来越模糊……,用在这里来描述8K之于安防行业再合适不过了。在理解我这段感触之前,我们还是先来看下8K的概念以及安防行业进入8K时代,技术储备够了吗?
8K
8K,简单的看,是一个分辨率概念,指7680 X 4320,大约330M像素的分辨率(水平分辨率7680,约等于于8000,所以把此分辨率称为8K,4K亦如此。)。8K的分辨率是4K的4倍,是FHD的16倍。分辨率越高,意味着监控视野更开阔,画面更清晰,细节更丰富,录制下来的视频也更有价值。
前面提到,在广电领域,8K超高清的生态链已日趋成熟。从视频拍摄,编码,到数据传输,最后到消费端的解码呈现,均有完整的解决方案和产品。那安防行业呢,8K超高清的完整解决方案有了吗?
安防行业进入8K的技术储备
我们也从视频采集编码,数据传输,然后到终端的解码显示,录像存储这一过程来分析下8K超高清应用于安防领域是否可行。
编码技术
继H.265以后,新一代视频编码标准H.266(VVC)已于2020年7月发布了第一版,H.266支持4K到16K的分辨率以及全景视频,与H.265/HEVC相比,在不降低视频质量的前提下,H.266能节省大约50%的码流。与H.266技术相当的中国国内视频编码标准AVS3也已推出。
在安防领域,4K分辨率,H.265编码的监控视频码流大约是8000kbps。8K的分辨率是4K的4倍,如果码流也按照4倍计算,大约是32000kbps,如果采用最新的H.266编码,那码流应该是16000kbps,从视频编码技术角度看,8K超高清应用于安防行业没有问题。
芯片技术
作为安防摄像机来说,最重要的组成部分就是视频编码芯片(DSP)以及前端图像传感器(sensor)。8K摄像机使用的视频编码芯片和sensor目前市面上已有多款。比如海思的Hi3559AV100,最大分辨率支持到33M(7680 x 4320)或者36M(6000 x 6000)sensor输入,可支持最大分辨率为 16384 x 8640 H.265视频编码。
支持8K及以上分辨率的sensor目前面市的也有很多,比如Sony的2.7'的IMX455 sensor,最大分辨率61.17M,支持8K@30fps图像采集输出。
性价比很高的Omnivision有多款32M及以上分辨率的sensor,比如OV32A (最大分辨率32M),OV40A (最大分辨率40M) ,OV48B (最大分辨率48M) ,OV50A (最大分辨率50M) ,OV60A (最大分辨率60M) ,OV64A(最大分辨率64M)等。
传输
更大分辨率,更大的码流,意味着占用的传输带宽越高,但是得益于最新的视频编码技术,8K视频所占用的带宽是我们现有的有线网络可以承受的。前面分析了,8K视频如果采用H.265编码,码流大约是 32000kbps ,换算成带宽就是40MB,如果是H.266编码,占用带宽就是20MB,这对于有线网络完全是可以承受的。
5G的应用也使得8K通过移动信号传输成为了可能,单个5G基站总的上传速率最大能达到300Mbps(实际体验能达到 200Mbps左右),因此使用5G来传输H.266编码的8K摄像机也是可能的。
如果采用无线传输,目前的Wi-Fi 6,理论最高可支持9.6Gbps的传输速率,完全能满足8K超高清视频监控摄像机的传输要求。
显示
8K视频解码显示需要8K甚至更高分辨率的显示设备。因为在广电行业的迅速发展,8K分辨率的显示设备已比较常见。Canon,Sharp,Philips,Dell,BOE以及LG,Samsung,Sony等均有支持8K分辨率的显示器,监视器面市。
线缆接口方面,最新的HDMI 2.1最大已能支持10K@120 Hz。
存储
8K的码流是4K的4倍,如果采用H.266编码,与现有视频监控系统对比(采用H.265编码),仅仅增长2倍左右,对硬盘的容量及读写速度要求的增长不多,现有视频存储系统及硬盘性能仍能满足8K监控视频的需要。
问题
通过以上的分析,一切似乎都是水到渠成,8K超高清视频监控的发展和未来似乎很清晰了。
然而,如果把上面提到的促成8K超高清在安防领域发展的各种因素看成演员的话,我们会发现演员的确越来越清晰,但是8K在安防领域发展的前景似乎还不明朗,没有按照剧本预期发展,甚至剧本本身越来越模糊。
演员越来越清晰,剧本越来越模糊……,原因何在?
从1927年6月视频监控系统出现,至今不过百年,而更高清和更智能一直是推动视频监控系统发展的两个驱动点。从模拟标清时代的cif,4cif(D1),960H到网络时代的720P,1080P,乃至4MP,5MP,直至现在的4K。另一方面,从早期的移动侦测分析,图像质量诊断分析,到拌线,入侵,越界,物品看守等简单的智能分析,到人形侦测,人脸识别,声音侦测,表情分析, 车牌识别等,乃至深度学习,结构化数据,人脸比对,智能交通,SDC(software defined camera)等。
然后随着前端监控摄像机数量越来越多,视频监控图像越来越清晰,一个很现实的问题摆在了我们面前。越高清并不意味着越智能。
安防视频监控最终是给机器看,并不是给人眼看。人力毕竟有限,曾经警匪片中几名警察坐在监视器前目不转睛盯着录像视频,查找线索的场景早已是过去式。取而代之的是人工智能(AI),深度学习。通过智能的监控系统,目标人物的踪迹很容易,很快能被从浩如烟海的视频监控录像资料中找出来。
安防视频监控最终给机器看,太高的清晰度,分辨率,更多的像素意味着需要更多的计算资源,算力。更多的计算资源,算力成本是昂贵的。
另一方面,更高清的视频对AI,深度学习来说不是必须的。早期模拟标清监控时代,车牌识别的准确度已相当高。现在用在智能交通领域的车牌识别摄像头也多为300-500万像素,很少使用更高像素的。这样单个摄像头足以覆盖2-3个车道,清晰度也能满足车牌识别的需要,资源利用率最高。公安部GA/T 893中要求字母辨识度达到15像素(200像素/米)即可。
再举个例子,GB/T 35678-2017 公共安全人脸识别应用图像技术要求中注明,进行人脸识别时, 两眼间距应大于等于30像素,推荐大于等于60像素。一般的,人脸像素达到80×80像素左右即能满足机器人脸识别的需要。按照三星(Hanwha)的标准,要实现深度学习的人体探测,车牌识别,目标像素达到1.33px/cm即可。(以上可以参考 从像素密度考虑摄像机选型,人脸识别算法 等文章)
AI功能主要受算法,算力,大数据这三因素影响。其中的大数据与图像清晰度关系不太大,核心是需要将大量的监控数据结构化,而不是需要更高的清晰度。(安防视频监控中的AI功能)
广电行业的8K已经到了。电视终端面向的是人眼,而安防最后的受众将是机器,机器视觉(至少趋势是如此)。更高清,还是更智能?安防行业似乎选择了后者。从软件定义摄像机,software define camera(SDC)到软件定义一切(SDx),安防行业与高清已经渐行渐远。