时至今日,你也很难估量2011年——微博上一个黄金时期,社科院农村发展研究所教授于建嵘先生发起的“随手拍照解救乞讨儿”活动产生的社会影响力。尽管轰轰烈烈的“人人拍照挽救拐卖儿童”因陷入某种狂热而遭到质疑,但公众对这一事件的愤恨,对离散家庭的怜悯,依旧持续产生了在其他事件上并不常见的共情效应——为数不多的社会题材院线电影,甚至有《失孤》和《亲爱的》两部与此相关。
不过现实是,由于查找与辨认儿童唯有靠肉眼并不擅长的照片对比,准确率和效率上都非常有限,仍未从根本上改善这一社会悲剧。也因此,几乎每年两会都有人大代表提出与走失儿童相关议案,譬如去年就有代表建议:儿童出生时由政府免费采集DNA,且所有孩子上户口时必须核对DNA信息。然而经济学常识是,美好愿景与“社会成本”之间存在鸿沟,通过DNA比对需要巨大的技术成本。
一年之后,今年提出议案的换成了科技大佬李彦宏。3月3日,李彦宏在全国政协十二届五次会议提案:利用已经成熟的人工智能和大数据技术,帮助解决走失儿童问题。
事实上,当人工智能普遍被产业界视作未来社会下一代基础设施,与之相关的提案当然不只李彦宏一份,复星集团董事长郭广昌也提案,希望更多医疗健康行业与人工智能技术相结合——而让李彦宏和郭广昌兴奋的是,就在3月5日上午,第十二届全国人民代表大会第五次会议在人民大会堂开幕,“人工智能”首次被写入全国政府工作报告。
当然,说回李彦宏的这份提案。其实多年来,舆论强大的共情作用让不少科技企业都试图改善这一现象:譬如两年前颇为火爆的儿童智能穿戴设备,但遗憾的是,后来由于辐射高,续航差,GPS 误差高等原因,被寄予厚望的可穿戴逐渐沦为一时玩物;此外微博也曾推出过“LBS地域情景化网格系统”,利用用户位置信息有所作为。
与上述从“边缘性”突围的方式不同,李彦宏祭出的手段是过去一年多次提及的人工智能,在他看来,“近年来人工智能和大数据技术不断完善,应用日趋成熟,有望进一步促进儿童走失案件的侦破。一方面,人脸识别能够提升图像侦查效率,尽早锁定失踪儿童或涉案人员。另一方面,人脸识别能够实现海量人脸数据的跨年龄比对,帮助侦破儿童走失积案。”
于是问题的关键转向在公众一端熟悉又陌生的词汇:人脸识别。今天不妨从技术视角,分析一下李彦宏这一提案的理论基础。毕竟,相较于DNA,“人脸”是大众更熟悉且成本低得多的识别对象。
人类思维VS机器思维
进化心理学告诉我们:由于祖先族群内原始的协作需求——以及识别“异己者”和“不合作者”的本能,人类大脑从上百年前就演化出了识别人脸的能力。而也正由于这上百年“时间差”造成的演化沉淀,识别他人面孔归属于大脑应激反应的所谓快系统,或者说直觉——不过,机器世界里从来没有“直觉”二字,有的只是算法和数据。
这亦是人脸识别技术难度所在。不同于一般图像识别,人类脸部结构存在极大相似性;且表情易变(人类究竟有多少种表情?我还没看到特别权威的数字,但至少比“表情包”丰富得多);另外,不同的观察角度,光照条件,遮盖物(口罩,墨镜,头发,胡须等等)都会增加机器识别难度;更何况丧心病狂的人类居然还通过整容和P图等行为扰乱机器判断……
不过即便如此,当如今人工智能已发展到“只要人类正常情况下1秒就能做的事,它几乎也能做到”的地步,人脸识别的技术进步也令人欣喜。
顾名思义,作为一种集成了机器学习,模型理论,专家系统,视频图像等多种技术的综合实现方式,人脸识别可以实现人脸检测,对比以及查找。而这一轮人脸识别精准性的提升,无疑受益于在海量数据加持下的深度学习(作为一次算法革命,深度学习以一种简练的网络模型解决了过往印象中极为复杂的思维体系):换句话说,为了在“茫茫人脸”中认出特定面孔,机器需要先自己“记住”上亿张人脸。
这就得说到机器思维的底层逻辑。与人类思维试图将整个世界简化和抽象理解不同(大脑带宽有限,人类对因果关系和“贴标签”的热衷皆因于此),机器思维走在了奥卡姆剃刀原则的反面——人工智能不会将世界简化,而是从复杂信息中以自己的方式进行筛选。
举个例子,在那期被广泛热议的《最强大脑》人机大战中,人工智能与世界记忆大师王峰通过分析照片中出现的幼年人脸,识别出现场20年后的成年人,人工智能了,但要知道,截止这场比赛前,百度已动用大概200人次,近2亿张照片作为训练样本数据,通过提取人脸中相对稳定和细微的特征,完成年龄跨度较大的人像高精度比对。
从“竞赛”角度,人类与机器并不在同一起跑线,但也就在那次节目上,初为人母的章子怡女士感慨道:“我们有很多的失踪儿童,他成长了之后可能连父母都认不出来他的样子,但小度可以帮我们辨别出来,所以小度要为人类作出更多贡献。”
不知道李彦宏的两会提案,是否与此有关。
人脸识别技术路径
在我看来,已颇为成熟的人脸识别技术,倒不失为一次理解机器思维的好机会。
事实上,人脸识别的实现大体可分为四步。第一步当然是人脸检测:根据眼睛,眉毛,嘴巴,鼻子等器官特征和相互几何位置关系检测人脸。第二步则是人脸图像预处理:如前所述,原始图像由于受各种条件的限制和干扰,很多时候无法直接使用,必须在早期阶段对其进行灰度校正,噪声过滤等图像预处理。进一步剖析的话,这种预处理主要包括人脸对准(得到人脸位置端正的人脸图像),图像增强(改善图像质量,在视觉上更清晰,且让图像更利于计算机的处理与识别)以及归一化(取得尺寸一致,灰度取值范围相同的标准化人脸图像)等工作。
人脸识别的第三步就是脸图像特征提取——这一步是针对人脸某些特征进行的,也是对人脸进行特征建模的过程。最后一步,即是出结果的匹配与识别:将待识别的人脸特征与已得到的人脸特征模板进行比较,根据相似程度对人脸的身份信息进行判断。
以上是适用于所有识别用途的理论路径,但李彦宏在提案中涉及的场景则更为复杂:“可能孩子是在很小的时候走失的,但他再进入公众视线可能已经上小学了——比如办学生证的时候需要拍照片,这种情况下通过人工智能的比对,就有可能比以前更加高效的帮助有关部门和家庭找到走失儿童。”
就像章子怡冀望的那样,对比走失儿童是“跨年龄人脸识别”技术最具社会价值的实现场景。但在影响人脸识别率的所有因素上,时间往往是最难对抗的部分,原因之一是跨年龄识别中类内变化通常会大于类间变化;另外,跨年龄训练数据难寻,若没有海量数据,深度学习神经网络便很难学习到跨年龄的类内和类间变化。不过百度也提出了解决方案:针对第一点,他们选择用度量学习的方法,通过学习一个非线性投影函数,把图像空间投影到特征空间中,在这个特征空间里跨年龄的同一个人的两张人脸距离会比不同人的相似年龄的两张人脸的距离要小;而针对第二点,考虑到跨年龄人脸的稀缺性,通过一个用大规模人脸数据训练好的模型作为底座,然后用跨年龄数据对他做更新。而将上述两点结合,通过端到端的训练,即可以大幅提升跨年龄识别的识别率。
这也正是李彦宏此次提案的理论基础。
培育共识
事实上,在准备两会提案时,李彦宏已非常确信技术本身的成熟度。但要知道,让技术落地从来都是检验技术的唯一标准。其实人脸识别已广泛应用于诸多领域,最直接的例子是,早在提案前,百度人脸识别就已经用于寻人平台上,平台现对接民政部全国救助寻亲网中近3条走失人口信息。
不过,历史经验是:让社会系统向更美好的方向演进,技术之外,还需要某种合力。通过人工智能寻找走失儿童亦不例外,它需要与相关部门相互嵌合,根据场景不断调优。也因为此,李彦宏在提案中的具体建议包括:建立适用于搜寻走失儿童的人脸识别模型;建立覆盖全国的走失儿童数据库;将人脸识别技术与治安和交通监控系统相结合等。
在我看来,即便提案延缓落地,也不失为一次在整个社会范畴孕育共识的机会,要知道,人工智能会成为未来服务公共事务的重要方式,但来自政府的顶层支持也是让作为社会基础设施的人工智能尽早落地的途径。
如今,人工智能仿佛一个植入系统,已经改变了购物,金融,媒体,交通,外卖等生活各个日常片段,并期待自己如百年前的电力系统一般为人类延伸出更多的可能。所以你完全可以想象如下场景:《失孤》和《亲爱的》中的父母不再通过持续多年的满城寻觅,而是到公安机关录入孩子照片,机器通过数据库对比,寻找到匹配对象,以更能燃起希望的方式,让故事以相对完满的结局收场。
李北辰/文(知名科技自媒体,致力于用文字优雅的文章,为您提供谈资与见识;微信公号:李北辰)