当前位置:首页首次被写入政府工作报告的“人工智能” 成为了李彦宏的“打拐”利器 举报文章

首次被写入政府工作报告的“人工智能” 成为了李彦宏的“打拐”利器

作者:admin    来源:用户投稿    时间:2017.3.6   

时至今日,你也很难估量2011年——微博上一个黄金时期,社科院农村发展研究所教授于建嵘先生发起的“随手拍照解救乞讨儿”活动产生的社会影响力。尽管轰轰烈烈的“人人拍照挽救拐卖儿童”因陷入某种狂热而遭到质疑,但公众对这一事件的愤恨,对离散家庭的怜悯,依旧持续产生了在其他事件上并不常见的共情效应——为数不多的社会题材院线电影,甚至有《失孤》和《亲爱的》两部与此相关。

不过现实是,由于查找与辨认儿童唯有靠肉眼并不擅长的照片对比,准确率和效率上都非常有限,仍未从根本上改善这一社会悲剧。也因此,几乎每年两会都有人大代表提出与走失儿童相关议案,譬如去年就有代表建议:儿童出生时由政府免费采集DNA,且所有孩子上户口时必须核对DNA信息。然而经济学常识是,美好愿景与“社会成本”之间存在鸿沟,通过DNA比对需要巨大的技术成本。

一年之后,今年提出议案的换成了科技大佬李彦宏。3月3日,李彦宏在全国政协十二届五次会议提案:利用已经成熟的人工智能和大数据技术,帮助解决走失儿童问题。

事实上,当人工智能普遍被产业界视作未来社会下一代基础设施,与之相关的提案当然不只李彦宏一份,复星集团董事长郭广昌也提案,希望更多医疗健康行业与人工智能技术相结合——而让李彦宏和郭广昌兴奋的是,就在3月5日上午,第十二届全国人民代表大会第五次会议在人民大会堂开幕,“人工智能”首次被写入全国政府工作报告。

当然,说回李彦宏的这份提案。其实多年来,舆论强大的共情作用让不少科技企业都试图改善这一现象:譬如两年前颇为火爆的儿童智能穿戴设备,但遗憾的是,后来由于辐射高,续航差,GPS 误差高等原因,被寄予厚望的可穿戴逐渐沦为一时玩物;此外微博也曾推出过“LBS地域情景化网格系统”,利用用户位置信息有所作为。

与上述从“边缘性”突围的方式不同,李彦宏祭出的手段是过去一年多次提及的人工智能,在他看来,“近年来人工智能和大数据技术不断完善,应用日趋成熟,有望进一步促进儿童走失案件的侦破。一方面,人脸识别能够提升图像侦查效率,尽早锁定失踪儿童或涉案人员。另一方面,人脸识别能够实现海量人脸数据的跨年龄比对,帮助侦破儿童走失积案。”

于是问题的关键转向在公众一端熟悉又陌生的词汇:人脸识别。今天不妨从技术视角,分析一下李彦宏这一提案的理论基础。毕竟,相较于DNA,“人脸”是大众更熟悉且成本低得多的识别对象。

人类思维VS机器思维

进化心理学告诉我们:由于祖先族群内原始的协作需求——以及识别“异己者”和“不合作者”的本能,人类大脑从上百年前就演化出了识别人脸的能力。而也正由于这上百年“时间差”造成的演化沉淀,识别他人面孔归属于大脑应激反应的所谓快系统,或者说直觉——不过,机器世界里从来没有“直觉”二字,有的只是算法和数据。

这亦是人脸识别技术难度所在。不同于一般图像识别,人类脸部结构存在极大相似性;且表情易变(人类究竟有多少种表情?我还没看到特别权威的数字,但至少比“表情包”丰富得多);另外,不同的观察角度,光照条件,遮盖物(口罩,墨镜,头发,胡须等等)都会增加机器识别难度;更何况丧心病狂的人类居然还通过整容和P图等行为扰乱机器判断……

不过即便如此,当如今人工智能已发展到“只要人类正常情况下1秒就能做的事,它几乎也能做到”的地步,人脸识别的技术进步也令人欣喜。

顾名思义,作为一种集成了机器学习,模型理论,专家系统,视频图像等多种技术的综合实现方式,人脸识别可以实现人脸检测,对比以及查找。而这一轮人脸识别精准性的提升,无疑受益于在海量数据加持下的深度学习(作为一次算法革命,深度学习以一种简练的网络模型解决了过往印象中极为复杂的思维体系):换句话说,为了在“茫茫人脸”中认出特定面孔,机器需要先自己“记住”上亿张人脸。

这就得说到机器思维的底层逻辑。与人类思维试图将整个世界简化和抽象理解不同(大脑带宽有限,人类对因果关系和“贴标签”的热衷皆因于此),机器思维走在了奥卡姆剃刀原则的反面——人工智能不会将世界简化,而是从复杂信息中以自己的方式进行筛选。

举个例子,在那期被广泛热议的《最强大脑》人机大战中,人工智能与世界记忆大师王峰通过分析照片中出现的幼年人脸,识别出现场20年后的成年人,人工智能了,但要知道,截止这场比赛前,百度已动用大概200人次,近2亿张照片作为训练样本数据,通过提取人脸中相对稳定和细微的特征,完成年龄跨度较大的人像高精度比对。

从“竞赛”角度,人类与机器并不在同一起跑线,但也就在那次节目上,初为人母的章子怡女士感慨道:“我们有很多的失踪儿童,他成长了之后可能连父母都认不出来他的样子,但小度可以帮我们辨别出来,所以小度要为人类作出更多贡献。”

不知道李彦宏的两会提案,是否与此有关。

人脸识别技术路径

在我看来,已颇为成熟的人脸识别技术,倒不失为一次理解机器思维的好机会。

事实上,人脸识别的实现大体可分为四步。第一步当然是人脸检测:根据眼睛,眉毛,嘴巴,鼻子等器官特征和相互几何位置关系检测人脸。第二步则是人脸图像预处理:如前所述,原始图像由于受各种条件的限制和干扰,很多时候无法直接使用,必须在早期阶段对其进行灰度校正,噪声过滤等图像预处理。进一步剖析的话,这种预处理主要包括人脸对准(得到人脸位置端正的人脸图像),图像增强(改善图像质量,在视觉上更清晰,且让图像更利于计算机的处理与识别)以及归一化(取得尺寸一致,灰度取值范围相同的标准化人脸图像)等工作。

人脸识别的第三步就是脸图像特征提取——这一步是针对人脸某些特征进行的,也是对人脸进行特征建模的过程。最后一步,即是出结果的匹配与识别:将待识别的人脸特征与已得到的人脸特征模板进行比较,根据相似程度对人脸的身份信息进行判断。

以上是适用于所有识别用途的理论路径,但李彦宏在提案中涉及的场景则更为复杂:“可能孩子是在很小的时候走失的,但他再进入公众视线可能已经上小学了——比如办学生证的时候需要拍照片,这种情况下通过人工智能的比对,就有可能比以前更加高效的帮助有关部门和家庭找到走失儿童。”

就像章子怡冀望的那样,对比走失儿童是“跨年龄人脸识别”技术最具社会价值的实现场景。但在影响人脸识别率的所有因素上,时间往往是最难对抗的部分,原因之一是跨年龄识别中类内变化通常会大于类间变化;另外,跨年龄训练数据难寻,若没有海量数据,深度学习神经网络便很难学习到跨年龄的类内和类间变化。不过百度也提出了解决方案:针对第一点,他们选择用度量学习的方法,通过学习一个非线性投影函数,把图像空间投影到特征空间中,在这个特征空间里跨年龄的同一个人的两张人脸距离会比不同人的相似年龄的两张人脸的距离要小;而针对第二点,考虑到跨年龄人脸的稀缺性,通过一个用大规模人脸数据训练好的模型作为底座,然后用跨年龄数据对他做更新。而将上述两点结合,通过端到端的训练,即可以大幅提升跨年龄识别的识别率。

这也正是李彦宏此次提案的理论基础。

培育共识

事实上,在准备两会提案时,李彦宏已非常确信技术本身的成熟度。但要知道,让技术落地从来都是检验技术的唯一标准。其实人脸识别已广泛应用于诸多领域,最直接的例子是,早在提案前,百度人脸识别就已经用于寻人平台上,平台现对接民政部全国救助寻亲网中近3条走失人口信息。

不过,历史经验是:让社会系统向更美好的方向演进,技术之外,还需要某种合力。通过人工智能寻找走失儿童亦不例外,它需要与相关部门相互嵌合,根据场景不断调优。也因为此,李彦宏在提案中的具体建议包括:建立适用于搜寻走失儿童的人脸识别模型;建立覆盖全国的走失儿童数据库;将人脸识别技术与治安和交通监控系统相结合等。

在我看来,即便提案延缓落地,也不失为一次在整个社会范畴孕育共识的机会,要知道,人工智能会成为未来服务公共事务的重要方式,但来自政府的顶层支持也是让作为社会基础设施的人工智能尽早落地的途径。

如今,人工智能仿佛一个植入系统,已经改变了购物,金融,媒体,交通,外卖等生活各个日常片段,并期待自己如百年前的电力系统一般为人类延伸出更多的可能。所以你完全可以想象如下场景:《失孤》和《亲爱的》中的父母不再通过持续多年的满城寻觅,而是到公安机关录入孩子照片,机器通过数据库对比,寻找到匹配对象,以更能燃起希望的方式,让故事以相对完满的结局收场。

李北辰/文(知名科技自媒体,致力于用文字优雅的文章,为您提供谈资与见识;微信公号:李北辰)

好文打赏,给Ta鼓励
扫一扫用手机阅读本文
Tags:首次  成为  成为了  写入  政府  工作  报告  人工  人工智能  智能  
  • 相关搜索
图片推荐
    网站文章如何优化的顶级方法

    网站文章如何优化的顶级方法

    一个网站的排名可以说基本上都是靠文章的排名获取大量流量的,如果一个网站文章没有优化好,那么这个网站就会失去百分之99的流量,可以想象网站文章优化的重要性,比如我们在不认识站长之家和非凡网赚网 0839
    百度搜索:开展清理被黑新闻源专项行动

    百度搜索:开展清理被黑新闻源专项行动

    近日,有网友反映,在使用百度搜索时,在新闻垂类下输入某些关键词搜索新闻,结果页会出现非法内容。对此百度站长平台在官方微博发布声明,称该情况系部分新闻源网站被违法分子篡改,将流量导向非法网站,也就是俗称
    创业者复盘:众筹创业三个月,生鲜电商的那些坑

    创业者复盘:众筹创业三个月,生鲜电商的那些坑

    生鲜食品电商被称为电子商务领域最后一片蓝海,这将是市场容量最大、发展潜力最大、机会最多的一个领域,但同时生鲜电商也是难度最大的一个领域,因为人才储备、产品损耗、产品的标准化、冷链物流、最后一公里的配送
    京东否认优衣库“闪离”与销量有关

    京东否认优衣库“闪离”与销量有关

    CFP供图  东哥的站台并没有能留住优衣库的心。优衣库京东官方旗舰店在实际进行了1个月的营业后,宣布退出京东平台。优衣库品牌所属公司日本迅销集团表示,由于此次合作仍存在许多需要进一步探讨和完善的地方,
    美图公司今日将公布年报 股价一度大涨逾8%

    美图公司今日将公布年报 股价一度大涨逾8%

    业内人士认为,美图的大涨缘于美图AI、AR布局的概念,叠加高知名度和在受众中的高渗透率以及香港互联网个股资源的稀缺性,导致巨量资金涌入。不过也有分析人士指出,美图的剧烈震荡只是A股次新股炒作的港股翻版
    个人站长的创业新出路:细分领域的农村电商

    个人站长的创业新出路:细分领域的农村电商

    在传统门户网站被唱衰之后,我一直在想,那些曾经红红火火的个人站长们,都在忙什么?他们又将面临着怎样的改变与互联网发展趋势?  小网站正在灭亡、草根站长难活的,享受着本地最具新媒体称号的,站长群体中仍然
    “互联网+”下的华强北突围:能再造百个大疆?

    “互联网+”下的华强北突围:能再造百个大疆?

    华强北的电子市场上有上百万个品种的电子产品供商家们采购。  深圳商报记者 施平 摄  深圳商报记者 余璐 季杰  华强北这条街,兼容并包,在这里不仅能找到国内外知名品牌的数码电子商品,还能找到刚刚摆脱
    谈谈卢松松举办的YY语音逆袭大会,屌丝也有春天

    谈谈卢松松举办的YY语音逆袭大会,屌丝也有春天

    由卢松松举办的的YY分享逆袭会,在2014年12月10日的凌晨时分圆满结束了。整天分享会议讲了有四个小时,有礼品,有干货,有站长界名人,还有我们这帮苦逼的屌丝。收获了很多,也学到了很多,也与大家分享一
你是怎么知道非凡网赚网的?
  •   
  • 联系QQ 邮箱:976382653@qq.com 微信:976382653
    在线留言
    发布软文
    广告自助购
    文章调用
    常见问题
    保存到桌面