第一章 人工智能来了(第3/11页)
想看看机器自动撰写的新闻报道是否表达清晰,语句通畅?下面是从美联社职业棒球联盟新闻稿中节选出来的几段:
宾夕法尼亚州立学院(美联社):第十一局,一二三垒有人,一人出局的情况下,迪伦·蒂斯被触身球击中,保送上垒。这是本周三州立学院鹿角队9︰8战胜布鲁克林旋风队的比赛中的一幕。
丹尼·哈茨纳通过牺牲打获得制胜一分。击球后,他成功跑上二垒但在跑向三垒时出局。
基恩·科恩在第一局中打出双杀,使旋风队以1︰0领先。但在第一局的随后时间内,鹿角队连得5分,其中,迪伦·蒂斯的触身球就直接送两人跑回本垒。
……4
自动撰写新闻稿件的好处不言而喻,这不但可以节省记者和编辑的大量劳动,而且可以在应对突发事件时充分体现出计算机的“闪电速度”。
2014年3月17日清晨,仍在梦乡的洛杉矶市居民被轻微的地面晃动惊醒。这是一次震级不大的地震,但因为震源较浅,市民的感受比较明显。地震发生后不到三分钟,《洛杉矶时报》就在网上发布了一则有关这次地震的详细报道,报道不但提及了地震台网观测到的详细数据,还回顾了旧金山区域最近十天的地震观测情况5。
人们在新闻报道的网页上看到了《洛杉矶时报》记者的姓名,但该新闻之所以能够在如此快的时间里发出,完全要归功于可以不眠不休工作的人工智能新闻撰写程序。地震发生的瞬间,计算机就从地震台网的数据接口中获得了有关地震的所有数据,然后飞速生成英文报道全文。刚刚从睡梦中惊醒的记者一睁眼就看到了屏幕上的报道文稿,他快速审阅后用鼠标点击了“发布”按钮。一篇自动生成并由人工复核的新闻稿就这样在第一时间快速面世。
机器视觉
人脸识别,这几乎是目前应用最广泛的一种机器视觉技术,是人工智能大家庭中的重要分支。近年来,随着深度学习技术的发展,人工智能程序对人脸识别的准确率已经超过了人类的平均水平。
很多公司都为员工发放用于出入公司的门禁卡。但在我们的创新工场,没有人佩戴门禁卡。创新工场的大门上装有一个高分辨率的摄像头,员工走近大门的过程里,与摄像头相连的计算机中安装的一套名为Face++的智能软件会实时采集人脸图像并与系统中存储的员工照片进行比对,系统认识的“熟人”可以自由通行,系统不认识的“陌生人”则会被拒之门外。
人脸识别不仅仅可以当保安、当门卫,还可以在手机上保证你的交易安全。不少手机银行在需要验证业务办理人的身份时,会打开手机的前置摄像头,要求你留下面部的实时影像,而智能人脸识别程序会在后台完成你的身份比对操作,确保手机银行程序不会被非法分子盗用。
广义上的机器视觉既包括人脸识别,也包括图像、视频中的各种物体识别、场景识别、地点识别乃至语义理解。所有这些智能算法目前都可以在普通手机应用中找到。

图4 用谷歌照片检索出我在2008年参加奥运火炬接力的瞬间
例如,今天主流的照片管理程序几乎都提供了自动照片分类和检索的功能。其中智能程度最高、功能最强大的非谷歌照片莫属。利用谷歌照片,我可以把我的所有照片和视频——没错,是所有照片和视频,不管是昨天拍摄的晚宴照片,还是十几年前为孩子拍摄的家庭录像——统统上传到云端,不用进行任何手工整理、分类或标注,谷歌照片会自动识别出照片中的每一个人物、动物、建筑、风景、地点,并在我需要时,快速给出正确的检索结果。
利用谷歌照片,我可以轻松找到自己在过去若干年里的每一个精彩瞬间,也可以浏览在过去一年里我都去过哪些著名景点。或者,可以简单输入任何一种动物的名字,比如“海鸥”,看看我以前是不是为海鸥拍过照片。

图5 用谷歌照片检索出所有海鸥照片和视频
AI艺术
2016年夏天,一款名为Prisma的手机绘画程序在大家的朋友圈里流行开来。Prisma并不是用程序凭空作画,而是根据用户指定的一张照片,将照片变成特定风格的画作。
图6中,我将一只在北京近郊拍摄到的猫咪的照片(左上角照片)交给Prisma, Prisma利用先进的人工智能算法理解照片中猫咪身上的每一个色块和每一处边缘,然后将计算机从大量经典画作中学习到的上色技法、笔触技法、干湿画法等应用到这张真实的照片上。