第五章 机遇来临:AI先行的创新与创业(第9/14页)

第二阶段,随着感知技术、传感器和机器人技术的发展,AI会延伸到实体世界,并率先在专业领域、行业应用、生产力端实现线下业务的自动化。

可以感知实体世界信息的传感器和相关的感知技术会越来越成熟,越来越便宜。在线下业务中,计算机系统可以通过物理方式接收线下信息或帮助完成线下操作。这个转变意味着人工智能从线上的“虚拟世界”走进了线下的实体世界。这个阶段,人工智能的商业化会首先从生产力的角度切入,整个世界的生产制造会逐渐被AI渗透。工业机器人、仓储机器人、物流机器人等将在这个阶段实现大范围的普及。

第三阶段,当成本技术进一步成熟时,AI会延伸到个人场景,全面自动化的时代终将到来。

随着技术的日趋成熟,相关的智能产品价格大幅下降,AI终将从企业应用进入个人和家庭。那时,每个人的工作和生活中,大量的应用场景都会因为AI的帮助而更加自动化、更有效率,人类的生活质量终将因AI的普及而大幅提升。这个阶段里,AI商业化的核心目标是创建全面自动化的人类生活方式。

根据汪华的判断,我们目前正在进入AI商业化的第一个阶段,也许只需要3年左右的时间,AI就可以在各种在线业务中得到普及。AI商业化的第二个阶段,要花五六年、六七年的时间才能充分发展起来。而标志着全面自动化的第三阶段,也许需要十几年或更长的时间。

就像过去20年互联网和移动互联网的商业化所走过的历程一样,人工智能的商业化会以自己的节奏,分阶段、分步骤地渗透到人类生产、生活的方方面面。而且,AI对整个社会的改变,可能比过去20年互联网革命所带来的改变要大得多。能否准确把握AI商业化的脉络,是AI时代的创业能否站在“风口”上的关键。

AI创业的五大基石

每个时代的创业有每个时代的特点。人工智能创业就与此前的互联网时代创业、移动互联网时代创业很不相同。

图58 人工智能创业的五大基石

按照我的归纳和总结,人工智能时代的创业有五个前提条件:

·清晰的领域界限:人工智能创业,要解决的领域问题一定要非常清晰,有明确的领域边界,因为这一类问题是今天以深度学习为代表的人工智能算法最善于解决的。例如,同样是做机器人,如果做一个借助视觉传感器更好地规划扫地线路、提高清洁效率的扫地机器人,将机器人的需求限定在一个有限的问题边界内,这样的解决方案就相对靠谱;如果上来就要做一个长得像人一样、可以与人交流的人形机器人,那以今天的技术,做出来的多半不是人工智能,而是“人工智障”。

·闭环的、自动标注的数据:针对要用AI解决的领域问题,最好要在这个领域内,有闭环的、自动标注的数据。例如,基于互联网平台的广告系统可以自动根据用户点击以及后续操作,收集到第一手转化率数据,而这个转化率数据反过来又可以作为关键特征,帮助AI系统进一步学习。这种从应用本身收集数据,再用数据训练模型,用模型提高应用性能的闭环模式更加高效。谷歌、百度等搜索引擎之所以拥有强大的人工智能潜力,就是因为它们的业务,比如搜索和广告本身就是一个闭环的系统,系统内部就可以自动完成数据收集、标注、训练、反馈的全过 程。

·千万级的数据量:今天人工智能的代表算法是深度学习。而深度学习通常要求足够数量的训练数据。一般而言,拥有千万级的数据量是保证深度学习质量的前提。当然,这个“千万级”的定义过于宽泛。事实上,在不同的应用领域,深度学习对数据量的要求也不尽相同。而且,也不能仅看数据记录的个数,还要看每个数据记录的特征维数,特征在相应空间中的分布情况,等等。

·超大规模的计算能力:深度学习在进行模型训练时,对电脑的计算能力有着近乎“痴狂”的渴求。创新工场曾经给一个专注于研发深度学习技术的团队投资了1000万元人民币。结果,团队建设初期才两三个月时间,仅购买深度学习使用的计算服务器就花掉了700多万元。今天,一个典型的深度学习任务,通常都要求在一台或多台安装有4块甚至8块高性能GPU芯片的计算机上运行。涉及图像、视频的深度学习任务,则更是需要数百块、数千块GPU芯片组成的大型计算集群。在安装了大型计算集群的机房内,大量GPU在模型训练期间发出远比普通服务器多数十倍的热量。许多机房的空调系统都不得不重新设计、安装。在一些空调马力不足的机房里,创业团队甚至购买了巨大的冰块来协助降温。