07 AI带来的普惠曙光(第6/8页)

一些全球超级的资产管理公司如Charles Schwab(嘉信)、Fidelity(富达)、Vanguard(先锋投资)以及国际大投行如高盛、JP摩根、瑞银也都在通过投资并购或自建平台的方式进入智能投顾领域。

投资牌桌上的大玩家,正在金融领域的智能革命到来前纷纷醒来。未来,能与之竞合的,恐怕也只有人工智能技术实力雄厚,又掌握海量数据的科技巨头了。

数据挖掘:智能投资的钥匙

2016年11月,美国总统大选激战正酣。与此同时,投资市场另一场大战也正在上演。

瑞信的分析师们观察到,管理资产规模约3300亿美元,量化兼具多空策略的CTA(期货投资)基金正逐渐转向空头,针对美股的空仓仓位飙升到近期的最高水平。而另一方面,管理资产规模超过2150亿美元的多空股票基金,针对美股的多仓仓位则创下9个月来的新高。

对峙双方大部分的投资交易都是在计算机的帮助下,通过算法和模型来进行的。于是媒体将其定义为“机器人大战”。

由于量化投资的大部分交易是由计算机完成,也使用各种模型和算法,很多人将其理解为人工智能对投资市场的干预。但实际上,量化投资只是利用计算机强大的计算能力寻找市场上的无风险套利机会(Arbitrage),只能算交易策略范畴,大多与人工智能并无关系。

而真正的智能投资依然是基于数据驱动的。无论算法怎么迭代,怎么有创意,也不论逻辑关系设计得多巧妙,有了金融算法模型,还必须有大量的符合模型需求的经济、社会、特定行业变化等多维度的数据集,来验证算法模型的可行性和精准度。

可见,一个开放性的大数据环境对智能投资,或者金融信息分析都至关重要。因为从物理世界中获取数字化数据的成本极高,很多公司又没有自己的大数据资源,智能投资分析与决策就无从谈起。

百度、谷歌拥有的搜索数据、地图数据等庞大、多维、立体的大数据资源,有别于传统金融体系的数据,为互联网视角下金融数据特征的挖掘提供了丰厚的资源。加上领先的人工智能技术,给了搜索引擎类公司切入金融投资领域最佳的禀赋资源。

有了资源,也就有了“挖矿者”。搜索大数据中的炼金过程一般是这样的:通常,确定数据源后,依托成熟的大数据技术可对全网数据进行高速整合,提升数据运转效率,同时保持网络数据信息的完整性,进而运用先进的机器学习、人工智能、大数据分析等技术,对海量数据进行分析处理,挖掘金融资产的个性化特征。

例如,百度日均产生跟股票名称或股票代码直接关联的搜索量约2000万次,一只股票的搜索量和其股价走势往往呈现高度的正相关性,平均相关性达0.7以上,搜索量作为量价的补充信息,代表了某只股票被投资者关注的程度,辅助以舆情因子的判断,可以被当作潜在买家/卖家的能量积蓄,用来判断何时入场,什么时候又该进行风险规避。

搜索数据能潜藏宝贵的投资决策金矿,是因为人们在主动搜索时一般是不会说谎的。

如果搜索是主观意图数据的体现,那么,在数据足够丰富的情况下,就可挖掘提炼出人群对信息的潜在需求和关注程度。A股特殊的投资者结构(散户居多)和运行特点(习惯炒作)使得搜索数据成为绝佳的观测维度。因此,搜索数据辅助大盘选择时,能够有效地观测市场变化。

搜索数据还可以进一步挖掘和提炼,比如,现在百度地图已经在全国标注了3000多个工业园区和4000多个商业区,通过观测这些工业园区和商业区,可以有效洞察一个地区、一个商业中心、一个景点,甚至一个城市的人流量变化情况。

智能系统甚至可以以机器学习的方式,提炼某一企业的知识图谱,并实时自动更新。

因而在丰富的时空数据下,投资方能以更广、更及时的视角实时监测所投资企业的开工率变化,并得到及时的投资决策参考。

传统的金融逻辑、投资逻辑、资管能力,加上相关性很强的实时数据,无疑会大大提高投资判断的准确度和前瞻性。

在金融领域,每提升一个百分点的效率,降低一个百分点的风险,都意味着巨大的财富收益。

图7-3 百度收益型量化策略与中证500收益型量化策略的收益率对比

智能金融的三层境界

当然,市场需要我们永远保持敬畏,它的复杂多变远超出人的想象,为了理解这个市场,天才虽然创造了相对简约完美的模型,去抽象理解我们面对的金融世界,但是,在模型简约化的过程中,必然会损失一些东西。而且这些模型相对来说还是静态的,随着时间的推进,过去可用的模型也可能逐渐变得不再那么精准了。在伦敦咨询机构Preqin的研究中,典型的系统化基金的收益并没有比人工操作的基金效益好。