技术研究人员需要学会新学术思维,真正从行业应用中洞察大数据的未来趋势。
作为最后一位上台演讲的嘉宾,刘积仁博士开场即幽默地表示,他是从学术界「堕落」到商业。他此次的报告主题是《当数据遇到商业模式》。
在报告中,他从商业应用的视角分享了自己对技术与商业模式融合的思考与实践。
针对大数据的未来发展趋势,他提出如下五点:第一,个人与行业数据的融合;第二,技术与工具的平台化和普及; 第三,纯技术的商业空间更小;第四,大数据的行业应用更有价值;第五,数据+算法+领域知识+商业模式不可分割。
他表示,「技术研究人员需要学会新学术思维,真正从行业应用中洞察大数据的未来趋势。」以下为他的演讲内容。
我的报告主题是《当数据遇到商业模式》,今天在场有很多教授、博士生,还有许多研究人员,我以前在大学担任教授,在学校里做了很多研究,后来「堕落」去了商界。在这些年的历程中,我认为学术研究和社会发展事实上是不可分割的,当进行学术选择时,如果选错了方向,会成为一生的悲哀。
要有新的研究思维
举个例子,说起大数据,大家会谈到存储、速度、算法、算力等,但如果我们不能理解大数据对社会的价值、社会的规则对大数据的约束、商业模式和数据之间的关系、数据的伦理以及获取数据的艺术,那你的研究一定是苍白的,因为你没有办法在丰富的世界里表现出价值。刚才李国杰院士谈到大数据的产值比较低,并不意味着进行这方面研究的人数少,因为我们被很多因素制约。
首先来分析技术的时运,在场进行学术研究的人,一定知道学术研究背后也有运气,人工智能、大数据、超级计算机、智能计算这些都不是新东西。我读研究生时,最火的研究方向是计算机网络、VR、人工智能,也有一部分人从事自然语言理解的研究。
我当年在美国国家标准技术研究院,我们认为未来的网络协议需要支持更安全、复杂、可靠的服务,我们做了很多标准,但一直到今天,TCP 仍然主导网络世界,此前的研究并没有用上。所以当我们进行学术研究时,一定要看到社会发展的趋势,看到未来可能承载你成就的平台,而不能顺着所有人的共识。当所有人都欢呼那个方向就是未来的时候,你最好不要做,因为太晚了。当别人对你想进行的研究持怀疑态度的时候,可能那就是你最好的机会。
在大数据的时代,我们首先要认识到时运来自于什么。大数据时代的研究和我们过去所进行的很多研究的根本不同点在于环境,数字社会支撑了大数据时代,现在计算成本、存储成本、通信成本都越来越便宜,平台越来越丰富,网络实体越来越丰富,我们获取数据的成本也越来越便宜。
但是为什么大数据的应用并不如预期?互联网是个人数据获取的主要渠道,数据是每位用户自发提供的。但是想要进行精准的计算,支持可靠的算法,不仅要有个人需求,还需要来自于组织的数据。
解决问题需要高质量的多源数据与领域知识的结合。谈到数据融合,真正的融合不仅仅在数据层面,有数据与数据的融合,数据与规则的融合,数据与伦理的融合,还有数据与商业模式的融合。数据只有和商业融合在一起,才能形成一种新的模式。我们要超越的不仅仅是对数据的认识,还有对其他行业的认识。
另外,大数据研究的思维方式也在发生变化,在数据利用上,需要有跨越技术的思维。没有高质量的数据,就没有精准的应用技术。但高质量的数据从哪里来,它来源于对解决问题领域的知识的理解。另外,数据利用需要开放合作。
目前还看到一个问题,每个人都倾向于有自己的技术、算法,这样我们的论文就可以与别人不同,但事实上,我们正以更快的速度把算法和技术平台化、免费化。大数据和人工智能算法在未来,一定是充分免费的平台,在这个领域里,几乎没有独立创造商业价值的空间。原因很简单,大数据和人工智能只有在应用中才能得到完善,在解决方案中才能获得价值。
在未来,不管是这个领域的学者,还是正在学习的学生,大数据领域的赢家一定来自思维,一种新学术思维。当你不能构造一种崭新思维的时候,就像我最开始所说,你的时运和这种技术无缘。
大数据有很大的商业空间。其一是个性化与精准的营销,在银行业有客户意见挖掘、高端客户流失预警,媒体行业有热点分析、个性化内容推荐,航空行业有常旅客识别、旅客画像;其二是组织高效运营与风险管控,在金融行业有防欺诈,航空业有防恶意占座、机票价格监测等。这都是各行各业在应用大数据的例子。
在应用大数据的时候,有一个很重要的问题就是伦理问题。这里涉及到隐私、公平、安全、社会价值、开放。在这个领域,如果能够找到技术和伦理的结合点,一定是未来一个很重要的发展领域。数字社会已经覆盖了中国大部分的人口,一个没有文化的数字社会,没有伦理的数字社会,一定是一个不可持续发展的社会。
再看大数据的发展趋势。
首先是个人与行业数据的融合,没有这种融合就没有精准和可靠的应用。
二是技术和工具的平台化、普及化。这是一个大趋势。
三是纯技术的商业空间更小。
四是大数据的行业应用更有价值。
五是数据+算法+领域知识+商业模式不可分割。
现在大数据的价值远远没有被发挥出来,所有的算法、数据只有在应用的过程中才能变得更加成熟。
站在东软的角度对技术进行思考
简单谈一下东软的实践,谈谈我们是怎么想,怎么看待数据的。东软在过去 27 年来致力于推动国民经济基础设施与重要民生领域的信息化水平不断提高,在众多行业拥有领先的市场占有率。下图是我们在中国拥有的数据,我们为 7 亿人提供社会保险服务与支持系统,我们的电力营销系统为 4 亿人支付电费提供服务。拥有这些数据有什么意义?如果不在社会的层面思考这些数据,是没有意义的。我们需要有不同的思考,是超越技术的思考。
以下是我们在健康、医疗领域的数据,医疗要求用复杂的生态系统来实现。当我们谈到大数据,就要谈到健康,谈到健康的时候就会谈到医院。医疗质量、公平、成本、安全,这是大数据在健康、卫生、医疗里要解决的根本问题。
我们首先要有这样的逻辑,在看到这些逻辑的时候,能否在里面找到技术发展的方向,当找到发展方向,我们会构造组织,构造人工智能应用的范围,然后用人工智能技术控制医疗费用支出等等。我们要构造互联网云医院,使得更多的医疗行为从大医院走向基层,我们要实现医疗的公平性,控制不断上涨的医疗费用,实现医疗的分层次服务,建立个人的动态健康与医疗档案,使医疗更加个性化和精准。
数据和 AI 让基层医院更强大,我们可以构建医联体,如下图:
超越技术变成从事技术研究的必须选择,如果我们不了解社会,不了解生态,不了解其他行业,我们怎么能谈数据?
为大家谈谈新信息技术观:
信息技术成为日用品、消费品、生活方式。
信息技术失去了独立性,无所不在,与应用场景相伴。
技术进入平台化、普及、快速传播时代,也是平台、技术、工具免费的时代。
技术的使用者比技术拥有者更知道技术发展的方向。
技术拥有者从专注变成超越。
开放、融合、合作是技术路线的重要组织部分。
技术进步速度加快,不要对自己的技术过于自信,应用与普及是检测技术领先的重要标准。
大数据是新商业的支撑,而只有在开放、融合、创造的环境下,大数据才能拥有价值。传统的教育、科研方式与过去的模式不一样了,而约束它的不是别人,不是这个社会,正是我们自己,我们自己是否能适应这个时代的变化,适应新商业、新零售、新学术、新科研。