大数据计算模式有哪些,大数据计算框架有哪些

首页 > 影视动漫 > 作者:YD1662023-10-26 05:47:58

在未来演算机的运行过程中存在一系列现实问题,不过AI技术的进一步发展、以及新商业模式的涌现,使得这一系列现实问题有了解决的可能。关键是,我们如何利用好这些最新的技术及商业模式,对未来演算机进行系统升级,让它更好地为我们服务。接下来,笔者将对这台未来演算机进行拆解,从四个环节来分析如何在技术升级中践行向善的价值观。

创造共赢的数据输入模式:创造利益共享的数据供给模式,让数据的生产者——普通民众能即时分享利益,形成良性的大数据生活服务生态。

设计走出黑箱的AI算法:用知识图谱重构演算机预测模型,打破AI的黑箱效应,让预测结果能被用户所理解,从而做出更高水平的生活决策。

提升算力以提供实时反馈:通过软硬件的升级获得更强的实时数据处理能力,适应某些需要即时反馈的生活服务场景。

整合“数据孤岛”形成合力:通过技术和政策手段,打通互不相连的数据源,提升生活服务业的整体运营效率。

▍输入数据——用共赢的商业模式共享大数据

数据输入是未来演算机服务于日常生活的第一步,但数据应用中的乱象让人们开始对各种APP的数据收集行为产生反感。2016年中国社会科学院新闻与传播研究所发布的《新媒体蓝皮书:中国新媒体发展报告》显示,42.9%的受访者对大数据应用有所不满。

人们反感企业大量收集个人数据,除了对数据安全的担忧,很大程度上是因为企业没有解决民众的真正痛点。用户的确获得了便利,但与企业获得的收益相比却微不足道。如果有一天电商app不再“猜我喜欢”,至少对笔者来说没有多大影响,但对于平台来说,销售收入可能会减少1/3。

只有企业立足于民众切身需求,实现和民众的共赢,才是可持续的良性商业模式。目前,在涉及健康数据的医疗、保险服务等领域已经有了一些可供参考的模式。

美国保险巨头John Hancock通过收集用户健康数据,将保险与健康管理结合在一起,实现了企业和用户的共赢。作为美国十大人寿保险公司之一,John hancock在2018年9月宣布停止承保传统寿险,转而销售基于可穿戴设备、跟踪健身和健康数据的互动式新型保险。

这种新形态的保单会与可穿戴装置结合,通过App来给投保人设定个性化健康目标。保险公司会根据搜集到的数据,以及顾客设定的健康目标、生活方式,来调整保费或给予折扣。用最简单的话来说,就是如果你多锻炼、不吸烟、定期体检,就会获得最高25%的保费减免。

▼ 越来越普及的健康穿戴设备(来源:全景网)

大数据计算模式有哪些,大数据计算框架有哪些(5)

活得健康长寿是投保人和保险公司的共同目标,在新模式下,投保人收获了更健康的生活方式,日常运动量比普通人提高了34%,住院费用却比普通人低30%左右。而用户生存时间越长,保险公司就越能长时间持有客户保费。这种模式吸引了大量用户,2016-2019年间,使用该计划进行健康数据跟踪的人数增加了700%。

除了John Hancock这种将大数据与生活服务结合的企业,还出现了一些“数据中间商”,例如美国最大的病友互助社区平台Patients Like Me,它将收集的病情、治疗信息进行量化,成为了病人的数据共享平台,药企的研发助手。

平台的前身成立于2004年,是一个针对罕见病“渐冻人症”的交流小组。如今平台上注册用户已经超过83万,涵盖了2900多种疾病。病人在此分享他们的病情、治疗史、药物副作用等信息。平台将这些原始信息数据化,并对其进行分析和可视化处理。然后经用户同意,将处理后的数据出售给研究机构和药物公司,用于疾病研究和药物研发,平台以此营利并为患者提供更加完善的服务。

对于病人而言,他可以在这个Patients Like Me平台上看到其他病人完整的健康记录,比如服用某种药两年以上的病例,或者每日服用4毫克该药物的病例,然后利用这些信息来辅助治疗。对于药企而言,平台为其提供了珍贵的临床数据。

目前,平台与默克、阿斯利康等大型药企展开研发合作,具体领域包括呼吸系统疾病、狼疮、糖尿病和肿瘤。2015年,平台甚至与美国食品药物管理局(FDA)达成合作,协助监测药物上市后的不良反应。而Patients Like Me之所以能与FDA合作,是因为它在收集数据时使用了与FDA的不良事件报告(AER)相同的编码框架。

Patients Like Me将患者数据结构化、标准化为医学级别证据,让它不同于传统的病人互助社区,为医疗健康服务开辟了一条全新赛道。正如Patients Like Me的研究主管维克斯(Paul Wicks)所言,“量化的资讯,才是我们要做的”。

▍设计算法——用知识图谱打开算法黑箱

对“数据辅助生活决策”来说,最大的难题并非算法本身,而是运算过程中的“算法黑箱”问题。也就是说,算法的运算机制就像一个黑箱,如何运作并不为人所知。比如在美国大选中,数据分析公司利用facebook的数据,预测选民动向,向持摇摆立场的选民投放偏向性内容。

如果通过数据分析发现喜欢乡村音乐的人更支持共和党,那么共和党人就会更关注这些喜欢乡村音乐的人,向他们投放偏向性内容。但是为什么喜欢乡村音乐的人更支持共和党,算法本身无法回答。

虽然在很多情况下,我们并不需要考虑“为什么”的问题,但在一些注重逻辑性的生活服务领域,一个没有给出理由的结论很难让人信服,我们不但要知其然,更要知其所以然。2018年,AI Now Institute发布的一份报告甚至建议,负责司法、社会福利以及教育的公共机构应该避免使用算法技术。可见,算法的不可解释性正在演变成阻碍其应用的关键因素。

所以,我们需要运用知识图谱技术提升算法的解释性,打造一个“负责任”的演算机。知识图谱技术类似于人类的思考过程,可以大大提升未来演算机的解释性。

Google在2012年提出知识图谱的概念,这是一种用图模型来描述知识的技术方法。如下图所示,每个节点代表现实世界中的某个实体,它们之间的连线上标记的是实体间的关系。它以人类对世界认知的角度,阐述世间万物之间的关系,把知识信息结构化,以便机器计算、存储、查询,起到赋予机器人类智慧的效果。

▼知识图谱

大数据计算模式有哪些,大数据计算框架有哪些(6)

未来,在那些看重逻辑性的生活服务领域,知识图谱将发挥关键作用。法律行业为例,一些法律服务公司正通过数据挖掘预测诉讼的结果。Lex Machina软件通过学习大量判决书,可以根据法官以往的判例来预测他倾向于支持哪一方,或者基于对方律师过去的法庭表现来制定相应的辩护策略。

▼ 未来,法律行业将是大数据与人工智能被引入的重点行业(来源:Wikipedia)

大数据计算模式有哪些,大数据计算框架有哪些(7)

在我国,上海的206系统也实现了这一功能。2017年2月6日,中央政法委交办给上海一项重大任务——研发刑事案件智能辅助办案系统。在庭审中,法官会将系统预测结果作为参考来辅助决策。

最高法院司改办规划处处长何帆曾公开介绍,法官可以在判决前把写好的判决书放入系统,系统会将其与类似判例进行比较,找出其中的分歧点。目前,206系统在上海市一线办案人员中的使用率已经达到了100%,全国已有多个省市开展了206系统的应用试点工作。

这种“类案同判”功能的实现离不开法律知识图谱的构建,图谱的颗粒化程度越高,案件结果预测也就越准确。而知识图谱构建的核心是将案件解构为不同层级要素,让机器能够模拟法律人的真实思考逻辑,这要求开发者拥有非常深厚的专业知识和对业务的深刻理解。上海206系统工程就是采用全国法院“众筹”的模式,在众多法律工作者的协同下才完成了知识图谱的绘制。

未来,知识图谱将覆盖更多生活服务场景,将为人类提供透明的、可理解的机器外脑,引导我们做出更明智的生活决策。

▍提升算力——开发实时计算引擎,获得零延迟反馈

升级未来演算机的第三个环节是提升算力,也就是数据的处理能力。只有快速处理海量数据,才能及时给出反馈,协助人做出更明智的决策。

在某些生活场景中,反馈的实时性尤为重要。自动驾驶就是一个非常典型的场景,在危险情况下,车辆制动响应时间关系到乘客安全,制动反应时间不仅是指车辆控制的时间,还包括自动驾驶系统的响应时间,如果要使汽车在100千米的时速下实现不超过30m的制动距离,那么系统整体响应时间不能超过0.1秒。可见,数据也有时效,一旦错过,数据就失去了意义。

▼ 自动驾驶对数据的0延迟要求是刚性的

大数据计算模式有哪些,大数据计算框架有哪些(8)

上一页123下一页

栏目热文

文档排行

本站推荐

Copyright © 2018 - 2021 www.yd166.com., All Rights Reserved.