创新研发

您的位置:主页 > 创新研发 >

尊龙d88腾讯:圈套多多 咱们都被大数据给忽悠了?

时间:2018-09-24编辑: admin 点击率:

  腾讯:圈套多多 咱们都被大数据给忽悠了?

   前不久腾讯举办了一场夏日思享会,其主题是大数据。关于大数据,咱们炒作得更多的是机会、威力,比方说越来越多人使用Google的大数据来研讨趋势,辅佐剖析决议计划,可是这场思享会从另一个视点共享了一个很好的考虑:大数据也可能是大忽悠。

  而最近对Google Flu Trends(流感趋势)的一些研讨正好佐证了这一点。

  提到 Google Flu Trends,首要有必要先提一提Google Trends 和Google Correlate。Google Trends 使用对用户查找的大数据剖析来取得人类某些活动的趋势,只要在 Google Trends 上输入某些查询关键字即可回来相关活动的数据序列。而 Google Correlate 则是输入数据序列可回来一组成果呈相似形式(相关性)的查询,有点相似于 Google Trends 的反函数。

腾讯:咱们都被大数据给忽悠了?

  Google Flu Trends 是 Google Trends 最早也是最闻名的使用之一。鉴于很多人患流感是往往会上 Google 查询了解疾病状况和用药,因而 Google 发现这种查询与流感迸发存在着某种相关联系。Google Trends 从前有过屡次对流感的成功猜测,包含 2011/12 年的美国流感、2007/08 年瑞士流感、2005/06 年德国流感、2007/08 比利时流感等,其及时性乃至要比美国疾病防备控制中心还要高。

  这显现出了查找流感与流感迸发的相关性。尊龙d88

  另一个比如是宿醉。比方说在 Google Trends 输入hangover(宿醉),你会发现这种状况在周六开端冒头,然后周日抵达巅峰,而到了周一则急剧下降。这种形式与输入伏特加的查询成果相似(滞后一天)。

  可是数据越大未必就能带来更高的猜测率。乃至还会带来假规则和伪相关。比方说,查找 2004 至 2012 年间的美国轿车销售与印度饭馆,成果发现二者之间居然存在相关联系。这个东西显然是无法解释的。

  伪相关的原因是什么呢?

  首要,相关性并不意味着因果联系。比方说,Google Flu Trends 对趋势的猜测并非屡试不爽。有几回 Google Trends 就严峻高估了流感病例的数量,包含 2011/12 的美国流感,2008/09 瑞士流感,2008/09 德国流感、2008/09 比利时流感等。

联系我们

CONTACT US

网址:http://www.fenyang8.com

电话:0574-988927231

联系人:尊龙d88总经理

地址:www.d88.com

Copyright © 2017 尊龙d88_www.d88.com_尊龙用现金娱乐一下下载㊣ All Rights Reserved 网站地图