数据看世界

  • 古诗词鉴赏古诗词鉴赏
  • 读后感
  • 2024-08-06 11:01:34

图书作者与内容简介

麦尔荀伯格和库基耶二人皆为大数据领域中的权威,前者是牛津大学网路研究所教授,也是微软等大公司的顾问;后者是《经济学人》杂志资料编辑,在大数据领域是巨擘级的思潮评论员。本书介绍在"数位革命"之后所衍生出的强大处理能力----"资料革命",对每日的生活、竞争的社会及经济、甚至是医疗及科学带来那些影响,并带给读者一个全新的视野去观察我们周遭的人事时物。

我的观点

2数据看世界

身为普通高中学生的我,每天在搭乘大众交通工具前往学校的路途上,发现因为网路的便捷及智慧型手机的成熟发展,现今社会每个人几乎人手一机;视线一转,再看到公车上的电子看板设备,提供大量的资料及即时讯息给搭乘大众交通工具的民众。生活中每分每秒都有大量资料被产生,不禁让我产生一个想法:这些大量的资料可以为我,或者是我们做些什么呢?甚至进而会如何改变你我的生活?

  早在公元前三千年就有记帐本,纪录着每一笔的交易资料,这是早期简易产生资料的方式。到了公元十四世纪,义大利产生了复式簿记,藉由分开借方和贷方,并计算各自总和来看是否有损益,这样的资料产生是为满足商人所在意的商业营亏问题,也可以初步看出资料的用途及人类如何使用资料来理解问题并解决问题。

  然而,复式簿记的资料量并未太大,能窥见及处理的问题有限,如果资料量变大呢?资料是否能跃出解决商人盈亏问题的单一功性,而具有发掘未知现象并诠释完整事件的多功性?莫锐,一位美国海军军官,1839年,由于马车失事的意外,导致原本前程光明似锦的他,之后只能枯坐办公桌前并担任海图仪器保管站站长。虽然莫锐深知只靠老船长口语相传的航海知识并未完全正确,但无法在驰骋蓝海之上的他,也只能利用保管站长的职务,纵览无数前人留下的航海书、航海日志等航海资料。最后他汇集整合了所有资料,以每经纬度五度为分区,根据记录日期、时间、风向等推测海洋自然环境的变化。为了提高精准,他更邀请各国的水手加入"累积大海自然现象资料"的活动,并确实留下相关资料记录,以供他验证所推测海洋自然现象是否正确。在累积了一百二十万个资料点之后,隆重出版的《海洋自然地理学》正是莫锐的权威着作。其后,年轻的水手也不用再修正老一辈的错误见解在茫茫大海中摸黑前进!这就是大量资料被人类重视的多功性及重要性。

  从莫锐的经验来看,正符合现代资料"样本=母体"的概念。改变以往的随机抽样法,以最完整的资料量为前提,一方面记录时间,另一方面又同时记录地点、洋流、风向…等,庞大、杂乱、却也潜藏真实的资料。在身处于没有电脑可协助处理的」莫锐」时代,那是多么可怕工作量啊!然而对比莫锐,反观现今的我们,资料处理的科技相当发达及进步,更容易处理比莫锐更为庞大百倍、甚是千倍的资料量,但现代庞大的资料却导致更多的杂乱及不确定性,巨量资料让我们从精确走向可能性(相关性),因为我们深知:"资料量越多,越不可能精确"。不是不重视精确,而是在大部分的生活事件,并未像科学证明一样的强调因果论,再者,相关性是从巨量资料较便宜、快速可以取得的趋势资讯。

  当我正在思索着巨量资料的应用时,看看公车上使用手机的人,想到如果能记录且使用手机的资料(资料废弃),必能获得大量的资料可供分析。在现代便捷的网路环境中,谷歌可说是巨量资料中的佼佼者,原因在于它拥有庞大的资料量并可让使用者从资料中学习。以前我常在谷歌搜寻国文的字义,久而久之,每当我在寻找字义时,第一则跳出的总是我平常所搜寻的教育部辞典。不仅如此,谷歌的拼字检查系统,不是用大量的人文学者去创造发展的;相反的,是藉由使用者在谷歌所搜寻的庞大资料量去做校对及修正而得到的,这便是我们去跟巨量资料学习、充分应用巨量资料的最佳事例。

  现今,巨量资料的应用更不只于如此一事例。Coursera线上教学公司,藉由学生线上学习所产生的废弃资料,也就是他们所最爱重拨的片段,让老师即可清楚明了学生哪里需要加强; Decide.com公司,一心想成为数亿种消费产品的价格预测引擎,在2011年分析250亿笔资料,发现在新产品推出时,旧产品并不像我们所认知的价格下降,而是会有一段短期价格上涨的现象。手机app程序Foursquare,藉由大家提供所在位置,不仅提供附近地的优惠方案,更可以看出整体趋势。大家广泛使用的位置资讯,可使我们扬弃以人力到现场去测量车流量的方法,就能分析道路上是否塞车。以上诸多事例正说明巨量资料有多实用,且现今时代可充分使用巨量资料的人应便是掌握这个"资料时代"的赢家!

  以往的我们都是从经验中学习,而身在二十一世纪的我们,"资料化"过往的经验及事件、加上拥有强大的处理系统、佐以"正确的使用"巨量资料的方法,不仅可以预测、通知,更能提前改变未来世界!