大數據時代的商機與挑戰

瀏覽數:10061


  你知道去年度美國最受歡迎的派是哪種口味的派嗎?答案是蘋果派;那麼你知道明年中秋節花蓮晴天的機率大約有多高嗎?答案是70%。接下來你可能會問,這是猜的嗎?不,這些不是用猜的,而是用“算”的,用大數據(big data)算的。
  過去人類從石板,泥塊、獸皮記錄資訊,隨後進步到以竹簡、絲綢為主,但因為造價昂貴,知識與資訊是少數貴族才能擁有的奢侈品,直到中國發明造紙術傳至西方,並於西元1270年左右在義大利出現造紙場,為後來的文藝復興時代及知識傳遞提供了良好的媒介。而進入資訊時代後,儲存資訊的方式又有了翻天覆地的變化,1950年代IBM350型號的硬碟僅能儲存4.4mb 的資料,約等於1990年代常見光碟片的百分之一,這個容量改變的過程,以人類歷史的規模而言,幾乎是微不足道,等同於一個嬰兒成長到中年而已,因此我們可以預見在未來必將會有體積更小,容量更多的儲存設備,而這也就意味著,未來的下一代比起我們將必須處理更龐大、更詳細、也更精確的資料,從而迎來大數據的時代,事實上,這個時代早已經由GOOGLE,APPLE,AMAZON 等國際大廠拉起序幕了。

 

  全球最知名的管顧公司McKinsey & Company(麥肯錫)於2011年對大數據出了一份《大數據:創新、競爭和生產力的下一個前沿》的報告,報告指出,企業若能有效運用大數據,就能提高企業的利潤達60%以上;此外報告中也以美國醫療行業舉例,說明導入大數據後美國健康照護系統將可降低約8%的成本,能夠一年節省 3,000 億美金,也就是平均每個美國人一年可以節省 1,000 美元;而歐盟若能採用此技術,則可節省1,490億美元,報告的結論說明大數據對人類的經濟活動與政策擬定都具有深遠的影響。

  那麼何謂大數據(Big data)?,根據IBM公司的定義,大數據具有《巨量》《即時性》《多樣性》等三個特徵,藉此分析者可以預測未來的趨勢,以便擬訂出相關對策。首先最直觀的特徵是巨量,大數據的組成是由上萬乃至於上千萬筆資料組成,儲存的位元組以兆為單位來計算,這些資料包含所有你能想像的到的各種生活細節,從住家附近的車流量到今天的天氣數據,甚至到你習慣的坐姿、購物習慣等等,而這些資料必須在發生第一時間就能傳給分析人員,確保資料的來源是正確且符合事實的,此稱為即時性,最後,資料的樣式不限於文字,他可以聲音、圖片、影像、座標、流量都可以是資料分析的素材,亦即其具有多樣性。

 

  上述分析資料要能夠從分析對象進到分析人員的電腦,進而變成桌上的報告,都必須包含收集、儲存、處理、分析、服務等五個步驟。所謂的分析對象,在企業行銷的數據分析上通常指的就是人,因為一切消費的發生都來自於人,當然在服務需求越來越精細的今天,跟人有關的一切事物都是數據蒐集的目標,事實上,根據美國彭博新聞所整理十大與大數據息息相關的生活行為來看,這些數據的蒐集早已透過各種管道悄悄入侵你的生活,包含了傳統郵件(美國郵政已經合法將所有紙本郵件數位化建檔,並送往情報資料庫) 、駕駛習慣(透過你的導航裝置與車載軟體收集你的開車資料,包括剎車、引擎等使用過的數據)、員工識別證(不僅僅是監控你的郵件或上班用聊天軟體的內容,現在可以記錄你進出辦公室的行為模式,並採用軟體分析是否有可疑的行為,避免機密外洩或內線交易)、智慧電表(蒐集你使用家電的習慣,從而可以了解客戶習慣在何時使用何種電器,Google也在規劃在冰箱上置放廣告)、數位醫療記錄(包含疾病感染狀況、各種生活習慣對健康的影響程度等等)、行動地圖(google地圖是最常見的行動地圖,他甚至可以告訴你即時的路況,讓我們避開塞車,但這是怎辦到的呢? 來自數百萬用路人提供的資訊分析而來)、線上購物習慣(各種我們在網路購物時買過的商品都是業者蒐集的資訊,他們可因此設計出更便利的商品促銷吸引我們購買)、音樂串流服務(在網路上按下喜歡或不喜歡某首歌,都意味著服務商可以藉此了解你的族群與品味,下次他們就能推薦你更符合你愛好的音樂給你)、有線電視機上盒(在家看電視的時候,機上盒實際上在收集全家的收視習慣,藉此廠商可以知道你愛什麼,什麼時候看,甚至可以預測什麼內容可以吸引你的眼球,那麼就可以知道何時推出廣告最有效果,事實上廣告商已經透過機上盒挖掘了數以萬計的資訊)運動手環(運動手環可以蒐集運動時的血壓、心跳以及運動習慣,藉此可以知道你通常什麼時候運動、運動多久,以及運動愛好)。

  聽起來,大數據的應用似乎無所不能,但他畢竟是一種分析工具,因此企業在使用時,仍然必須要以分析工具的角度來審視他,並且不可脫離傳統統計學的基本邏輯原則,比方其相關性與因果關係,以避免反而被數據給誤導了。讓我們再次以Google為例子,Google在2008年推出「Google Flu Trends」(簡稱 GFT )這套工具,而建立Google Flu Trends的基礎仍是以google的搜尋引擎為主,研究人員認為在流感爆發前,會有一小段時間是疾病傳染的上升期,這時你會發現生活周遭咳嗽、發燒的人變多了,接著人們開始恐慌,並利用像Google 等搜尋引擎,搜尋疾病或流感的關鍵字,透過分析無數筆匿名的流感關鍵字數據,像是「感冒」、「發燒」等的字眼,即可快速的預測流感將在哪裡爆發以及可能的影響範圍,目前此技術已經在25個國家登錄。

 

圖一、2004-2009年美國流感預估曲線,藍色是Google所預估的曲線,黃色是美國疾病控制與預防中心(CDC)所預測曲線。


  GFT聲勢的最高峰應該是2009年精準的預測了H1N1爆發,然而接下來幾年,GFT卻數次高估了流感病例的數量而造成誤判,發生了什麼事? 英國倫敦大學的研究人員認為,這應該是因為GFT的工程師錯誤的將「搜尋流感關鍵字」與「流感病人數量」兩者定義為因果關係,上兩者可能只有關聯性,而任何一個普通的感冒加上媒體的推波助瀾,即可能造成民眾恐慌與關鍵字的上升,麻省理工學院的Dr. Thomas Malone在《纽约時報》即提到,使用關鍵字作為流感的預判,看起來是個聰明的做法,但如何篩選出正確且具有因果關係的資料,而不是「假規律」或「偽相關」這也是為何 Viktor Mayer-Schönberger 和 Kenneth Cukier在《Big Data》一書中提到:不能拋棄因果關係。事實上若我們僅僅依靠數據,卻不能分辨這些數據的範圍是否真的可信,亦或者把數據與結論的因果關係建立在錯誤的假設上,當然就可能得出與事實誤差甚大的錯誤結論。


  大數據的時代已經開始,未來小到個人的旅遊路線,大至企業的行銷策略,乃至於政府政策的制定,都將在時代的洪流下「以數據說話」,當前的行政院長毛治國上任後,在行政院科技會報辦公室「網路溝通與優化施政規劃」會後,即表示新內閣將利用網際網路執行資料開放及大數據概念,希望可以透過數據「算出」民眾需求來制定政策。大數據的運用,也適用於農業領域。李武忠於聯合報發表的文章《農業大數據,創富新引擎》中指出在國外,也有成功運用在選育種、土壤分析、施肥、用藥、上市、保險等方面。

  而美國農業部也建立了一個可以連結三四八個農業資料庫的網站,根據他的文章指出該網站資料相當齊全,包括:植物基因圖譜、當地天氣變化、特定土壤條件下最好的作物生產條件、降雨量變化、病害蟲和疾病的發生情況、當地市場作物的期望價格等數據。這些數據經過妥善的整理分析,透過即時的資訊傳遞工具,讓農民能隨時掌握所需資訊,例如:天氣的變化、市場供需狀況、農作物生長情形等等,除了能避免因為天然因素所造成的產量不足,也可以避免因市場供需不平衡,帶給農民的經濟損失,以及減少政府每年所支付的農損補助,前景相當可期。未來決定勝負的關鍵將不再僅僅是誰擁有更多的資源或銀彈,而是誰能擁有更多的資訊,並且能夠從一堆雜亂無章的數字中,正確的找出具有發展潛力的商機,藉此將改變我們的生活、工作,和思考的模式。

 

資料來源:
1. James Manyika, ; Michael Chui,; Brad Brown,; Jacques Bughin,; Richard Dobbs,; Charles Roxburgh,; Angela Hung Byers.  May, 2011. “Big Data: The next frontier for innovation, competition, and productivity” MiKinsey Quarterly   
2. Cook, S.; Conrad, C.; Fowlkes, A. L.; Mohebbi, M. H. (2011). Cowling, Benjamin J, ed  “Assessing Google Flu Trends Performance in the United States during the 2009 Influenza Virus A (H1N1) Pandemic” PLoS ONE 6 (8): e23610.
3. Jordan Robertson and Mark Milian., Jun 3, 2014. ”10 Surprising Ways Your Daily Life Is Feeding the Big Data Beast”  bloomberg.com
4. Viktor Mayer-Schonberger,; Kenneth Cukier.  Big Data: A Revolution That Will Transform How We Live, Work and Think.
5. Kenneth Cukier. Jun 2014. TEDSalon Berlin 15:51  Filmed . http://www.ted.com/talks/kenneth_cukier_big_data_is_better_data?language=zh-tw
6. Google Flu Trends  http://share.inside.com.tw/posts/6301
7. 張嘉伶.2014「毛治國祭出科技三箭:開放資料、大數據、群眾外包」.數位時代.
8. 邱莉燕、鄭婷方. 2011 .Big Data大數據正在改變生活.創造新生意. 遠見雜誌1月號
9.  農業革新利器—大數據(Big Data),民報 https://tw.news.yahoo.com/big-data-074019983.html
 

更多資訊請參考...
{{item.title}}
生產力中心提供的活動資訊
{{item.title}}
相關出版品...