圖一:「Coronavirus(冠狀病毒)」的搜尋趨勢圖,
地區:全球,時間:2019/12/1~2020/6/8。來源:Google trend
至6/8止,全球至少有680萬人確診,死亡率接近6%[1],每日的新病例還在增加中,而台灣的確診人數只有443人,政府的防疫措施和每個人的自我管理都功不可沒。台灣在4/12被DEEP KNOWLEDGE GROUP[3]排名為全球最安全的國家第7名,而5/12安全地區掉到第16名(國旗順便消失了),因為評分標準包含隔離、監控、醫療、社區檢驗等,有些項目台灣不需要做或是疫情爆發前就做完了,所以排名沒有預期高。
圖二:2020年4月和5月COVID-19安全國家(地區)排名。
左圖來源富比士[2],右圖來源DEEP KNOWLEDGE GROUP
台灣到底做了什麼讓世界認識我們?
4/1捐贈1000萬片醫療用口罩給全世界
4/10再捐600萬片口罩
4/14以「WHO can help? Taiwan」為標題,買下紐約時報的全版廣告,還有做了宣傳的網站[4]
4/27開放民眾捐口罩,至6/8為止,已有66萬人共捐出500萬片口罩[5]
6/1公開2支防疫用APP,供各國政府使用、開放部分口罩外銷
做了這麼多努力,相信各位也看過各國稱讚台灣防疫的新聞,接下來就用數據告訴你,Can Taiwan be seen?
分析概述
網路爬國外新聞及社群網站討論,依時間繪出統計圖表,利用文字探勘技術,分析新聞報導及社群討論的重點、相關議題,資料以2020/1/31作為區分,比較疫情前後的差異。註:從圖一看出1/31差不多是疫情爆發網路聲量的第一個高點,防疫的訊息開始增加。
一、New York Times
數據:利用NYT's APIs[6]爬了New York Times、AP NEWS、Reuters有關台灣的新聞,只要內文或標題有提到都抓下來,雖然這些網站都有報導全球新聞,但多數是美國企業,所以以下分析結論多少都偏向美國一些,時間為2019/1/1~2020/6/8,共有1002篇新聞數據。
1. 首先簡單畫出各月份有關台灣的新聞數量圖
圖三:2019/1/1~2020/6/1有關Taiwan的新聞篇數
從圖三可看出從2月開始,內文有提到台灣的篇數上升很多,甚至6月只過了8天,就有60篇了,用T-Test檢定也得到顯著的提升,1月篇數多是因為總統大選的關係,那麼這些新聞都在寫什麼,先從分類看起。
2. 原始資料的分類太籠統了,所以這裡用Aylien Text Analysis[7]對每篇新聞的內容分類,共有392個類別,詳情參考iab-qag [8],每篇可能包含多種分類,繪製圓餅圖後觀察各個類別的多寡。(Google NLP也有提供類似的功能,但分的比較細,這裡不適用)
圖四:新聞分類之圓餅圖,各有約33%的其他類別,為了方便檢視就隱藏了。
(a)為2019/1/1~2020/1/31,共有612篇新聞,(b)為2020/2/1~2020/6/8,共有390篇新聞
圖四(a)得知Law, Gov’t & Politics(法律,政府與政治)與U.S. Government Resources(美國政府事務)就佔了一半以上,接著是旅遊及飲食主題,而到圖四(b)時,平均每天的新聞篇數增加到2倍,Health & Fitness(健康與健身)與Cold & Flu(感冒和流感)的比例大幅上升,Sport(體育)平均每天篇數約增加到3.3倍,一部分的原因是中華職棒是今年全世界最早開打的職業棒球,甚至還請英文主播播報給外國看,文中包含baseball的新聞2019/1/1~2020/1/31只有12篇,而2020/2/1~2020/6/8就有20篇,似乎可以理解為台灣是疫情相對穩定的地區。這兩張圖說明,確實有因冠狀病毒防疫,而讓世界認識台灣這個地方。
3. 繼續了解這些新聞都寫些什麼,其實有很多只是內文有點到台灣而已,並不是以台灣作為主題撰寫新聞,所以這裡的做法是篩選出標題或摘要包含Taiwan的新聞,選取「標題」與「摘要」,統計各個字出現的頻率,最後用文字雲呈現重點。
圖五:新聞標題與摘要的文字雲。
(a)為2019/1/1~2020/1/31,(b)為2020/2/1~2020/6/8
圖五(a)的關鍵字都圍繞著政治,包含china(中國)、beijing(北京)、hong kong(香港)、president(總統)等,呼應圖四(a)的政治類別。到了圖五(b)的關鍵字,儘管冠狀病毒相關的議題增加了,但還是與中國、北京充滿連帶關係。
4. 另一個有意思的主題是情緒分析,看看這些作者撰寫內文的態度是正面,負面或中立的,這裡使用的是Google NLP Analyzing Sentiment[9]。
圖六:摘要包含Taiwan的新聞內文情感分析,紅線為所有紐約時報的平均分數
分數0代表中立,1代表正面,-1代表負面情緒,點的大小表示情感內容的多少,其中負面情感包含生氣和悲傷。圖六中,幾乎所有文章的情感分數都低於所有新聞的平均分數,這些新聞作者都帶著負面情緒在寫的,相當慘烈,即使在防疫期間也只好一點點,約上升0.14分,或許是因為政治主題的因素,畢竟這種類型的文章大多是負面消息,很難用正面的情緒撰寫。
二、社群討論:Facebook
數據:利用Qsearch API[10]查詢美國2019/1/1~2020/6/8有關Taiwan的Facebook發文篇數,包含留言、按讚、分享數量,共有528篇發文。
圖七:Facebook有關Taiwan的發文篇數,2019/1/1~2020/6/8
圖八:Facebook有關Taiwan的發文按讚、分享、留言數,2019/1/1~2020/6/8
在圖七中發現,發文數量並無明顯提升,但圖八就不一樣了,從3月開始,按讚、分享、留言數明顯提升,最高點發生在4/14,就是在紐約時報刊登廣告的那天,有同性婚姻議題的一半熱度,遺憾的是這些國際話題熱度下降很快,並沒有後續議題,也許網路世界就是這樣。
總結
回到標題,新冠肺炎防疫有讓台灣被看見嗎?根據圖三到圖八,可以說至少有讓台灣這個詞曝光在世界上,有更多的新聞提到台灣,新聞提到的不再只是單純政治話題,我們的醫療水準有被看到,對台灣的評價也有正向提升,對世界的防疫援助,也得到各國的肯定,因此在社群網站中發布許多感謝文,很多民眾也願意按讚與分享,讓世界知道了Taiwan Can Help,有了這樣的成效,要怎麼讓各國的好感轉為實質利益,別讓熱度消失,什麼時候能讓台灣被認識不是因為政治,政府與民間組織的下一步才是重點。
【參考資料】
- Google news(2020.6.8)
- Margaretta Colangelo, (2020), Deep Analysis Of Global Pandemic Data Reveals Important Insights(2020.6.4)
- DEEP KNOWLEDGE GROUP COVID-19 Analytics(2020.6.4)
- Taiwan Can Help(2020.6.8)
- TaiwanCanHelp – 響應口罩世界互助(2020.6.9)
- The New York Times Developer Network - All the APIs Fit to Post(2020.6.8)
- QUANTEXA (2020.6.9)
- Google Cloud natural languageAnalyzing Sentiment
- Qsearch API Service(2020.6.8)