2012年4月2日 星期一

在網路上走過,必留下痕跡:data visualization


現在有愈來愈多人都說自己是視覺系動物,偏好用圖像思考。嚴格說起來,圖像思考是人類的本能吧,畢竟抽象的概念都是人類後來才發展出來的。

杰爾.梭普(Jer Thorp)是溫哥華人,現定居於紐約,他在紐約時報擔任「資料藝術家」(data artist)。這是我第一次聽說有這種職稱。資料藝術家是做什麼的呢?

在這部TEDx演講影片中,梭普分享的主題是Make data more human(讓資料更人性化)。顧名思義,既然科技都能講求人性化,由文字或數字組成的資料當然不能老是冷冰冰的。那麼,要如何讓資料變得人性化呢?其中一個方法就是用具象的視覺來呈現它們(data visualization)。


梭普本來是個artist,後來開始寫電腦程式來創作藝術,於是便接觸到資料轉換的概念。他開始把資料轉換成具象視覺的形式來呈現,例如他曾分析紐約時報一整年文章的內容,把裡面的特定字眼(例如「絕望」和「希望」)的數量用圖形來表示(大約在影片4:48的地方)。

他在演講中所展示的幾組資料圖像,看起來好像沒什麼意義,而他自己也說是for fun。例如,他分析推特貼文,用動態的方式展示人們所寫的「剛抵達夏威夷」的貼文。他也分析全世界每天早上人們互道早安的訊息(大約5:50的地方)。看著地球上此起彼落的資料群,似乎真能感覺到人們很元氣地說著(各種語言的)Good morning(留意這個圖也順便讓我們看到全球各地網路化程度的差異)。

梭普認為這種資料視覺化,是科學、藝術和設計三者的結合。他也利用一種叫做Cascade的程式,分析人們如何與他人分享紐約時報的文章。他所展示的立體圖形看起來很有趣,而且我們必須注意的是,這並不是模擬圖,而是用真實資料做成的。

一旦學會了將資料視覺化的概念,可以玩資料的方式就多了(這裡說的玩,並非戲謔的玩,而是實驗性的玩)。例如,如果iPhone使用者提供自己的定位資料,就有一組mobility data(移動數據)可供分析。除非iPhone使用者關閉定位的功能,否則系統會記錄使用者曾經去過哪些地方,而透過視覺化的過程把定位資料轉換成圖像,使用者就可以在地圖上看到自己如何移動。

當然,若iPhone使用者的定位資料被其他人取得(無論合法或非法),他人當然也就可以知道這位iPhone使用者的行蹤記錄囉。(所以,想搞婚外情的人,跟小三約會的時候務必全程確保自己手機的定位功能是關閉的,不然可能會有不想要的後遺症。另外,由於現在許多人熱中於到處打卡,所以不只自己要小心,還要確保小三的手機也是關掉定位功能的~~)

梭普主張,資料本身是抽象無機的,但我們要致力於將數據資料放在人性的情境之下去解讀,如此一來,人們才會了解資料是有意義的、資料是有隱私性的,而唯有透過這樣的了解,我們才不會失去對人的同理心,才不會在資料分析解讀的過程中,忘記了每份資料的背後其實是一個人的人生。

看過這部影片,有人很讚嘆梭普所發展出的視覺模型,覺得很有趣,甚至想要學習如何寫這樣的程式。另一方面,也有人認為梭普舉的那幾個例子沒什麼意義,只是看起來很炫而已,甚至還有人認為分析這些網路資料有侵犯隱私之嫌。

其實我個人認為這種資料展示的概念有很多的含意。

首先,證實了我之前的想像和懷疑,原來看似無形的網路活動,例如發推特文的行為、分享紐約時報文章的行為,都可以留下記錄,而且真的有人在做這樣的記錄。既然推特和報社網站可以做記錄,理論上所有的網站都可以做記錄。例如現在非常受歡迎的臉書,也可以記錄每個使用者的使用過程。「凡走過必留下痕跡」這件事不只適用在實體世界,也適用在網路世界。世界上沒有什麼是神不知、鬼不覺的。

做成記錄的資料,當然可以用來分析囉。理論上,臉書可以分析使用者的po文內容、按讚的訊息屬性、瀏覽臉書的時間,然後找出使用者的喜好或政黨傾向等等。當然也可以分析臉書朋友之間的連結與互動狀況,作為研究人際關係或人脈的重要參考。

聽說推特的訊息是公開的,所以大家都可以去搜尋、蒐集和分析(實際的技術細節我就不清楚了)。臉書資料不是完全公開的,但如果該公司想要去分析,也完全沒有不可以,只不過它(應該)不會把這些資料賣給別人罷了。其實,分析使用者資料這種事,Google早就在做了,所以我們才會在使用Gmail的時候,頁面上出現為我們量身選定的贊助廣告。

資料的記錄和分析,對行銷也很有幫助。例如理論上,藉由了解人們分享紐約時報文章的過程,報社可以知道文章的訊息流傳得有多快、多廣;訊息的分享是透過哪些管道;網路讀者來自哪些地方;一篇文章通常需要多少時間才會被分享到一定程度的數量。如果再比較不同文章的分享狀況,更可以得知哪些類型的文章比較受歡迎、比較容易被分享……這些對市場研究以及行銷人員來說,都是很值得參考的資料。

其實,以上這些資料分析的活動,早就都在進行了,其本身並不一定需要有資料視覺化的過程,因為那些專業的資料分析人員,早已習慣跟數字文字為伍。費心地把資料化為具體的圖像來呈現,其實對一般大眾的意義比較大。

梭普提醒我們,think about data in human context(在人類的生活情境中思考資料的意義),我想某種程度上是為了不讓冰冷無機的分析工具把資料的豐富意涵剝奪殆盡。

我們每個人在網路上留下無數的足跡,但是到頭來,擁有那些資料以及分析之後做解讀的,卻往往不是我們自己。我們是否應該有權利也有能力去解讀自己創造出的資料?具像化的資料可以幫助我們這種一般大眾解讀資料,並且有機會了解自己的資料是否有被濫用之嫌。

此外,唯有當我們意識到,居然有那麼多的個人資料暴露在網路上,而蒐集個人資料的那一方或許並不是我們原本以為的那些企業,或許我們就會更願意去關心,那些擁有我們的足跡資料的人,是否能尊重我們、對我們有同理心,而不致把這些資料濫用在商業或甚至犯罪的行為上。

data visualization的功用還有待發掘,而看起來data artist是一種必須兼具科學和人文精神的職業。

演講者梭普除了任職於紐約時報之外,也在紐約大學(NYU)開課。

沒有留言:

張貼留言