數位的社會學:談數位足跡的社會研究

蕭遠/Department of Communication, University of Washington

小時候曾玩過一個叫做「模擬市民」的遊戲,玩家透過在虛擬世界進行不同的選擇,使遊戲角色以不同的方式經歷一生。在遊戲中,人生所有的面向,從生理需求到世俗成就,甚至是飢餓、成就感、金錢等都能以數值化顯現,由玩家進行追蹤。

今日所處的時代,我們不僅是玩家,同時也像是模擬市民本身。日常生活中許多能想到的面向都已電子化,成為我們的「數位足跡」。例如智慧型手錶可以記錄我們的心跳血氧、信用卡紀錄了我們的消費行為、社群網站上打卡紀錄了我們的旅遊與社交。雖然說「數位人生」的概念已行之有年,但人類行為的數位化在近年來急速增長,遠超乎了過往數位人生所能想像的範疇,而此趨勢只會在未來更有甚之。

在社會學當中,數位足跡的資訊爆炸也對於社會學研究產生了深遠影響。在人們使用這些電子媒體的過程中,留下了他們的想法、行動、溝通過程等等。這些紀錄提供了社會學者一個全新的管道來理解社會行為。本文將談談這些數位足跡在社會學的應用,以及使用數位足跡資訊時應留意哪些事項。

多元化的數位足跡應用研究:文字、空間、網絡

數位足跡對人的紀錄相當豐富,社會學者利用數位足跡的方式也相應多樣。本文從三點談數位足跡帶給社會學什麼樣的刺激。當然,數位足跡在社會學的應用相當多元,本文也只能觸及冰山一角。

文字分析:以社群媒體的紀錄為例

自網際網路出現之後,公開的文字撰寫權利就不限於大眾媒體。在網路出現的早期,部落格、網誌就成了一部分人紀錄想法的地方。而在臉書、推特等社群媒體出現之後,公開撰寫的大眾化,又推展到了一個全新的層次。每日有數以百萬計的使用者在他們的社群媒體上紀錄自己的生活、發表對時事的看法、或回應他人的留言。

在社群媒體上的紀錄包含了文字、影像、聲音等不同的面向,但由於影像與聲音在分析上較為困難,以文字分析社群媒體資料的研究仍佔大多數。例如在研究社群媒體對於社會運動的研究中,近年利用文字分析方法的研究漸增。由於使用者中有許多人同時是社運的參與者,透過爬梳使用者對社會運動的描述與互動,社會學者更能理解社運的全貌。例如在美國黑人民權運動中,推特上#BlackLivesMatter 、#AllLivesMatter的文字,就催化了運動參與者以及反對運動者的集體認同(Ray et al. 2017)。只要檢視使用者是用#BlackLivesMatter或#AllLivesMatter的文字,就能推知這個使用者對於運動的立場。同時,可以透過計算#BlackLivesMatter與#AllLivesMatter在推特上的數量,理解社運與反動社運兩者在社群媒體上的較勁強度。再舉一例,在2019年香港反送中運動時,許多網路的使用者都在推特、連登論壇等社群媒體上發表自己對運動的看法。有學者就針對這些文字的內容,去理解使用者的道德標準,例如對關懷、公平、忠誠的看法等,以及如何用這些道德標準去檢視香港警察的暴力行為(Wang and Liu 2021)。簡言之、這些學者透過文字去測量社會學的概念(例如集體認同、道德標準等),而與社會科學的理論進行對話。

空間分析:善用「地點」的紀錄

另一個數位足跡研究的重心,在於利用數位足跡的「地點」資訊抓取空間分佈的社會趨勢。舉例而言,許多社群媒體都有「打卡」的功能,而在打卡的過程中,將使用者確切的位置記錄下來。這種紀錄精確到經緯度的小數點以下第五位,且同時紀錄在幾年幾月幾日幾分幾秒打了卡。換言之,數位足跡不僅有空間的資訊、也有時間的紀錄。當然,不僅社群媒體,手機通話紀錄也有基地台資訊、Email郵件也有IP位址,許多數位足跡都含有對於空間與時間的訊息。學者就透過這些資訊抓取社會的脈動。例如在移民研究中,就有學者透過手機通話位址、Email的IP位址等去測量人群移動的軌跡,進而瞭解哪些地區移民率攀升、而哪些地區移民率下降(Blumenstock 2012; Zagheni and Weber 2012)。

更有潛力的是,學者可以透過地點的資訊,整合數位足跡與非數位足跡的資料。在近期研究中,Kennedy 等人(2021)為了瞭解鄰里的種族分布會不會影響租屋市場,抓取了美國租屋網站Craigslist上大批租屋廣告的資料。由於租屋廣告包含了房屋地點的資訊(特別是郵遞區號),Kennedy等人就透過郵遞區號調閱政府資料,查詢房屋所在的鄰里的種族分布,進而研究這些廣告的文字是否會根據鄰里的種族分布而進行變化。如圖一所示,Kennedy等人發現依照鄰里種族分布的不同,租屋文字著重的面向也不同。在主要種族為非白人的鄰里中(Majority non-White),租屋文字更著重交通的面向。同時,在白人為主的鄰里中,租屋廣告更重視「優質鄰里的魅力」(vintage charm)。換言之,Kennedy等人結合了數位足跡的文字資訊(廣告文字)與空間資訊(房屋的郵遞區號),研究鄰里的種族分布與租屋市場的關聯。

圖一:鄰里種族類別與廣告文字主題關聯分析。來自:Kennedy, Ian, Chris Hess, Amandalynne Paullada, and Sarah Chasins. 2021. “Racialized Discourse in Seattle Rental Ad Texts.” Social Forces 99(4):1432–56.

網絡分析:善用「連結」的紀錄

除了文字與空間之外,數位足跡往往也包含「連結」的資訊。在網站上面,可以用網站之間的超連結,瞭解哪些網站之間有密切合作的關係。在社群媒體上可以知道誰與誰之間是朋友關係,或者誰在誰的下面留言。這些社會連結構成了人們之間的「網絡」,而影響了人的社會行為。

透過網絡分析去瞭解組織與人們如何互相影響的歷史已有數十年(Wasserman and Faust 1994),但過往研究在網絡資訊的範圍通常較小。典型的社會網絡研究大約在數十個單位的人/組織左右,而個數上百的資料就已經算大型研究。但由於數位足跡的興起,現在研究者可以研究上萬個或更多人與人之間的互動連結。例如研究者可以在推特上面追蹤數萬名使用者之間追蹤的關係,以瞭解抗爭的動員範圍是如何漸漸擴散(González-Bailón et al. 2011);亦有學者透過臉書朋友關係建構社會網絡,瞭解大學生的文化偏好與朋友網絡之間的關係(Lewis et al. 2008)。當然,網絡中的人數不見得要成千上萬,數位足跡也可以應用在中型的組織研究中。Hsiao (2021)就抓取了美國Black Lives Matter Sacramento推特帳號的追蹤者,描繪追蹤者之間的追蹤關係,以瞭解線上網絡結構對於政治動員的影響。如圖二所見,研究者可以從推特的數位足跡,拼湊出社會網絡的結構。Hsiao接著進一步透過社會模擬,檢證這種網絡結構在什麼條件下有利於政治動員。

圖二。BLM Sacramento追蹤者之間的追蹤關係。來自:Hsiao, Yuan. 2021. “Evaluating the Mobilization Effect of Online Political Network Structures: A Comparison between the Black Lives Matter Network and Ideal Type Network Configurations.” Social Forces 99(4):1547–74.

資訊爆炸的挑戰:社會學理論與概念指引的重要性

在使用數位足跡的研究中,社會學理論的角色為何?其實進行數位足跡最大的挑戰,在於如何從大量的資訊中抓取有意義的資訊。以文字而言,數位足跡包含了各式各樣的紀錄。大家可以想像自己在社群媒體上所看到的資訊有多麽五花八門。若全部數位足跡的資訊都想分析,那根本不知焦點為何。

這個資訊爆炸問題的根本,是因數位足跡並非為了研究而設計。數位足跡的研究與問卷或訪談研究並不相同。問卷或訪談中,參與者多是根據研究者的問題進行回答,資料與研究問題有較為直接的連結。然而數位足跡只是忠實地紀錄使用者的各種行為。至於要研究哪些行為、哪些想法,是社會學者必須決定的問題。

這個決定的過程,就是社會學理論展現價值的地方。研究者必須根據理論找出重要的概念,再根據這些概念決定怎樣從數位足跡測量這些概念。例如前述的Kennedy 等人 (2021),就是根據鄰里空間種族偏見的相關理論出發,才去尋找租屋網站的郵遞區號資料,藉由郵遞區號去測量鄰里的種族分布。前述的Wang與Liu (2021)在研究香港警察暴力的道德準則時,也是從「道德基礎理論」(Moral Foundations Theory)出發,才知道要從大量的文字當中,攫取與特定道德相關的詞彙。換言之,理論就像是一個篩子,幫助研究者篩選掉大量不必要的資訊。研究者會從理論中找到關鍵的概念,再從關鍵的概念篩選數位足跡相關的資訊進行分析。

研究者自己創造的數位足跡

上述討論的,是利用他人所留下的數位足跡進行分析。但其實有部分學者看到數位足跡的潛能,也主動創造數位足跡。最直接的方式就是利用網路平台讓使用者進行某些研究者想要研究的行為。這種模式可以簡單到利用SurveyMonkey或Qualtrics等平台請使用者填寫問卷,但也可以進行更複雜的設計。例如Salganik等人(2006)為了研究人們對文化的品味有多少程度受到社會評價影響,自己架設了一個音樂網站讓使用者聆聽歌曲並對音樂進行評價。在聽音樂的時候,使用者同時可以看到這個歌曲被其他使用者下載的次數,以知道歌曲受歡迎的程度。透過這種設計,Salganik等人得以測試社會評價對於文化市場的影響力。又如之前提到的道德基礎理論作者群(Graham et al. 2009; Haidt 2012),也同樣創設了網站讓人們填答一系列的問題。使用者可以從網站得知自己的道德基礎並與他人進行比較(有興趣的讀者也可以去該網站填答),而研究者也得到了資料可以進行分析研究。這些例子共通的特性在於這些網站多半十分有趣,甚至具有互動性。使用者與研究者雙方都能夠從參與研究中獲益,是一個利用數位足跡平台創造互惠的趨勢。

上述案例是由學者自己客製化數位平台以進行研究,但另一種自己創造的數位足跡,是研究者與數位足跡平台合作進行使用者社會行為的觀察。其實除了研究者,許多社群媒體的數位平台早有大群自己雇用的研究者進行商業研究,例如透過研究演算法以促進廣告收益等(Grimmelmann 2015)。在某些情況,數位平台也可能貢獻於社會科學研究。例如Bond等人(2012)就與臉書進行合作,進行有關社會影響對於政治行為的研究。他們在美國選舉投票時,讓特定的使用者看到他們的朋友宣稱自己進行了投票,而其他的使用者則沒有看到這樣的訊息。如圖三所示,透過比較兩種不同的使用者,驗證看到朋友進行了投票是否會影響自身投票的意願,而與社會影響的理論進行對話。當然,這種影響使用者行為的研究必須經過嚴謹的研究倫理審查,以確保使用者的利益。

圖三。看見朋友投票的設計(左圖a)與自身投票行為關聯(右圖b)。來自:Bond, Robert M., Christopher J. Fariss, Jason J. Jones, Adam D. I. Kramer, Cameron Marlow, Jaime E. Settle, and James H. Fowler. 2012. “A 61-Million-Person Experiment in Social Influence and Political Mobilization.” Nature 489(7415):295. doi: 10.1038/nature11421.

不論是自己設計數位平台或者與數位平台合作,依舊不可缺少理論的指引,甚至可說理論更加重要。在分析已經存在的數位足跡時,若發現自己研究的理論推演有偏誤,則多半可以再去想想有沒有新的方式或新的數位資料。然而當研究者自己是設計方時,理論與設計的環節必須絲毫無誤,因為設計重來的成本相當高(例如重新尋找參與者、與平台合作的經費等)。故自己設計平台雖然有趣,但更需深思熟慮後再進行。

結語:數位時代的社會學

數位足跡的普遍,給了社會學研究許多創新的機會。學者不但能直接觀察到人類的行為紀錄,而且這些紀錄包含了文字、時間、空間、網絡等多樣的面向。多面向的資訊也能豐富社會學理論,例如將種族關係理論加入空間的層次,或深化社會運動理論的線上網絡結構面向。

臺灣近年也積極推動數位足跡在社會研究的應用。大家最熟知的莫過於疫情期間利用手機實名制追蹤每個人的活動範圍。這充分利用數位足跡的「地點」特性以控管疫情,是數位足跡與公共政策結合的範例。江庭瑋等人(2020)則注意到了智慧型手機紀錄使用者作息習慣、工作型態、與手機使用習慣的潛能,指出利用這些數位足跡介入手機成癮問題的可能性。而在推展數位足跡研究領域方面,江彥生與陳昇瑋(2016)推動的「計算社會學」就展現了數位足跡在社會學深厚的潛力,但同時指出並非每個族群都同等地使用數位平台,因此在使用數位足跡時必須特別考量這樣資料的樣本代表性為何。黃從仁 (2020)更進一步說明數位足跡資料往往具有「大數據」豐沛資料的特性,可以建構更複雜甚至預測性的模型,但同樣指出數位足跡樣本偏誤的可能性。今後如何發揮數位足跡的優勢並減低樣本偏誤問題,進行資料科學與社會學的結合,應是一個可以期待的有趣領域。


參考文獻

Blumenstock, Joshua E. 2012. “Inferring Patterns of Internal Migration from Mobile Phone Call Records: Evidence from Rwanda.” Information Technology for Development 18(2):107–25.

Bond, Robert M., Christopher J. Fariss, Jason J. Jones, Adam D. I. Kramer, Cameron Marlow, Jaime E. Settle, and James H. Fowler. 2012. “A 61-Million-Person Experiment in Social Influence and Political Mobilization.” Nature 489(7415):295. doi: 10.1038/nature11421.

González-Bailón, Sandra, Javier Borge-Holthoefer, Alejandro Rivero, and Yamir Moreno. 2011. “The Dynamics of Protest Recruitment through an Online Network.” Sci. Rep. 197:srep00197. doi: 10.1038/srep00197.

Graham, Jesse, Jonathan Haidt, and Brian A. Nosek. 2009. “Liberals and Conservatives Rely on Different Sets of Moral Foundations.” Journal of Personality and Social Psychology 96(5):1029.

Grimmelmann, James. 2015. “The Law and Ethics of Experiments on Social Media Users.” Colo. Tech. LJ 13:219.

Haidt, Jonathan. 2012. The Righteous Mind: Why Good People Are Divided by Politics and Religion. Knopf Doubleday Publishing Group.

Hsiao, Yuan. 2021. “Evaluating the Mobilization Effect of Online Political Network Structures: A Comparison between the Black Lives Matter Network and Ideal Type Network Configurations.” Social Forces 99(4):1547–74.

Kennedy, Ian, Chris Hess, Amandalynne Paullada, and Sarah Chasins. 2021. “Racialized Discourse in Seattle Rental Ad Texts.” Social Forces 99(4):1432–56.

Lewis, Kevin, Jason Kaufman, Marco Gonzalez, Andreas Wimmer, and Nicholas Christakis. 2008. “Tastes, Ties, and Time: A New Social Network Dataset Using Facebook. Com.” Social Networks 30(4):330–42.

Ray, Rashawn, Melissa Brown, Neil Fraistat, and Edward Summers. 2017. “Ferguson and the Death of Michael Brown on Twitter:# BlackLivesMatter,# TCOT, and the Evolution of Collective Identities.” Ethnic and Racial Studies 40(11):1797–1813.

Salganik, Matthew J., Peter Sheridan Dodds, and Duncan J. Watts. 2006. “Experimental Study of Inequality and Unpredictability in an Artificial Cultural Market.” Science 311(5762):854–56. doi: 10.1126/science.1121066.

Wang, Rong, and Wenlin Liu. 2021. “Moral Framing and Information Virality in Social Movements: A Case Study Of# HongKongPoliceBrutality.” Communication Monographs 1–21.

Wasserman, Stanley, and Katherine Faust. 1994. Social Network Analysis: Methods and Applications. Cambridge University Press.

Zagheni, Emilio, and Ingmar Weber. 2012. “You Are Where You E-Mail: Using e-Mail Data to Estimate International Migration Rates.” Pp. 348–51 in Proceedings of the 4th annual ACM web science conference.

江庭瑋、陳思宇、林煜軒,2020,“從智慧型手機的數位足跡解析人類日常行為: 以手機使用, 睡眠作息和工時型態為例.” 調查研究-方法與應用 (45):43–71.

江彥生、陳昇瑋,2016,“簡介 [計算社會學]: 一個結合電腦與數位科技的新興社會學研究.” Taiwanese Sociology (32):171–201.

黃從仁,2020,“大數據與人工智慧方法在行為與社會科學的應用趨勢.” 調查研究方法與應用 (45):11–42.

發表迴響

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料