背景圖片取自TheDigitalArtistonpixabay

Pew Research Center上周發布一項研究報告,指出數位時代的網路內容並不見得是長存的,指出在2013年到2023年的10年間,有25%的網頁消失了,當中的16%其網域依然存在,只是網頁無法存取,另外的9%是整個網域名稱都失效了。

愈久的內容無法存取的比例愈高,例如2013年的網頁中,到了去年即無法存取的比例高達38%,若是2021年所蒐集的網頁,2023年無法存取的比例則是20%。

Pew Research Center所研究的對象涉及新聞、政府、維基百科(Wikipedia)及Twitter(X)。例如蒐集了來自2,063個新聞網站的50萬個網頁,這些網頁含有逾1,400萬個對外連結,對外連結的中位數為20個,當中有23%個新聞網頁至少含有一個失效連結。

Pew Research Center也蒐集了50萬個美國聯邦、州或地方政府的網頁,這些網頁所含的連結總數為4,200萬個,連結數量的中位數為50個,且高達86%都是連至政府網頁。在這些政府網頁中,有21%至少包含一個失效連結。

在維基百科上Pew Research Center則蒐集了5萬個英文頁面,並檢查參考欄位的連結,有多達82%的維基百科網頁至少含有一個參考連結,整體有超過100萬個參考連結。分析顯示,有53%的維基百科頁面至少含有一個失效的連結,整體而言,維基百科所引用的逾100萬個參考連結中,有11%無法存取。

Pew Research Center亦於今年3月至4月蒐集了Twitter上的近500萬則推文,但在6月15日時,發現有18%的推文不復存在,大多數是因為帳戶被設為私有了、暫停了或是被刪除了,只有少數是特定推文被移除。消失的推文有高達49%為土耳其文,有42%是阿拉伯文,且它們通常是新設的帳戶。

熱門新聞

Advertisement