日報

挑戰網絡審查?Firefox擴展程式“No More 404s”將幫你打開消失網頁

刊登於 2016-08-09

Firefox可能會用網頁緩存代替404。
Firefox 開展新項目,將用網頁存檔代替消失的網頁。

由於網絡審查等多種原因,總有一些網頁會在發布一段時間後離奇消失,內地網民將這種現象戲謔為「手慢無」。儘管各大搜索引擎都提供頁庫存檔(Web Cache),以便用戶查詢失效網頁內容,但這種方法並不直接,而且能否找到存檔取決於搜索關鍵詞的準確度。

為解決用戶這一困擾,Mozilla 公司的開源網頁瀏覽器 Firefox 近日在其測試平台 Test Pilot 上啟動了名為“No More 404s”的新項目,計劃推出一個瀏覽器擴展程式,讓已無法訪問網頁的存檔內容直接替代其失效鏈接,方便 Firefox 瀏覽器用戶查看。

對上網時遇到死衚衕感到厭煩?當某個網頁消失時,我們會嘗試給你一份存檔。

Firefox 測試項目“No More 404s”導語

RFC 2616 規範定義用以表示網頁伺服器 HTTP(超文本傳輸協定)響應狀態的 HTTP 狀態碼由3位數字組成,最常見的包括“403 Forbidden”、“404 Not Found”等錯誤訊息。

其中,“404 Not Found”代表客戶端在瀏覽網頁時,伺服器無法正常提供訊息或無法回應且不知原因,404 錯誤訊息通常是在目標頁面被更改或移除之後出現。

Firefox 正在測試的“No More 404s”擴展功能可以讓其用戶訪問已經存檔的內容,這些內容由非營利組織互聯網檔案館(Internet Archive)的存有近5000億網頁的 Wayback Machine 提供。不過,該擴展程序不適用於在 Wayback Machine 上沒有存檔的頁面,也不適用於自動跳轉至其他頁面的鏈接以及其他 HTTP 錯誤訊息代碼。

3
根據 Net Market Share 今年7月的統計數據,Firefox 在全球瀏覽器市場佔有率排在第3位,僅次於 Chrome 和 IE。

互聯網檔案館

互聯網檔案館(Internet Archive)是一個非牟利性的數碼圖書館。成立於1996年,由 Alexa 創始人布魯斯特·卡利(Brewster Kahle)創辦。提供數字數據如網站、音樂、動態圖像、和數百萬書籍的永久性免費儲存及獲取。迄至2012年10月,其資訊儲量達到10PB。除此之外,該檔案館也是網絡開放與自由化的倡議者之一。其數據是由自帶的網絡爬蟲自動蒐集的,其網站典藏檔案館網站時光機,抓取了超過1500億的網頁。其年度預算約100萬美元,來源則是其網頁爬蟲服務、合作關係、贊助以及卡利-奧斯丁基金會(Kahle-Austin Foundation)。總部位於美國三藩市里奇蒙德區,此地僱員只有數十人,大部分僱員工作於書籍掃描中心,在紅木城(Redwood City)也有數據中心。該數據庫是國際互聯網儲存聯盟成員,2007年被加利福尼亞州選為官方指定圖書館。(資料來自維基百科)

來源:GhacksThe Verge

本刊載內容版權為端傳媒或相關單位所有,未經端傳媒編輯部授權,請勿轉載或複製,否則即為侵權。

延伸閱讀