
通常情況下,文章或網頁的發佈日期會直接顯示在螢幕上。但有時,有些網頁會試圖偽裝成永恆經典,這在你需要了解是否仍然有效時就成了問題。別擔心:有辦法揭開這層神秘面紗。
需要說明的是,並不能保證一定能找到確切的日期──你可能只能估算出資訊的年代。通常情況下,這樣的估算就足夠了。
最簡單的方法:查看網址
網頁地址理論上“就顯示在你眼前”,但很容易被忽略。所以,請先查看網頁地址。遺憾的是,網頁地址並不總是統一或準確的。 《大眾科學》的一些舊文章的網址包含了已發表的年份和月份(但沒有日期),而我們較新的文章則沒有這種情況。
簡單:查看 XML 網站地圖
XML 網站地圖其實就是一個網站的 URL 列表,其中包含每個 URL 的基本資訊。它的作用是引導搜尋引擎爬蟲進行永無止境的資料抓取。若要查看網站地圖,請在網址列中,並在頁面 URL 末尾新增/sitemap.xml 。
如果運氣好,頁面佈局會很清晰,就像白宮網站一樣。對於更新更頻繁的網站,例如Lifehacker ,你可能會看到一長串最後修改日期。最糟糕的情況是,頁面根本無法打開,你會收到 404 錯誤,就像PopSci一樣。
媒材:使用 Wayback Machine
網路檔案館的 Wayback Machine 是一個網頁快照庫,收錄了數十億個網頁的快照。只需將想要查看的網址貼到網站的搜尋欄中,然後按回車鍵即可。這將返回一個時間線,顯示該工具何時捕獲了目標網頁的圖像。點選您想要的年份,然後點選高亮顯示的日期,即可查看當時的網頁內容。
這篇發表在《大眾科學》上關於如何用手機列印和掃描物品的文章,在互聯網檔案館(Wayback Machine)上最早的存檔日期是2017年3月14日——也就是文章上線的那天。雖然這個日期是準確的,但並非總是如此。你現在看到的頁面可能是在文章發佈一段時間後才被存檔的,也可能根本沒有被存檔。
更難:充分利用谷歌的高級搜尋功能
有時谷歌搜尋結果會顯示日期。如果沒有,你可以手動設定。複製你想查詢的網頁地址,在搜尋欄中輸入“inurl: ”,然後將網址貼到冒號後面(不要有空格)。這樣Google就會只顯示來自該網站的搜尋結果。
接下來,前往網址列(不是搜尋列),在網址結束時新增`&as_qdr=y25` 。這條指令會告訴 Google 顯示過去 25 年的搜尋結果。具體來說,“as”代表“高級搜尋”,“qdr”是“查詢日期範圍”的縮寫,“y25”表示“過去 25 年”。您可以根據需要修改最後一個參數,例如用“d”表示天,“w”表示週,“m”表示月,後面可以跟上任意數字。
當你在修改後的網址上按下回車鍵時,Google會在搜尋結果中顯示一個日期。但與其他選項一樣,這個日期的準確性無法保證。它可能是文章的發布日期、最後修改日期,或是Google收錄的日期。例如, 《大眾科學》關於如何最佳加熱披薩的文章顯示的日期是2020年2月7日。這是我們首次發布這篇文章的日期,但它在2021年2月5日進行了更新。
另一種更耗時的方法是使用`inurl: ` 指令來確定網頁首次出現在 Google 搜尋結果中的時間。在搜尋列中找到「工具」 ,然後點選「任何時間」下拉式功能表。選擇“自訂範圍…” ,然後輸入一些日期。透過逐年搜尋並持續縮小日期範圍,您應該能夠找到網頁首次上線的時間,但這並非一個有效率的方法。
最難:深入研究原始碼
右鍵點擊任何網頁,您應該會看到查看原始程式碼的選項。在Google瀏覽器中,它顯示為“查看頁面原始碼” 。選擇它,您就可以看到網頁的原始碼。在這些資訊中,您或許能找到網頁的建立或修改時間。在 Windows 系統中使用Ctrl+F ,在 macOS 系統中使用Cmd+F開啟搜尋功能,盡力尋找相關資訊。嘗試搜尋「日期」、「發布」、「發布日期」、「修改」、「修改日期」或類似的關鍵字。
PopSci會明確標示文章的發佈和更新時間,但您也可以透過搜尋「last_updated_date」在原始碼中找到特定日期。不過請注意:頁面上其他內容(例如照片)也可能有日期,這些日期可能與文章內容的發佈時間不一致。
這種策略最大的困難在於其極強的不一致性和潛在的複雜性,因此被列為我們清單中最困難的策略。如果運用得當,你可以很快找到答案。但如果失敗了,你就得仔細檢查大量的程式碼。