做網站對404錯誤是否會對網站造成影響
作者:佚名 時間:2012-02-14 分享到:
我們在SEO交流的過程中,經常會提到“404錯誤狀態碼”,如果訪問的網頁URL不存在,那么就會返回一個404 HTTP響應代碼。
在普通用戶看來,當你訪問一個不存在的URL時,可能會出現一個“錯誤提示”頁面,以前我們討論過如果利用404錯誤頁面幫助用戶找到他需要的內容,下面主要是討論“404是否會對網站造成影響”,這里的影響主要是關鍵詞排名或者網站權重方面。
谷歌網管工具中報告的404錯誤會影響我的網站排名嗎?
404在網絡中是一個非常正常的組成部分;互聯網總是在不斷變化,新的內容誕生,舊的內容消失,而當舊內容消失的時候,它(在理想狀況下)會返回一個404 HTTP響應代碼。搜索引擎會察覺到這點;正如您在上圖中所看到的,谷歌在自己的網站上也有404錯誤,并且整個網絡上都存在。
谷歌建議,當我們在網站上去掉一個頁面的時候,我們最好確保它返回一個適當的404或410響應代碼(而不是“軟404”)。請記住,為了讓網絡爬蟲能夠看到一個URL的HTTP響應代碼,它就必須能夠抓取那個URL,如果該URL被robots.txt文件所阻擋,那么爬蟲程序將無法抓取并看到它的響應代碼。如果我們網站上的某些URL不復存在 ,返回404,并不會影響您網站的其他URL(這些URL會返回200 (成功))在谷歌搜索結果中的表現。
404一點都不會影響我們的網站嗎?
如果我們網站上的某些URL出現了404,這一現象本身并不會損害到我們或對我們網站在谷歌的搜索結果造成負面影響。
在某些情況下可能出現其他原因而讓您希望解決某些類型的404。例如,如果有些出現了404的頁面是您十分在意的,您就應該看看為什么谷歌在抓取它們的時候會看到404! 一些由于自己或鏈接到我們網頁的用戶拼寫錯誤。這時可以將拼寫錯誤的URL 301重新指向至正確的URL。并且,當用戶確實登陸至您網站的一個404頁面時,您還可以建立一個友好的404錯誤頁面,而不是僅僅是顯示“404 找不到該頁面”。
“軟 404”的相關介紹
軟404是指網絡服務器對于一個不存在的URL返回的除404(或410)之外的響應代碼。一個常見的例子就是當一位網站所有者希望為其用戶返回一個帶有有用信息的漂亮404頁面,并認為為了向用戶提供該內容他就必須返回一個200響應代碼。其實并非如此!您可以返回一個404響應代碼而同時向用戶提供您希望的任何內容(所以當我們已經為網站設定自定義404頁面以后,要確保錯誤鏈接返回的是404代碼,可以在這里測試)。
另一個現象就是網站將所有未知的URL重新指向至其首頁,而非返回404。這兩種情況都可能為谷歌對我們網站的理解和索引造成負面影響,因此谷歌建議應確保您的服務器針對不存在的內容返回合適的響應代碼。請記住,僅僅因為頁面顯示“404 找不到該頁面”并不代表它確實返回了404 HTTP響應代碼(參考上面一段結尾的測試鏈接)。
網頁大部分404都是從未在我們網站上存在過的奇怪URL。這是怎么回事?它們是從哪里來的?
如果爬蟲程序在網絡的某個地方找到一個指向您網站上的URL的鏈接,則可能試圖抓取該鏈接,不論內容是否實際存在;而當這種情況發生時,如果找到不該內容,則您的服務器應該返回一個404。
這些鏈接可能由以下原因造成:
- 如某些人在鏈接至我們網站時出現的拼寫錯誤;
- 某些類型的錯誤配置(如果鏈接是自動生成的,例如由CMS自動生成);
- 由于Google在識別并抓取嵌入在 JavaScript的鏈接或其他嵌入內容時造成;
- 可能是谷歌了解我們的服務器如何處理未知URL時所做的快速檢查的一部分等等。
如果我們在谷歌網站站長工具看到針對我們網站上不存在的URL報告的404,我們可以放心地忽略它們。因為谷歌不知道哪些URL對我們來說是重要的,而哪些應該返回404,因此谷歌會向我們顯示所有在網站上找到的404,并且如果需要的話,我們可以對其顯示出來的404進行查看,盡量將已知問題解決。
網頁被抄襲,因為斷開的鏈接并給我們造成的404,對我們有影響嗎?
比如下面這樣:
http://www.scseoer.com/wp-content/uploads/2011/05/html5-topper.png”>
src=”http://www.scseoer.com/wp-content/uploads/
2011/05/html5-topper-300×202.png” Alt=”HTTML 5″
width=”300″ height=”202″ />
一般情況下,我們不必擔心類似上面那樣的“斷開的鏈接”會損害我們的網站。因為我們對抄襲我們網站或以奇怪方式鏈接至網站的人幾乎無能為力。我們可以考慮根據此處的說明將這些URL重新指向,但通常這一情況都無需擔心。請記住,當我們認為有人正在從我們的網站盜取原始內容時,可以提交從Google刪除內容的申請。
我已經修復了谷歌網管工具報告的404錯誤,為什么在我的賬戶中還有顯示呢?
請查看抓取錯誤頁面的“上次檢測到此錯誤的時間”一欄,這是谷歌檢測到每個錯誤的最近的日期。如果該欄中的日期在您修復錯誤之前,這就意味著自該日期起谷歌還未遇到這些錯誤。如果這些日期距離較近,則說明谷歌在抓取時還在繼續遇到這些404。
實施修復之后,我們可以通過使用像Googlebot一樣抓取檢查一下我們的網絡爬蟲是否能夠看到新的響應代碼。利用幾個URL進行測試,如果沒有問題,則這些錯誤應該不久就將開始從我們的抓取錯誤列表中消失了。
是否能夠使用Google的URL移除工具使404錯誤從我的賬戶中更快地消失?
不可以;URL移除工具是用來從Google的搜索結果而不是我們的網管工具賬戶中移除URL的。該工具僅用于緊急的移除請求,并且如一個URL已經返回404則并沒有必要使用此工具,就其本身而言,URL將隨著時間的推移退出谷歌的搜索結果。