如何計算網站相似度?
作者:佚名 時間:2014-04-14 分享到:
目前,網站建設的市場魚龍混雜,模版網站、仿站,甚至是純抄襲的網站層出不窮。就那我們自己的官網來說,被抄襲了不只一次兩次了。對待這種抄襲者,我們不給予深究。我們只能將他們當做是一群鞭策者,時時刻刻鞭策著我們進步。下面,我們就來說說如何計算網站的相似度。
相似度,就是兩個或兩個以上網頁的相似程度。網頁中包含了大量的圖片和文字,還包括了網站的框架結構、一系列的程序代碼等。如果兩個相似度很高的網站擺在你面前,你一定不喜歡瀏覽。對于搜索引擎來說,這樣的兩個網站也會被定義為垃圾網站。通常,60%相似的網站會被認為是整站抄襲。
網站相似度計算方式:
1.如果多個網頁摘要的MD5值一樣,證明這些網頁具有很高的相似性。
2.根據網站中出現的文字、圖片,按照排列順序,可以提出一些出現次數較多的如果MD5值相同,那么也會增加相似度。
那么,在企業(yè)網站建設時,如何降低與其他網站的相似度呢?
1.使用iframe框架,把認為的高度相似的頁面嵌套進去。
2.編寫出不一樣的JS效果,搜索引擎認為JS是一種無用代碼,可以將高度相似的頁面放進JS中。通常來說,搜索引擎是不對JS進行抓取的。
3.在網頁中加入Flash動畫,或者加入大量圖片。
4.增加原創(chuàng)內容,原創(chuàng)的內容就可以不用擔心和其他網站內容相思。這樣也符合搜索引擎的抓取標準,是提高網站權重的最佳途徑。