搜索引擎緩存和查詢記錄日志
作者:佚名 時間:2012-03-11 分享到:
用戶搜索的關鍵詞有很大一部分是重復的,按照二八定律,兩成的搜索詞占到了總搜索次數的八成,按照長尾理論,最常見的搜索詞沒有占到八成那么多,但通常也有一個比較粗大的頭部,很少一分部搜索詞占到了所有搜索次數的很大一部分,特別是有熱門新聞發生時,每天可能有幾百萬ip來搜索完全相同的關鍵詞,比如最近熱門關鍵詞京東商城收購一快遞公司.
搜索用戶的ip地址,搜索的關鍵詞,搜索時間,以及點擊了哪些結果頁面,搜索引擎都記錄形成日志.這些日志文件中的數據對搜索引擎判斷搜索結果質量,調整搜索算法,預期搜索趨勢等都有重要意義.
以前我們網站有介紹過搜索引擎的工作原理和工作過程,當然實際搜索引擎操作程序我不可能完全得知,因為其算法也是非常復雜的,
如沒特殊注明,文章均為上海聯楷網絡原創,轉載請注明來自:http://www.ktcbnqb.cn/hynews/20151126/n2236.html