網站進行seo優化,非常關注的是搜索引擎收錄網站的內容,搜索引擎的工作原理總共有四步:第一步:爬行,搜索引擎是通過一種特定規律的軟件跟蹤網頁的鏈接,從一個鏈接爬到另外一個鏈接,所以稱為爬行。第二步:抓取存儲,搜索引擎是通過蜘蛛跟蹤鏈接爬行到網頁,并將爬行的數據存入原始頁面數據庫。第三步:預處理,搜索引擎將蜘蛛抓取回來的頁面,進行各種步驟的預處理。第四步:排名,用戶在搜索框輸入關鍵詞后,排名程序調用索引庫數據,計算排名顯示給用戶,排名過程與用戶直接互動的。
搜索引擎爬取的規律
一、網頁爬行規則
1、優質網站專門分配蜘蛛爬行,及時爬行,及時收錄,及時放出供網民搜索;2、普通網站,分配一定的蜘蛛爬行資源,爬到一定量就不爬行了;3、遵循F型爬行規則,從左到右,從商到下的原則爬行。
二、提高搜索引擎蜘蛛爬取的技巧
1、首先說域名,除了簡單易紀,使用常用后綴外,域名要選擇和網站主題相關。如果網站內容與域名相符,會在搜索引擎的排名中有好的表現。如果有多個域名,要選用一個主域名,其他域名301重定向到主域名??臻g一定要穩定,速度越快,單位時間內蜘蛛爬的越多,越有利于排名。如果您的網站經常打不開,影響用戶的體驗,也會影響Spider抓取你的網站,如果經常發生,用戶的體驗降低,Spider也不會來了。會影響您網站的收錄,更不用說排名。
2、樹型扁平結構。層級分明的樹狀扁平結構是較理想的網站部署結構,每個頁面與其父子頁面有鏈接關聯,可以幫助用戶快速定位到感興趣的頻道、正文,也有利于搜索引擎理解網站結構層次和更好的爬取內容。在url設置上, 目錄層級不要太深,盡量在4層以內
3、文章標題。文章標題中要準確包含文章概要,并且包含文章的主關鍵詞。這個主關鍵詞就是你希望在搜索引擎中排名的關鍵詞。標題是極重要的內容。大幅修改,可能會帶來大幅波動。所以請慎重對待網頁標題。如無必要,盡量不做大幅修改。
4、文章內容。文章內容要豐富,最好是原創內容。另外搜索引擎不能識別flash、frame、ajax,所以文章內容要中,要盡量少使用。如果一定要使用,可以建立文字版的索引頁。文章正文標題要使用標簽,文章配圖要加alt標簽。
三、這樣的網站布局符合搜索引擎的抓取習慣
如今的互聯網市場中,有很多企業的網站看重的是頁面的展現樣式,從而忽略了網站的內容結構。比如內容的標題,內容中基本上每個欄目會共用一個標題,像新聞資訊:點進新聞資訊后,會顯示這個標題,然而并沒顯示這篇文章的標題。(點擊查看原文:這樣的網站布局符合搜索引擎的抓取習慣)
四、為什么原創的文章沒有被搜索引擎收錄
在網絡營銷領域,大家應該都比較清楚搜索引擎比較偏愛原創,原創的內容往往都會比復制粘貼的內容更容易被收錄。因此,為了提高網站的收錄,很多人在經營網站的時候都更青睞于更新原創文章。(點擊查看原文:為什么原創的文章沒有被搜索引擎收錄)
五、新站該怎么快速收到搜索引擎的認可?
網站建設內容要及時更新,這非常重要,我對些深有體會,開始我的網站內容天天都進行更新,百度快照一兩天就更新一次,后來由于沒有時間,那么新站該怎么快速收到搜索引擎的認可呢?(點擊查看原文:新站該怎么快速收到搜索引擎的認可?)
以上內容由匠人匠心科技(http://www.joomlamz.com)為您提供,轉載請注明出處,如果您對搜索引擎爬取的規律感興趣,歡迎您咨詢我們,咨詢熱線:138-2142-0129或致電136-2215-0903張經理。匠人匠心科技每天都會不定時更新有關搜索引擎爬取的規律的文章,希望對您有用,您也可以關注我們的微信賬號二維碼,咨詢任何關于搜索引擎爬取的規律的問題。
我們的微信二維碼