做seo做了快一年了,自己有很多的感悟也有很多的想法,雖然說有時候也會遇到困難,但是解決了就不是困難,就是進步!
今天爬網(wǎng)的時候看到又有一篇寫什么搜索引擎怎么爬網(wǎng)頁,怎么搜集數(shù)據(jù)什么的。其實無非就是那幾點。認識蜘蛛、網(wǎng)站收錄指數(shù)、web網(wǎng)頁設計。下面來分開來看一下。
1、蜘蛛
蜘蛛的工作職責是發(fā)現(xiàn)新的網(wǎng)頁并收集這些網(wǎng)頁的快照,然后分析該網(wǎng)頁。
蛛蜘以抓取頁面為主,比如掃描網(wǎng)頁,所有的搜索引擎都能夠?qū)崿F(xiàn)深層檢索和快速檢索。在深層檢索中,蜘蛛可以查找和掃描網(wǎng)頁內(nèi)的所有內(nèi)容;在快速檢索中,蜘蛛不遵循深層檢索的規(guī)則,只搜索重要的關(guān)鍵詞部分,而不檢查和掃描網(wǎng)頁里的所有內(nèi)容。
大家都知道網(wǎng)站最重要的是快照時間,也就是說蜘蛛爬行和收錄的網(wǎng)頁速度越快,就說明這個網(wǎng)站在搜索引擎心中越重要,比如新華網(wǎng)和人民網(wǎng),蜘蛛每小時爬4次以上,有的網(wǎng)站一個月也不見得能被蜘蛛爬一次。快照的抓取程度取決于網(wǎng)站內(nèi)容的流行度、更新速度與網(wǎng)站域名的新舊。
在蜘蛛的爬行規(guī)則中,如果有許多外部鏈接指向這個網(wǎng)站,那就說明這個網(wǎng)站比較重要,所以抓取這個網(wǎng)站的頻率很高。當然,搜索引擎這樣做也是為了省錢,如果都以同樣的頻率爬行所有網(wǎng)站,這樣需要更多的時間和成本,才能得到更全面的搜索結(jié)果。
2、指數(shù)
蜘蛛在爬行的過程中,可能會重復檢查網(wǎng)頁的內(nèi)容,然后查看網(wǎng)站內(nèi)容是否是復制其他網(wǎng)站的,以保證網(wǎng)站原創(chuàng)內(nèi)容的指數(shù),該指數(shù)的結(jié)果一般都是基本保持復制內(nèi)容的排序搜索結(jié)果。當你進行搜索時,搜索引擎不會從網(wǎng)絡上搜索,它會從指數(shù)中選擇搜索結(jié)果,所以搜索得到的網(wǎng)頁數(shù)量并不能代表整個網(wǎng)站,但蜘蛛會在后臺掃描和保存網(wǎng)站的網(wǎng)頁數(shù)量。
在搜索結(jié)果數(shù)量中,谷歌1-10個搜索結(jié)果約為16.05萬,還有每個區(qū)域的搜索結(jié)果排名,這些都可以用搜索引擎的算法指數(shù)來控制,或者說是控制一部分。
每個搜索引擎在全國或全世界各地都建立數(shù)據(jù)中心,當你輸入需要搜索的關(guān)鍵詞的時候,會由于數(shù)據(jù)更新的時間不同而致搜索結(jié)果同步,所以在不同的地區(qū)就會出現(xiàn)不同的搜索結(jié)果。
3、Web界面
當你使用搜索引擎所看到的界面(比如google.com、baidu.com),搜索結(jié)果取決于復雜的算法,算法都是從指數(shù)內(nèi)調(diào)用結(jié)果,通過查詢并分析才能在前臺顯示,所以算法的制作時間比較長,谷歌在這個技術(shù)領(lǐng)域上領(lǐng)先。
還有一些搜索引擎的“一站式”特性,這類特性在英文搜索上比較常見,一般來說,搜索引擎忽略“一站式”的話,這樣的搜索結(jié)果將更加正確,比如搜索“貓,狗”的時候,搜索引擎會排除“貓和狗”,只搜索“貓”“狗”。
關(guān)鍵詞密度是衡量一個關(guān)鍵詞出現(xiàn)在網(wǎng)頁上的頻率,一般搜索引擎看到某網(wǎng)頁上的關(guān)鍵詞超過密度范圍,那它就會分析該網(wǎng)頁是否作弊,現(xiàn)在搜索引擎可以做到任何地域的字詞相關(guān)度處理。所以在一般情況下,關(guān)鍵詞應該在整個網(wǎng)頁中分散,但一定要有某個標題或段落長期不變。
搜索引擎還有個核心分析技術(shù)就是鏈接的相關(guān)性分析,除了網(wǎng)頁排名和一般的鏈接,谷歌還看重錨文本鏈接,錨文本鏈接主要在于鏈接的年齡和位置,還有該鏈接的網(wǎng)頁是否屬于權(quán)威網(wǎng)站等。
鏈接是最大的網(wǎng)站質(zhì)量指標,搜索引擎都很關(guān)注著,因為現(xiàn)在友情鏈接比較難找,而你又很需要友情鏈接,所以鏈接中很少有垃圾信息。比如大學的網(wǎng)站在谷歌的權(quán)重很高,那是由于大學有很多高質(zhì)量的外部鏈接。隨著大家都了解到外部鏈接的重要性后,很多網(wǎng)站開始買賣鏈接,這也是現(xiàn)在搜索引擎比較頭疼的問題,不過ask現(xiàn)在判定網(wǎng)站排名更多在于網(wǎng)站的質(zhì)量。
所有的搜索引擎都希望得到用戶反饋的信息,他們期待在查詢之前、搜索查詢、時間間隔、和語義關(guān)系等方面,能更加了解到用戶的意圖,他們還會跟蹤用戶的點擊,如果用戶點擊一個物品,然后又馬上回到搜索頁面,那搜索引擎就會認為這個購買不成功,會刪除跟蹤清單,其實這種做法已經(jīng)在向電子商務靠近了。
由此可以看出,搜索引擎已經(jīng)開始注重用戶體驗,為了做讓用戶肯定自己的勞動成果,并成為搜索引擎行業(yè)的一個標準,或許未來的發(fā)展就在個性化搜索。

我們只做有價值的網(wǎng)站
-
聯(lián)系
- 聯(lián)系我們
- 網(wǎng)站地圖
- 區(qū)域分站
- 行業(yè)建站方案
- 關(guān)鍵詞搜索
- XML
-
聯(lián)系我們
- 手機:133-8899-8805
- 座機:(+86)023-62963623
- Q Q:183958257點擊交談
- 地址:重慶 南岸 亞太路1號
友情鏈接:企業(yè)網(wǎng)站建設
營銷型網(wǎng)站建設
手機網(wǎng)站建設
模板網(wǎng)站建設
H5網(wǎng)站建設
網(wǎng)站改版升級
重慶網(wǎng)站建設
模板網(wǎng)站建設
公司簡介
成功案例
解決方案
新聞中心
聯(lián)系我們
網(wǎng)站地圖
XML
萬州網(wǎng)站建設
江津網(wǎng)站建設
永川網(wǎng)站建設
合川網(wǎng)站建設
北碚網(wǎng)站建設
黔江網(wǎng)站建設
涪陵網(wǎng)站建設
南川網(wǎng)站建設
銅梁網(wǎng)站建設
璧山網(wǎng)站建設
大足網(wǎng)站建設
綦江網(wǎng)站建設
長壽網(wǎng)站建設
開州網(wǎng)站建設
潼南網(wǎng)站建設
武隆網(wǎng)站建設
奉節(jié)網(wǎng)站建設
榮昌網(wǎng)站建設
梁平網(wǎng)站建設
城口網(wǎng)站建設
云陽網(wǎng)站建設
巫山網(wǎng)站建設
豐都網(wǎng)站建設
墊江網(wǎng)站建設
秀山網(wǎng)站建設
酉陽網(wǎng)站建設
忠縣網(wǎng)站建設
石柱網(wǎng)站建設
彭水網(wǎng)站建設
巫溪網(wǎng)站建設
萬盛網(wǎng)站建設
巴南網(wǎng)站建設
江北網(wǎng)站建設
南坪網(wǎng)站建設
九龍坡網(wǎng)站建設
沙坪壩網(wǎng)站建設
大渡口網(wǎng)站建設
畢節(jié)網(wǎng)站建設
安順網(wǎng)站建設
六盤水網(wǎng)站建設
銅仁網(wǎng)站建設
黔東南網(wǎng)站建設
黔南網(wǎng)站建設
黔西南網(wǎng)站建設
遵義網(wǎng)站建設
昆明網(wǎng)站建設
曲靖網(wǎng)站建設
昭通網(wǎng)站建設
綿陽網(wǎng)站建設
自貢網(wǎng)站建設
攀枝花網(wǎng)站建設
玉溪網(wǎng)站建設
保山網(wǎng)站建設
麗江網(wǎng)站建設
臨滄網(wǎng)站建設
大理網(wǎng)站建設
普洱網(wǎng)站建設
拉薩網(wǎng)站建設
日喀則網(wǎng)站建設
昌都網(wǎng)站建設
林芝網(wǎng)站建設
山南網(wǎng)站建設
那曲網(wǎng)站建設
阿里網(wǎng)站建設
寶雞網(wǎng)站建設
漢中網(wǎng)站建設
銅川網(wǎng)站建設
咸陽網(wǎng)站建設
渭南網(wǎng)站建設
安康網(wǎng)站建設
延安網(wǎng)站建設
商洛網(wǎng)站建設
榆林網(wǎng)站建設
Copyright © 2008-2018 沛宣網(wǎng)絡 渝ICP備13000588號-5 工商備:500108000067794 渝公網(wǎng)安備 50010802002673號