免费av亚洲国产在线

      <tbody id="0f2vu"></tbody>

      <tbody id="0f2vu"></tbody>

      需要極大的數據運算量,對于這樣的搜索工作。一般說來,對于某個搜索,要有超過 500 臺的服務器協同工作以求得最佳匹配的結果,當然,結果會在半秒內返回用戶。

      谷歌怎樣收錄及搜索網頁排序問題

      需要極大的數據運算量,對于這樣的搜索工作。一般說來,對于某個搜索,要有超過 500 臺的服務器協同工作以求得最佳匹配的結果,當然,結果會在半秒內返回用戶。

      遇到最常見的問題之一是 Googl 如何判定哪個結果呈現在搜索結果的前茅 ? Matt Cutt 給我簡單地揭示了如何抓取、收錄和給網頁評級。

      抓取和收錄

      Googl 后臺已經做了許多步驟。 Googl 第一步是抓取和收錄互聯網上的數十億的網頁,當你看到呈現在 Googl 搜索結果的那個網頁之前。這個工作時由 Googl 機器人 Googlebot 來完成的瀏覽網絡服務器抓取文件。抓取的順序并不是漫無目的地在互聯網上瞎逛,訪問服務器的特定的網頁,然后掃描網頁上的超文本鏈接,如果有新的文件也是這樣抓取得 ; 蜘蛛程序給每個得到網頁一個號碼,這個號碼指向它抓取的網頁。

      但這些網頁還不是便于搜索的如果沒有一個索引,蜘蛛程序抓取了很多的網頁。要查詢一個詞,比方 “ 國內戰爭 ” Googl 服務器每次都要讀取每一個文件的所有內容。

      第二步就是建立索引。不是去掃描每一個文件的所有內容,因此。巧妙地進行數據的轉換 ” 列出每一個文件所包含的特定的詞,例如,國內 ” 這個詞可能出現在文件 3 8 22 56 68 和 92 當中,而 “ 戰爭 ” 這個詞出現在文件 2 8 15 22 68 和 77 中。

      就可以開始對網頁進行評級,建立好索引之后。決定網頁的相關水平。假設有人在 Googl 搜索欄輸入 “ 國內戰爭 ” 進行查詢,為了提交搜索結果和對結果進行評分,要做兩件事:

      1. 找到包括用戶查詢的詞的網頁

      2. 給符合的網頁依照相關水平進行評級

      而是用千百個計算機來存儲這些信息。因為任務被分解到許多的計算機,Googl 開發出一個有趣的技巧來加速第一步: Googl 不是把整個索引存儲在一臺功能強大的計算機上??梢愿斓卣业剿璧拇鸢?。詳細解釋一下,假設一本書的目錄有 30 頁,如果一個人要在目錄中查尋資料,每次查詢都要花幾秒鐘 ; 如果用 30 個人每人查詢一頁目錄,顯然要比一個人查詢的速度快很多。同樣的 Googl 將數據分別存儲在許多計算機上,這樣搜索的速度會大大加快。

      國內 ” 這個詞出現在文件 3 8 22 56 68 和 92; 戰爭 ” 呈現在文件 2 8 15 22 68 和 77 記下同時出現這兩個詞的文件。 如何找到那些包括用戶搜索的詞的網頁呢 ? 回到國內戰爭 ” 例子。

      國內  3 8 22 56 68 92

      戰爭  2 8 15 22 68 77

      國內 戰爭 8 22 68

      這叫做交叉搜索位置列表。較快的交叉搜索的方法是同時進行搜索,如果一個搜索列表 , 這樣我可以清楚地發現 “ 國內 ” 戰爭 ” 這兩個詞同時出現的三個文件里 8, 22, 和 68 含有這幾個字的列表叫做 “ 位置列表 ” 搜索文件包括這兩個字。22 68 那另一個就可以開始搜索其他

      搜索關鍵詞:谷歌優化

      對結果進行評級

      要對它相關水平進行評級。 Googl 用許多參數進行評級。這當中 PR 算法是眾所周知的 PageRank 評估兩個因素:有多少個網頁鏈接到這個網頁,現在已經有了一些包含用戶搜索的關鍵詞的網頁。這些鏈接網頁的網站的質量如何。通過 PageRank 五六個高質量的站點的鏈接,比方 www.300mh.comwww.wulin999.cn 比其他較差的網站的鏈接要有價值的多。

      如果一個文件包含 “ 國內 ” 和 “ 戰爭 ” 這兩個詞排在一起,但是除了 PageRank 還用許多其它參數來進行評級。例如。這個文件可能比一個討論革命戰爭的文件 ( 文件的某個地方使用 “ 國內 ” 相關水平高。還比如假設一個網頁的標題是國內戰爭 ” 比另一個標題為 “ 19 世紀美國服裝 ” 網頁相關度高得多。同樣的如果 “ 國內戰爭 ” 網頁中出現多次的網頁比只出現一個的網頁相關的水平也要高。假設你搜索引擎,選擇一個詞查詢,比方:國內戰爭或回收, Googl 上查詢,從結果中挑選三到四頁打印出來。從每一張打印的頁面上找出你搜索語句的每一個字然后用熒光筆標出來,然后把這幾頁貼在墻上,退后幾步瞇著眼看,當你不知道頁面的內容,僅僅能看到那些有顏色的方塊,認為那一頁是最相關的呢 ? 不是有著大的標題和多次重復出現的顏色代表了較高的相關水平 ? 喜歡這些字出現在頂端還是底部 ? 這些字出現的頻率如何 ? 這也是搜索引擎如何判斷網頁的相關水平。

      Googl 總是試圖找出可靠的和相關的網頁。如果兩個網頁按照查詢的語句大致有相同的信息,原則上。 Googl 通常選擇比較信得過的網站的網頁。當然,如果有一些因素表明這個網站的網頁相關度更高, Googl 經常也選擇 PageRank 較低的網站。

      就給出得分最高的網頁。 Googl 同時從網頁中摘錄一小段包含查詢的關鍵詞的句子 ; 給出網頁的鏈接。 一旦 Googl 完成了文件的列表和它評分。

      信息來源:東莞SEO

       

      熱點信息

       

      網站優化

      SEO/搜索引擎優化

      網站推廣

      免费av亚洲国产在线
        <tbody id="0f2vu"></tbody>

        <tbody id="0f2vu"></tbody>