• <input id="2bncg"><div id="2bncg"></div></input>
    <video id="2bncg"><dfn id="2bncg"></dfn></video>
  • <video id="2bncg"></video>
        1. <source id="2bncg"><menu id="2bncg"><kbd id="2bncg"></kbd></menu></source>

          <b id="2bncg"><address id="2bncg"></address></b>

          <source id="2bncg"><address id="2bncg"></address></source>
          <video id="2bncg"></video>
          筆趣閣 > 都市小說 > 重寫科技格局 > 第四十章 搜索引擎算法

          第四十章 搜索引擎算法(1 / 2)

          臨近下午一點,孟謙到了滬上浦東,這還是他重生后第一次來滬上,這個前世他也經常來的地方。

          滬上作為華夏的金融中心,是一張給世界看的名片。

          不過曾經的孟謙第一次來滬上是在07年的時候,2000年的滬上他還真沒見過。

          此時的浦東,已經開始聳立起高樓大廈,同時又存在大片的廠房和棚戶區,車子一路開過去,可以看到很多地方正在拆遷改造。

          “張總準備把分公司放在浦東么?”到了目的地后,孟謙憑借記憶對比,如果沒看錯的話這里應該是張江高科技園區。

          浦東四大重點開發區域中,世人相對熟知的應該就是金融中心陸家嘴和科技中心張江了。

          2000年的張江,領軍產業是電路、軟件以及生物醫藥。

          張樹新點頭表示肯定,“現在南方最有發展潛力的地方,毫無疑問就是深圳和滬上浦東,而張江高科技園區,則是科技的孵化寶地啊。”

          這個時候大家說到南方城市的發展潛力,尤其是科技發展,還沒人會想到杭城。

          來到張樹新租的地方,有五名男子正等在那邊,其中有兩人一看就是外籍男子。

          張樹新一一做了介紹,這兩名外籍男子一名來自IBM,一名來自谷歌,聽意思要么是已經挖過來了,要么就是打算挖過來的,兩人之前都是搜索引擎項目組的。

          另外三名華夏人,一人是瀛海威自家的技術總監,另外兩人都是從硅谷回來的,一個畢業于斯坦福大學,曾任職于英特爾,一人畢業于哈佛,曾任職于甲骨文,都是人才。

          簡單的打了個招呼,大家就到會議室坐著,接下去是孟謙的表演時間,他今天,要展示他的搜索引擎核心技術。

          搜索引擎這個東西,需要用到網絡爬蟲技術、檢索排序技術、網頁處理技術、大數據處理技術、自然語言處理技術等,當然,2000年這個時候,還用不上自然語言處理技術,大數據處理也更后世的概念不太一樣。

          但說的簡單一點,其實核心就是一個東西,算法。

          因為每一個技術都離不開算法。

          “我不太清楚在座各位在搜索引擎方面的建樹和理解,我只能先按照我的節奏說下去,如果誰有問題可以隨時打斷我。”孟謙走到黑板前直入正題。

          “在我展示我的核心技術之前,我們先來看看當下的三大主流算法,白度的超鏈分析,谷歌的PageRank算法以及IBM的HITS算法。

          幾乎所有人都覺得白度的超鏈分析是三個算法中最落后的,但有些事情我們還是要多角度的看一看,白度的超鏈分析在某種程度上可以算得上是奠定了搜索引擎的發展基礎。

          有一些聲音說谷歌其實是剽竊了白度的超鏈算法,畢竟李彥宏這個專利確實在谷歌之前,我們現在不去猜測真假,但這種說法體現了一個很重要的信號,其實不管是哪一家的算法,算法基礎其實都是一樣的。

          抓取網頁信息,然后用某種機制對這些網頁進行排序,當用戶輸入關鍵詞進行搜索時,根據關鍵詞匹配出按照機制進行排列的網頁。

          那么白度輸在哪呢?關鍵就在于白度現在過于簡單的基于在某次搜索的所有結果中被其他網頁用超鏈接指向的越多的網頁就價值越高這種基礎排序方式。

          相比之下,谷歌的pagerank就多了兩件很重要的事情,第一件事情是,把A頁面到B頁面的鏈接解釋為A給B的投票行為,谷歌在這里會同時考評A和B的等級從而形成新的等級。

          也就是每一個頁面都有PR值,同時你的PR值會成為其他頁面PR值的參考。

          然后不斷的重復計算每個頁面的PR。假設給每個頁面一個隨機PR值,那么經過不斷的重復計算,這些頁面的PR值會趨向于穩定,也就是收斂的狀態。

          至于HITS,其理論基礎依然沒變,它最大的特點或者說改變就在它意識到pagerank算法平均的分布權值不符合鏈接的實際情況。

          所以HITS算法中引入了另外一種網頁,稱為Hub網頁,Hub網頁是提供指向權威網頁鏈接集合的WEB網頁。

          最新小說: 反派:主角犯錯,親媽遭罪 黃金家族,從西域開始崛起 剛成反派,S級校花瘋狂倒貼? 假面騎士之前輩聊天群 心懷不軌 晉庭漢裔 這個戰錘游戲可太棒了!! 全民領主:開局一座鬧鬼金礦 吞噬星空之血海魔主 賭王出獄,我帶大嫂吃香喝辣
        2. <input id="2bncg"><div id="2bncg"></div></input>
          <video id="2bncg"><dfn id="2bncg"></dfn></video>
        3. <video id="2bncg"></video>
              1. <source id="2bncg"><menu id="2bncg"><kbd id="2bncg"></kbd></menu></source>

                <b id="2bncg"><address id="2bncg"></address></b>

                <source id="2bncg"><address id="2bncg"></address></source>
                <video id="2bncg"></video>
                最近免费观看高清韩国日本大全