微軟上周推出了一種名為BrowseRank的搜索引擎理論,和Google(谷歌)根據(jù)鏈接數(shù)量來評(píng)估網(wǎng)頁重要程度的PageRank算法不同,這種算法理論將人的行為因素引入了評(píng)估體系。

  微軟研究人員在SIGIR大會(huì)上發(fā)布論文報(bào)告稱:“一個(gè)網(wǎng)頁訪問的用戶數(shù)越多,并且在頁面上停留的時(shí)間越長,這個(gè)網(wǎng)頁的重要性就越高?!痹撜撐牡淖髡甙ㄎ④泚喼扪芯吭旱腂in Gao、Tie-Yan Liu、Hang Li,南開大學(xué)的Ying Zhang,中國科學(xué)院的Zhiming Ma以及北京大學(xué)的Shuyuan He。

  搜索對(duì)互聯(lián)網(wǎng)的重要性不言而喻,首先,搜索引擎相當(dāng)于一個(gè)具有高度影響力的中間人,它可以讓用戶找到自己想要找的網(wǎng)頁。此外,搜索關(guān)鍵字對(duì)Google這樣依賴搜索頁面廣告生存的企業(yè)非常重要。

  不過在搜索引擎市場,微軟落后于排名第一的Google以及第二的雅虎。微軟正在努力趕超前兩家公司,比如,微軟曾試圖收購雅虎,投資數(shù)十億美元進(jìn)行搜索研究,收購Powerset等。

  不過Google方面稱,PageRank只是Google考慮網(wǎng)頁重要性的一個(gè)方面。Google發(fā)表聲明說:“在我們?cè)u(píng)估一個(gè)網(wǎng)站排名的200多個(gè)因素中,PageRank只是其中一個(gè)因素。搜索是Google的核心,我們一直在對(duì)它進(jìn)行改進(jìn)?!?/p>

  微軟研究員說,PageRank具有一系列的缺點(diǎn)。首先,人們能夠大量鏈接某個(gè)網(wǎng)頁欺騙PageRank系統(tǒng),另外,PageRank并不考慮用戶停留在某個(gè)網(wǎng)站上的時(shí)間。

  微軟研究員們說,使用匿名的網(wǎng)站服務(wù)器與網(wǎng)頁瀏覽器插件可以更好的監(jiān)測用戶的使用行為,他們說:“試驗(yàn)結(jié)果顯示,BrowseRank在評(píng)估網(wǎng)頁重要性,過濾作弊網(wǎng)頁,提高搜索精確性方面能夠取得比現(xiàn)有手段更好的效果,其中包括PageRank。”

  該論文表示,研究人員按照合法渠道搜集了大量用戶人群的數(shù)據(jù)信息。

  目前,BrowseRank只是一個(gè)理論算法系統(tǒng),距離實(shí)用還有很長的路要走。不過對(duì)微軟來說,對(duì)這樣一個(gè)研究團(tuán)隊(duì)提供資助遠(yuǎn)比收購一家公司來得劃算。

  Google在最近一個(gè)季度的收入報(bào)告中說:“如果微軟或雅虎可以提供更好的網(wǎng)頁搜索結(jié)果以及更精確的搜索廣告,或者改善其廣告產(chǎn)品與平臺(tái),我們?cè)谟脩粼L問量或者規(guī)模方面將極大的衰退。”

  雅虎改進(jìn)搜索的努力主要有三:BOSS(搭建你自己的搜索服務(wù)),它能夠讓其它網(wǎng)站使用雅虎的搜索結(jié)果和相關(guān)搜索廣告;SearchMonkey,它可以讓網(wǎng)站管理者在搜索結(jié)果頁面中插入一個(gè)迷你網(wǎng)頁;Glue Pages,主要提供自助式的內(nèi)容與相關(guān)搜索服務(wù)。

  Google也在花大力氣進(jìn)行搜索技術(shù)開發(fā),最大的研發(fā)團(tuán)隊(duì)在從事搜索技術(shù)研究,第二季度,Google升級(jí)搜索算法100多次。Google搜索質(zhì)量部門的負(fù)責(zé)人Udi Manber說:“我的部門擁有上千臺(tái)機(jī)器,其存儲(chǔ)量以petabytes計(jì)?!?/p>

責(zé)任編輯:admin