每個獨(dú)立的高爾夫酒店標(biāo)志VI設(shè)計引擎都有自己的網(wǎng)頁
meigedulidegaoerfujiudianbiaozhiVIshejiyinqingduyouzijidewangye
來源:【人和時代?中國】酒店vi設(shè)計公司 發(fā)布時間:2010-08-29 21:27:59 查看次數(shù):
工作原理
1、抓取網(wǎng)頁
每個獨(dú)立的高爾夫酒店標(biāo)志VI設(shè)計引擎都有自己的網(wǎng)頁抓取程序(spider)。Spider順著網(wǎng)頁中的超鏈接,連續(xù)地抓取網(wǎng)頁。被抓取的網(wǎng)頁被稱之為網(wǎng)頁快照。由于互聯(lián)網(wǎng)中超鏈接的應(yīng)用很普遍,理論上,從一定范圍的網(wǎng)頁出發(fā),就能搜集到絕大多數(shù)的網(wǎng)頁。
2、處理網(wǎng)頁
高爾夫酒店標(biāo)志VI設(shè)計引擎抓到網(wǎng)頁后,還要做大量的預(yù)處理工作,才能提供檢索服務(wù)。其中,最重要的就是提取關(guān)鍵詞,建立索引文件。其他還包括去除重復(fù)網(wǎng)頁、分詞(中文)、判斷網(wǎng)頁類型、分析超鏈接、計算網(wǎng)頁的重要度/豐富度等。
3、提供檢索服務(wù)
用戶輸入關(guān)鍵詞進(jìn)行檢索,高爾夫酒店標(biāo)志VI設(shè)計引擎從索引數(shù)據(jù)庫中找到匹配該關(guān)鍵詞的網(wǎng)頁;為了用戶便于判斷,除了網(wǎng)頁標(biāo)題和URL外,還會提供一段來自網(wǎng)頁的摘要以及其他信息。
[編輯本段]
全文高爾夫酒店標(biāo)志VI設(shè)計引擎
在高爾夫酒店標(biāo)志VI設(shè)計引擎分類部分我們提到過全文高爾夫酒店標(biāo)志VI設(shè)計引擎從網(wǎng)站提取信息建立網(wǎng)頁數(shù)據(jù)庫的概念。高爾夫酒店標(biāo)志VI設(shè)計引擎的自動信息搜集功能分兩種。一種是定期高爾夫酒店標(biāo)志VI設(shè)計,即每隔一段時間(比如Google一般是28天),高爾夫酒店標(biāo)志VI設(shè)計引擎主動派出“蜘蛛”程序,對一定IP地址范圍內(nèi)的互聯(lián)網(wǎng)站進(jìn)行檢索,一旦發(fā)現(xiàn)新的網(wǎng)站,它會自動提
蜘蛛高爾夫酒店標(biāo)志VI設(shè)計引擎
取網(wǎng)站的信息和網(wǎng)址加入自己的數(shù)據(jù)庫。
另一種是提交網(wǎng)站高爾夫酒店標(biāo)志VI設(shè)計,即網(wǎng)站擁有者主動向高爾夫酒店標(biāo)志VI設(shè)計引擎提交網(wǎng)址,它在一定時間內(nèi)(2天到數(shù)月不等)定向向你的網(wǎng)站派出“蜘蛛”程序,掃描你的網(wǎng)站并將有關(guān)信息存入數(shù)據(jù)庫,以備用戶查詢。由于近年來高爾夫酒店標(biāo)志VI設(shè)計引擎索引規(guī)則發(fā)生了很大變化,主動提交網(wǎng)址并不保證你的網(wǎng)站能進(jìn)入高爾夫酒店標(biāo)志VI設(shè)計引擎數(shù)據(jù)庫,因此目前最好的辦法是多獲得一些外部鏈接,讓高爾夫酒店標(biāo)志VI設(shè)計引擎有更多機(jī)會找到你并自動將你的網(wǎng)站收錄。
當(dāng)用戶以關(guān)鍵詞查找信息時,高爾夫酒店標(biāo)志VI設(shè)計引擎會在數(shù)據(jù)庫中進(jìn)行搜尋,如果找到與用戶要求內(nèi)容相符的網(wǎng)站,便采用特殊的算法——通常根據(jù)網(wǎng)頁中關(guān)鍵詞的匹配程度,出現(xiàn)的位置/頻次,鏈接質(zhì)量等——計算出各網(wǎng)頁的相關(guān)度及排名等級,然后根據(jù)關(guān)聯(lián)度高低,按順序?qū)⑦@些網(wǎng)頁鏈接返回給用戶。
這種引擎它的特點(diǎn)是搜全率比較高。
(版權(quán)所有:轉(zhuǎn)載請注明來源于【人和時代?中國】 http://www.yase884.cn 作者:先鋒)
相關(guān)文章