A. 搜索引擎是用什麼技術進行搜索的
10月28日 19:56 搜索引擎起源於傳統的信息全文檢索理論。它包括3個主要過程:
1)搜集Web信息:發現、搜集Web上的網頁信息。需要有高性能的搜集器自動的在Web中搜索
信息。Web信息搜集器是下載Web上網頁的程序。它順著網頁之間的鏈接移動,自動地下載
所經過的網頁。給定起始URL集合S,Web搜集器不停的從S中移除URL,下載相應的網頁,解
析出網頁中的超鏈接URL,將未訪問過的URL加入集合S。Web搜集器也稱作Web機器人或Web
蜘蛛。搜集器把所獲得的信息保存下來以備建立索引庫,供用戶檢索。
2)索引庫的建立:對搜集到的Web信息提取和組織,建立索引庫。這關繫到用戶能否迅速地
找到准確、廣泛的信息。對搜集器抓來的網頁信息快速地建立索引,通常採用倒排表技術
。如果在建立索引庫的過程中對用戶在檢索端搜索的查詢串進行跟蹤,並對查詢頻率高的
查詢串建立Cache,可以在檢索端請求時,加快索引庫的響應速度。
3)檢索端的查詢:根據用戶輸入的查詢字串,在索引庫中快速檢索出文檔。採用基於網頁
內容分析和基於超鏈分析相結合的方法進行相關度評價,客觀地對檢索出的網頁進行排序
,從而盡量保證搜索出的結果與用戶的查詢串相一致。然後將輸出的結果返回給用戶。為
了加快檢索端的響應速度,可以根據最近用戶查詢信息建立檢索端Cache。
針對你的問題:看來你是沒有建索引文件,關鍵詞來了現到資料庫匹配,當然慢。
索引文件是不需要資料庫保存的,利用倒排表建好每個詞的索引網頁,查詢的時候幾乎是
一下命中,當然在秒級下完成了。
B. 關於搜索引擎的技術
最著名的並且獲得了專利的當然就是google的PR技術
家可能聽說過,Google 革命性的發明是它名為 「Page Rank」 的網頁排名演算法,這項技術徹底解決了搜索結果排序的問題。其實最先試圖給互聯網上的眾多網站排序的並不是 Google。Yahoo! 公司最初第一個用目錄分類的方式讓用戶通過互聯網檢索信息,但由於當時計算機容量和速度的限制,當時的 Yahoo! 和同時代的其它搜索引擎都存在一個共同的問題: 收錄的網頁太少,而且只能對網頁中常見內容相關的實際用詞進行索引。那時,用戶很難找到很相關信息。我記得 1999 年以前查找一篇論文,要換好幾個搜索引擎。後來 DEC 公司開發了 AltaVista 搜索引擎,只用一台 ALPHA 伺服器,卻收錄了比以往引擎都多的網頁,而且對裡面的每個詞進行索引。AltaVista 雖然讓用戶搜索到大量結果,但大部分結果卻與查詢不太相關,有時找想看的網頁需要翻好幾頁。所以最初的 AltaVista 在一定程度上解決了覆蓋率的問題,但不能很好地對結果進行排序。
Google 的 「Page Rank」 (網頁排名)是怎麼回事呢?其實簡單說就是民主表決。打個比方,假如我們要找李開復博士,有一百個人舉手說自己是李開復。那麼誰是真的呢?也許有好幾個真的,但即使如此誰又是大家真正想找的呢?:-)如果大家都說在 Google 公司的那個是真的,那麼他就是真的。
在互聯網上,如果一個網頁被很多其它很多網頁所鏈接,說明它受到普遍的承認和信賴,那麼它的排名就高。這就是Page Rank 的核心思想。 當然 Google 的 Page Rank 演算法實際上要復雜得多。比如說,對來自不同網頁的鏈接對待不同,本身網頁排名高的鏈接更可靠,於是給這些鏈接予較大的權重。Page Rank 考慮了這個因素,可是現在問題又來了,計算搜索結果的網頁排名過程中需要用到本身網頁的排名,這不成了先有雞還是先有蛋的問題了嗎?
Google 的兩個創始人拉里•佩奇 (Larry Page )和謝爾蓋•布林 (Sergey Brin) 把這個問題變成了一個二維矩陣相乘的問題,並且用迭代的方法解決了這個問題。他們先假定所有網頁的排名是相同的,並且根據這個初始值,算出各個網頁的第一次迭代排名,然後再根據第一次迭代排名算出第二次的排名。他們兩人從理論上證明了不論初始值如何選取,這種演算法都保證了網頁排名的估計值能收斂到他們的真實值。值得一提的事,這種演算法是完全沒有任何人工干預的。
理論問題解決了,又遇到實際問題。因為互聯網上網頁的數量是巨大的,上面提到的二維矩陣從理論上講有網頁數目平方之多個元素。如果我們假定有十億個網頁,那麼這個矩陣 就有一百億億個元素。這樣大的矩陣相乘,計算量是非常大的。拉里和謝爾蓋兩人利用稀疏矩陣計算的技巧,大大的簡化了計算量,並實現了這個網頁排名演算法。今天 Google 的工程師把這個演算法移植到並行的計算機中,進一步縮短了計算時間,使網頁更新的周期比以前短了許多。
我來 Google 後,拉里 (Larry) 在和我們幾個新員工座談時,講起他當年和謝爾蓋(Sergey) 是怎麼想到網頁排名演算法的。他說:"當時我們覺得整個互聯網就像一張大的圖 (Graph),每個網站就像一個節點,而每個網頁的鏈接就像一個弧。我想,互聯網可以用一個圖或者矩陣描述,我也許可以在用這個發現做個博士論文。" 他和謝爾蓋就這樣發明了 Page Rank 的演算法。
網頁排名的高明之處在於它把整個互聯網當作了一個整體對待。它無意識中符合了系統論的觀點。相比之下,以前的信息檢索大多把每一個網頁當作獨立的個體對待,很多人當初只注意了網頁內容和查詢語句的相關性,忽略了網頁之間的關系。
今天,Google 搜索引擎比最初的復雜、完善了許多。但是網頁排名在 Google 所有演算法中依然是至關重要的。在學術界, 這個演算法被公認為是文獻檢索中最大的貢獻之一,並且被很多大學引入了信息檢索課程 (Information Retrieval) 的教程。
C. 搜索引擎技術
⒈提高搜索引擎對用戶檢索提問的理解。為了提高搜索引擎對用戶檢索提問的理解,就必須有一個好的檢索提問語言。為了克服關鍵詞檢索和目錄查詢的缺點,現在已經出現了自然語言智能答詢。用戶可以輸入簡單的疑問句,比如「如何能殺死計算機中的病毒」,搜索引擎在對提問進行結構和內容的分析之後,或直接給出提問的答案,或引導用戶從幾個可選擇的問題中進行再選擇。自然語言的優勢在於,一是使網路交流更加人性化,二是使查詢變得更加方便、直接、有效。就以上面的例子來講,如果用關鍵詞查詢,多半人會用「病毒」這個詞來檢索,結果中必然會包括各類病毒的介紹,病毒是怎樣產生的等等許多無用信息,而用「如何能殺死計算機中的病毒」檢索,搜索引擎會將怎樣殺死病毒的信息提供給用戶,提高了檢索效率。 ⒉垂直主題搜索引擎有著極大的發展空間。網上的信息浩如煙海,網路資源以驚人的速度增長,一個搜索引擎很難收集全所有主題的網路信息,即使信息主題收集得比較全面,由於主題范圍太寬,很難將各主題都做得精確而又專業,使得檢索結果垃圾太多。這樣以來,垂直主題的搜索引擎以其高度的目標化和專業化在各類搜索引擎中占據了一席之地。目前,一些主要的搜索引擎,都提供了新聞、Mp3、圖片、Flash等的搜索,加強了檢索的針對性。 ⒊元搜索引擎,能夠提供全面且較為准確的查詢結果。現在的許多搜索引擎,其收集信息的范圍、索引方法、排名規則等都各不相同,每個搜索引擎平均只能涉及到整個Web資源的30-50%,這樣導致同一個搜索請求在不同搜索引擎中獲得的查詢結果的重復率不足34%,而每一個搜索引擎的查准率不到45%。元搜索引擎(META Search Engine)是將用戶提交的檢索請求發送到多個獨立的搜索引擎上去搜索,並將檢索結果集中統一處理,以統一的格式提供給用戶,因此有搜索引擎之上的搜索引擎之稱。它的主要精力放在提高搜索速度、智能化處理搜索結果、個性化搜索功能的設置和用戶檢索界面的友好性上,查全率和查准率都比較高。 四、主要的搜索引擎介紹 這里介紹的是在國內外影響比較大的主要的一些搜索引擎和分類目錄站點,由於現在的站點一般都同時提供全文搜索和分類目錄兩種服務,所以我們按照其自有的技術進行分類和介紹。 一主要的全文搜索引擎 ⒈Google( http://www.google.com/)。Google成立於1997年,幾年間迅速發展成為世界范圍內規模最大的搜索引擎。Google資料庫現存有42.8億個Web文件,每天處理的搜索請求已達2億次,而且這一數字還在不斷增長。Google借用Dmoz( http://dmoz.org/)的分類目錄提供「網頁目錄」查詢( http://www.google.com/dirhp?hl=zh-CN&tab=wd&ie=UTF-8&oe=UTF-8&q=),但默認網站排列順序並非按照字母順序,而是根據網站PageRank的分值高低排列。 ⒉網路( http://www..com/)。網路是國內最早的商業化(早期為其它門戶網站提供搜索服務,現在的競價排名更是日進斗金)全文搜索引擎,擁有自己的網路機器人和索引資料庫,專注於中文的搜索引擎市場,除有網頁搜索外,網路還有新聞、MP3、圖片等搜索,並在2003年底推出「貼吧」、按地域搜索等功能。 ⒊中國搜索( http://www.huicong.com/)。中國搜索的前身是慧聰搜索,原慧聰搜索在聯合中國網等30多家知名網站的基礎上,2002年9月25日,正式組建了中國搜索聯盟,經過一年多的發展,聯盟成員就已達630多家,成為中國互聯網一支重要的力量。由於發展迅速,慧聰集團借上市之機,將慧聰搜索更名為中國搜索,全力發展其在搜索引擎方面的業務,以打造中文搜索領域的全新品牌。 二主要分類目錄 ⒈雅虎中國分類目錄( http://cn.yahoo.com/)。雅虎中國的分類目錄是最早的分類目錄,現有14個主類目,包括「商業與經濟」、「藝術與人文」等,可以逐層進入進行檢索,也可以利用關鍵詞對「分類網站」進行搜索( http://m6.search.cnb.yahoo.com/dirsrch/)。此外,雅虎中國也可以對「所有網站」進行關鍵詞搜索( http://cn.search.yahoo.com/websrch/),早期,他的搜索結果使用Google的數據,2004年2月正式推出自己的全文搜索引擎,並結束了與Google的合作。 ⒉網路分類目錄( http://dir.sina.com.cn/)。網路的分類目錄目前共有18個大類目,用戶可按目錄逐級向下瀏覽,直到找到所需網站。就好像用戶到圖書館找書一樣,按照類別大小,層層查找,最終找到需要的網站或內容。通過和其它全文搜索引擎的合作,現在,也可以使用關鍵詞對網路的「分類網站」或「全部網站」進行搜索。 ⒊搜狐分類目錄( http://dir.sohu.com/)。搜狐分類目錄把網站作為收錄對象,具體的方法就是將每個網站首頁的URL地址提供給搜索用戶,並且將網站的題名和整個網站的內容簡單描述一下,但是並不揭示網站中每個網頁的信息內容。除此之外,也可以使用關鍵詞對搜狐的「分類目錄」或所有網站進行搜索。 ⒋網易分類目錄( http://search.163.com/)。網易的分類目錄採用「開放式目錄」管理方式,在功能齊全的分布式編輯和管理系統的支持下,現有5000多位各界專業人士參與可瀏覽分類目錄的編輯工作,極大地適應了互聯網信息爆炸式增長的趨勢。在加強與其它搜索引擎合作的基礎上,新版搜索引擎支持使用關鍵詞對所有網站進行檢索。 實際上,搜索引擎的眾多技術都是高度保密的,以是僅僅是筆者的一些愚見,不足之處,還請眾大蝦批評指正。
D. 使用搜索引擎檢索網路信息資源的檢索技巧有哪些
首先網路信息分為圖片,視頻,文字,文檔。針對不同的信息使用的搜索方式不同。
圖片搜索:目前國內搜索引擎對圖片的搜索都是通過文字信息去匹配圖片的alt標簽和圖片前後的文字信息。
視頻搜索:主要是匹配視頻標題和視頻簡介的文字信息。
文字搜索:主要有幾點關鍵語法;全部包含使用雙引號「」;指定網站內搜索使用(關鍵詞 url:域名)等等。
具體每個搜索引擎語法不同,可以查看對應引擎的語法。
滿意請採納,謝謝!
E. 網路信息的檢索方法有哪幾種
1、漫遊法。
2、直接查找法
3、搜索引擎檢索法。
4、網路資源指南檢索法。
F. 關於搜索引擎的概念
1、所謂搜索引擎,就是根據用戶需求與一定演算法,運用特定策略從互聯網檢索出制定信息反饋給用戶的一門檢索技術。
2、搜索引擎依託於多種技術,如網路爬蟲技術、檢索排序技術、網頁處理技術、大數據處理技術、自然語言處理技術等,為信息檢索用戶提供快速、高相關性的信息服務。搜索引擎技術的核心模塊一般包括爬蟲、索引、檢索和排序等,同時可添加其他一系列輔助模塊,以為用戶創造更好的網路使用環境。
G. 在計算機信息檢索系統中,常用的檢索技術主要有哪些
主要有5種檢索技術:
一、布爾邏輯檢索
1、利用布爾運算符把各個檢索詞連接在一起,組成一個邏輯檢索式,再由計算機進行相應邏輯運算,從而找出所需要信息的方法。
2、在具體檢索時,檢索功能是通過3個布爾運算符,也就是邏輯「與」(and),邏輯「或」(or)和邏輯「非」(not)來實現的。
二、截詞檢索
1、一種常用的防止漏檢從而提高查全率的檢索技術,目前的多數系統都向用戶提供截詞檢索功能。
2、所謂截詞,就是指在合適位置截斷檢索詞,再使用截詞符處理,既能減少字元數目,也可提高檢索的查全率。
三、位置檢索
1、限定檢索詞之間相對位置的檢索技術。同樣的一個檢索表達式詞語的相對次序不同,那麼表達的檢索意圖也是不一樣。
2、位置檢索技術就限定了檢索詞的相鄰關系,包括位置關系和前後次序,很好地解決了這個問題。檢索系統不同,採用的表達符號也可能不同,常用的有相鄰位置算符(W)、(nW)、(N)、(nN),欄位算符(F),句子位置算符(S)等。
四、普通檢索
1、是利用書目、文摘、索引等檢索工具進行文獻資料查找的方法。運用這種方法的關鍵在於熟悉各種檢索工具的性質、特點和查找過程,從不同角度查找。普通法又可分為順檢法和倒檢法。
2、順檢法是從過去到現在按時間順序檢索,費用多、效率低;倒檢法是逆時間順序從近期向遠期檢索,它強調近期資料,重視當前的信息,主動性相關書籍強,效果較好。
五、追溯和分段檢索
1、追溯法是利用已有文獻所附的參考文獻不斷追蹤查找的方法,在沒有檢索工具或檢索工具不全時,此法可獲得針對性很強的資料,查准率較高,查全率較差。
2、分段法是追溯法和普通法的綜合,它將兩種方法分期、分段交替使用,直至查到所需資料為止。
H. 搜索引擎常用的搜索技巧有哪些
搜索關鍵詞提煉
選擇搜索關鍵詞的原則是,首先確定你所要達到的目標,在腦子里要形成一個比較清晰概念,即我要找的到底是什麼?是資料性的文檔?還是某種產品或服務?然後再分析這些信息都有些什麼共性,以及區別於其他同類信息的特性,最後從這些方向性的概念中提煉出此類信息最具代表性的關鍵詞。如果這一步做好了,往往就能迅速的定位你要找的東西,而且多數時候你根本不需要用到其他更復雜的搜索技巧。
細化搜索條件
你給出的搜索條件越具體,搜索引擎返回的結果也會越精確。比方說你想查找有關電腦冒險游戲方面的資料,輸入game是無濟於事的。computer game范圍就小一些,當然最好是敲入computer adventure game,返回的結果會精確得多。此外一些功能詞彙和太常用的名詞,如對英文中的「and」、「how」、「what」、 「web」、「homepage」和中文中的「的」、「地」、「和」等等搜索引擎是不支持的。這些詞被稱為停用詞(Stop Words)或過濾詞(Filter Words),在搜索時這些詞都將被搜索引擎忽略。
用好搜索邏輯命令
搜索引擎基本上都支持附加邏輯命令查詢,常用的是「+」號和「-」號,或與之相對應的布爾(Boolean)邏輯命令AND、OR和NOT。用好這些命令符號可以大幅提高我們的搜索精度。
精確匹配搜索
除利用前面提到的邏輯命令來縮小查詢范圍外,還可使用""引號(注意為英文字元。雖然現在一些搜索引擎已支持中文標點符號,但顧及到其他引擎,最好養成使用英文字元的習慣)來進行精確匹配查詢(也稱短語搜索)。
特殊搜索命令
標題搜索 多數搜索引擎都支持針對網頁標題的搜索,命令是「title:」,在進行標題搜索時,前面提到的邏輯符號和精確匹配原則同樣適用。網站搜索 此外我們還可以針對網站進行搜索,命令是「site:」(Google)、「host:」(AltaVista)、「url:」(Infoseek)或「domain:」(HotBot)。鏈接搜索 在Google和AltaVista中,用戶均可通過「link:」命令來查找某網站的外部導入鏈接(inbound links)。其他一些引擎也有同樣的功能,只不過命令格式稍有區別。你可以用這個命令來查看是誰以及有多少網站與你做了鏈接。
簡單查詢
在搜索引擎中輸入關鍵詞,然後點擊「搜索」就行了,系統很快會返回查詢結果,這是最簡單的查詢方法,使用方便,但是查詢的結果卻不準確,可能包含著許多無用的信息。
使用雙引號用(" ")
給要查詢的關鍵詞加上雙引號(半形,以下要加的其它符號同此),可以實現精確的查詢,這種方法要求查詢結果要精確匹配,不包括演變形式。例如在搜索引擎的文字框中輸入「電傳」,它就會返回網頁中有「電傳」這個關鍵字的網址,而不會返回諸如「電話傳真」之類網頁。
使用加號(+)
在關鍵詞的前面使用加號,也就等於告訴搜索引擎該單詞必須出現在搜索結果中的網頁上,例如,在搜索引擎中輸入「+電腦+電話+傳真」就表示要查找的內容必須要同時包含「電腦、電話、傳真」這三個關鍵詞。
使用減號(-)
在關鍵詞的前面使用減號,也就意味著在查詢結果中不能出現該關鍵詞,例如,在搜索引擎中輸入「電視台-中央電視台」,它就表示最後的查詢結果中一定不包含「中央電視台」。
使用通配符(*和?)
通配符包括星號(*)和問號(?),前者表示匹配的數量不受限制,後者匹配的字元數要受到限制,主要用在英文搜索引擎中。例如輸入 「computer*」,就可以找到「computer、computers、computerised、computerized」等單詞,而輸入 「comp?ter」,則只能找到「computer、compater、competer」等單詞。
使用布爾檢索
所謂布爾檢索,是指通過標準的布爾邏輯關系來表達關鍵詞與關鍵詞之間邏輯關系的一種查詢方法,這種查詢方法允許我們輸入多個關鍵詞,各個關鍵詞之間的關系可以用邏輯關系詞來表示。and,稱為邏輯「與」,用and進行連接,表示它所連接的兩個詞必須同時出現在查詢結果中,例如,輸入「computer and book」,它要求查詢結果中必須同時包含computer和book。or,稱為邏輯「或」,它表示所連接的兩個關鍵詞中任意一個出現在查詢結果中就可以,例如,輸入「computer or book」,就要求查詢結果中可以只有computer,或只有book,或同時包含computer和book。not,稱為邏輯「非」,它表示所連接的兩個關鍵詞中應從第一個關鍵詞概念中排除第二個關鍵詞,例如輸入「automobile not car」,就要求查詢的結果中包含automobile(汽車),但同時不能包含car(小汽車)。near,它表示兩個關鍵詞之間的詞距不能超過n個單詞。在實際的使用過程中,你可以將各種邏輯關系綜合運用,靈活搭配,以便進行更加復雜的查詢。
使用括弧
當兩個關鍵詞用另外一種操作符連在一起,而你又想把它們列為一組時,就可以對這兩個詞加上圓括弧。
使用元詞檢索
大多數搜索引擎都支持「元詞」(metawords)功能,依據這類功能用戶把元詞放在關鍵詞的前面,這樣就可以告訴搜索引擎你想要檢索的內容具有哪些明確的特徵。例如,你在搜索引擎中輸入「title:清華大學」,就可以查到網頁標題中帶有清華大學的網頁。在鍵入的關鍵詞後加上「domainrg」,就可以查到所有以org為後綴的網站。其他元詞還包括:image:用於檢索圖片,link:用於檢索鏈接到某個選定網站的頁面,URL:用於檢索地址中帶有某個關鍵詞的網頁。
區分大小寫
這是檢索英文信息時要注意的一個問題,許多英文搜索引擎可以讓用戶選擇是否要求區分關鍵詞的大小寫,這一功能對查詢專有名詞有很大的幫助,例如:Web專指萬維網或環球網,而web則表示蜘蛛網.
I. 搜索引擎是一種利用網路什麼技術
隨著互聯網的迅猛發展、WEB信息的增加,用戶要在信息海洋里查找自己所需的信息,就象大海撈針一樣,搜索引擎技術恰好解決了這一難題。搜索引擎是指互聯網上專門提供檢索服務的一類網站,這些站點的伺服器通過網路搜索軟體或網路登錄等方式,將Intenet上大量網站的頁面信息收集到本地,經過加工處理建立信息資料庫和索引資料庫,從而對用戶提出的各種檢索作出響應,提供用戶所需的信息或相關指針。用戶的檢索途徑主要包括自由詞全文檢索、關鍵詞檢索、分類檢索及其他特殊信息的檢索。下面以網路搜索機器人為例來說明搜索引擎技術。
搜索引擎優化,通俗理解是:通過總結搜索引擎的排名規律,對網站進行合理優化,使你的網站在網路和Google的排名提高,讓搜索引擎給你帶來客戶。深刻理解是:通過SEO這樣一套基於搜索引擎的營銷思路,為網站提供生態式的自我營銷解決方案,讓網站在行業內占據領先地位,從而獲得品牌收益。同時打響品牌,讓更多人明白其產品。
網路機器人(Robot)又被稱作Spider、Worm或Random,核心目的是為獲取Internet上的信息。一般定義為「一個在網路上檢索文件且自動跟蹤該文件的超文本結構並循環檢索被參照的所有文件的軟體」。機器人利用主頁中的超文本鏈接遍歷WWW,通過URL引用從一個HTML文檔爬行到另一個HTML文檔。網上機器人收集到的信息可有多種用途,如建立索引、HIML文件合法性的驗證、URL鏈接點驗證與確認、監控與獲取更新信息、站點鏡像等。
機器人安在網上爬行,因此需要建立一個URL列表來記錄訪問的軌跡。它使用超文本,指向其他文檔的URL是隱藏在文檔中,需要從中分析提取URL,機器人一般都用於生成索引資料庫。所有WWW的搜索程序都有如下的工作步驟:
機器人從起始URL列表中取出URL並從網上讀取其指向的內容;
從每一個文檔中提取某些信息(如關鍵字)並放入索引資料庫中;
從文檔中提取指向其他文檔的URL,並加入到URL列表中;
重復上述3個步驟,直到再沒有新的URL出現或超出了某些限制(時間或磁碟空間);
給索引資料庫加上檢索介面,向網上用戶發布或提供給用戶檢索。
搜索演算法一般有深度優先和廣度優先兩種基本的搜索策略。機器人以URL列表存取的方式決定搜索策略:先進先出,則形成廣度優先搜索,當起始列表包含有大量的WWW伺服器地址時,廣度優先搜索將產生一個很好的初始結果,但很難深入到伺服器中去;先進後出,則形成深度優先搜索,這樣能產生較好的文檔分布,更容易發現文檔的結構,即找到最大數目的交叉引用。也可以採用遍歷搜索的方法,就是直接將32位的IP地址變化,逐個搜索整個Internet。
量販式搜索引擎優化是一個技術含量很高的網路應用系統。它包括網路技術、資料庫技術動標引技術、檢索技術、自動分類技術,機器學習等人工智慧技術。
J. 搜索引擎的搜索方法有哪些,各有什麼特點
大致可分為四種:全文搜索引擎、元搜索引擎、垂直搜索引擎和目錄搜索引擎。
1、全文搜索引擎
一般網路用戶適用於全文搜索引擎。這種搜索方式方便、簡捷,並容易獲得所有相關信息。但搜索到的信息過於龐雜,因此用戶需要逐一瀏覽並甄別出所需信息。尤其在用戶沒有明確檢索意圖情況下,這種搜索方式非常有效。
2、元搜索引擎
元搜索引擎適用於廣泛、准確地收集信息。不同的全文搜索引擎由於其性能和信息反饋能力差異,導致其各有利弊。元搜索引擎的出現恰恰解決了這個問題,有利於各基本搜索引擎間的優勢互補。而且本搜索方式有利於對基本搜索方式進行全局控制,引導全文搜索引擎的持續改善。
3、垂直搜索引擎
垂直搜索引擎適用於有明確搜索意圖情況下進行檢索。例如,用戶購買機票、火車票、汽車票時,或想要瀏覽網路視頻資源時,都可以直接選用行業內專用搜索引擎,以准確、迅速獲得相關信息。
4、目錄搜索引擎
目錄搜索引擎是網站內部常用的檢索方式。本搜索方式旨在對網站內信息整合處理並分目錄呈現給用戶,但其缺點在於用戶需預先了解本網站的內容,並熟悉其主要模塊構成。總而觀之,目錄搜索方式的適應范圍非常有限,且需要較高的人工成本來支持維護。
(10)關於網路搜索技術表述都有哪些擴展閱讀
搜索引擎的行業應用分為如下幾種形式:
1、 政府機關行業應用
實時跟蹤、採集與業務工作相關的信息來源。全面滿足內部工作人員對互聯網信息的全局觀測需求。及時解決政務外網、政務內網的信息源問題,實現動態發布。快速解決政府主網站對各地級子網站的信息獲取需求。
全面整合信息,實現政府內部跨地區、跨部門的信息資源共享與有效溝通。節約信息採集的人力、物力、時間,提高辦公效率。
2、企業行業應用
實時准確地監控、追蹤競爭對手動態,是企業獲取競爭情報的利器。及時獲取競爭對手的公開信息以便研究同行業的發展與市場需求。為企業決策部門和管理層提供便捷、多途徑的企業戰略決策工具。大幅度地提高企業獲取、利用情報的效率,節省情報信息收集、存儲、挖掘的相關費用,是提高企業核心競爭力的關鍵。
提高企業整體分析研究能力、市場快速反應能力,建立起以知識管理為核心的競爭情報數據倉庫,是提高企業核心競爭力的神經中樞。
3、新聞媒體行業應用
快速准確地自動跟蹤、採集數千家網路媒體信息,擴大新聞線索,提高採集速度。支持每天對數萬條新聞進行有效抓取。監控范圍的深度、廣度可以自行設定。支持對所需內容智能提取、審核。實現互聯網信息內容採集、瀏覽、編輯、管理、發布的一體化。
4、 行業網站應用
實時跟蹤、採集與網站相關的信息來源。及時跟蹤行業的信息來源網站,自動,快速更新網站信息。動態更新信息。實現互聯網信息內容採集、瀏覽、編輯、管理、發布的一體化。針對商務網站提出商務管理模式,大大提高行業網站的商務應用需求。
針對資訊網站分類目錄生成,提出用戶生成網站分類結構。並可以實時增加與更新分類結構。不受級數限制。從而大大利高行業的應用性。提供與CCDC呼叫搜索引擎的廣告合作。建立行業網站聯盟,提高行業網站知名度。
5、網路信息監察與監控
網路輿情系統。網站信息與內容監察與監控系統。