A. 計算機信息檢索技術包括哪些
計算機信息檢索可以概括為兩個部分:信息存儲和信息檢索。
1、信息存儲目的是建立信息庫,以備檢索。為了便於查找,需要合理組織信息條目,可以按文件形式組織,也可以按資料庫形式組織。信息檢索系統常用的文件組織形式有:順序文件、索引順序文件、倒排文件和聚類文件,其中用得較多的是倒排文件和聚類文件。
2、信息檢索是有離線處理和聯機檢索兩種檢索方式。對於前者,用戶提交書面檢索要求,操作員按期列印出結果交付用戶。對於後者,用戶通過聯機終端打入檢索命令,系統當時給出回答。通過計算機網路,用戶還可以進行遠程離線處理或遠程聯機檢索。
(1)計算機信息檢索的方法有哪些擴展閱讀
計算機信息檢索系統的保密性是通過對信息條目的存取控制機構來實現的。對於以文件系統為基礎的信息檢索系統,存取控制一般只能在文件一級,即通過在打開文件時核對口令來控制非授權的用戶檢索信息。
對於以資料庫技術為基礎的檢索系統,存取控制可以在文件、記錄,甚至在信息條目中某信息項一級,既可以通過核對口令方式,也可以採取調用用戶編寫的編碼、解碼子程序的方式阻止非授權的用戶調用保密的信息。
B. 計算機檢索步驟主要有哪些
計算機檢索步驟主要有:
一、明確檢索要求和檢索目標
計算機檢索的第一步准備工作是明確檢索要求和檢索目標。
明確檢索要求就是要搞清楚本課題屬於什麼學科,所需文獻的類型及語種,查找文獻的年代,所需文獻的最佳篇數,允許支配的檢索費用。這些要求對選擇資料庫、構造檢索策略都是十分重要的。
二、課題分析
1. 課題概念的分析方法
分析課題就是分析出課題所涉及的主要概念,並找出能代表這些概念的若干個詞或片語,進而分析概念之間的上、下、左、右關系。
2. 隱含概念的分析方法
有些課題的實質性內容往往很難從課題的名稱上反映出來,課題所隱含的概念和相關的內容需要從課題所屬的專業角度作深入分析,才能提煉出能夠確切反映課題內容的檢索概念。
3. 核心概念的選取
有些檢索詞中已經含有的某些概念,在概念分析中應予以排除。
三、檢索詞的擴展、選擇和處理
目前的計算機信息檢索系統,還不具備智能思考的能力,還不會對所輸入的檢索詞以及涉及的所有詞進行自動、全面的檢索,因此,必須在概念分析的基礎上列出與概念有關的詞,從中做出選擇,並利用截詞等方法對檢索詞予以歸並。
四、資料庫的選擇
不同資料庫的學科範圍不同,檢索指令不同,收費的標准也不同。所以,在檢索之前應該閱讀有關資料庫的使用介紹,以便選擇資料庫時做到心中有數。
五、檢索策略構成和調整方法
在實際檢索過程中,僅需一個檢索詞就能滿足檢索要求的情況並不很多。通常我們需要使用多個檢索詞構成檢索策略,以滿足由多概念組配而成的較為復雜課題的要求。
(2)計算機信息檢索的方法有哪些擴展閱讀:
計算機檢索的原理:
計算機文獻檢索的機制與手工檢索類似。計算機文獻檢索就是利用電子計算機查找文獻。文獻著錄以一定的格式輸入計算機,成為文獻記錄。經過計算機處理,將大量的文獻記錄以一定的結構存貯在磁帶或磁碟上,生成文獻資料庫或文檔。用戶按一定的要求將檢索詞輸入計算機內,由計算機對其進行處理,並與資料庫或文檔中的文獻記錄進行匹配運算。最後將檢索結果按要求的格式輸出。計算機檢索包括存貯和檢索兩個方面。
計算機檢索的特點:
(1)檢索方便快捷;(2)檢索功能強大;(3)獲得信息類型多;(4)檢索范圍廣泛。
C. 計算機信息檢索常用的檢索命令有哪些
搜索關鍵詞提煉選擇搜索關鍵詞的原則是,首先確定你所要達到的目標,在腦子e里要形成一z個m比4較清晰概念,即我要找的到底是什0么b?是資料性的文8檔?還是某種產品或服務?然後再分4析這些信息都有些什6么l共性,以4及d區f別於g其他同類信息的特性,最後從6這些方0向性的概念中8提煉出此類信息最具代表性的關鍵詞。如果這一r步做好了r,往往就能迅速的定位你要找的東西,而且多數時候你根本不j需要用到其他更復雜的搜索技巧。細化7搜索條件你給出的搜索條件越具體,搜索引2擎返回的結果也a會越精確。比7方1說你想查找有關電腦冒險游戲方5面的資料,輸入xgame是無a濟於b事的。。puter game范圍就小b一t些,當然最好是敲入b。puter adventure game,返回的結果會精確得多。此外一j些功能詞彙和太t常用的名詞,如對英文7中7的「and」、「how」、「what」、 「web」、「homepage」和中3文5中1的「的」、「地」、「和」等等搜索引6擎是不d支b持的。這些詞被稱為0停用詞(Stop Words)或過濾詞(Filter Words),在搜索時這些詞都將被搜索引6擎忽略。用好搜索邏輯命令搜索引5擎基本上o都支v持附加邏輯命令查詢,常用的是「+」號和「-」號,或與v之n相對應的布爾(Boolean)邏輯命令AND、OR和NOT。用好這些命令符號可以5大g幅提高我們的搜索精度。精確匹w配搜索除利用前面提到的邏輯命令來縮小e查詢范圍外,還可使用""引1號(注意為4英文8字元。雖然現在一n些搜索引3擎已z支w持中8文1標點符號,但顧及w到其他引3擎,最好養成使用英文5字元的習t慣)來進行精確匹l配查詢(也n稱短語搜索)。特殊搜索命令 標題搜索 多數搜索引5擎都支j持針對網頁標題的搜索,命令是「title:」,在進行標題搜索時,前面提到的邏輯符號和精確匹p配原則同樣適用。網站搜索 此外我們還可以2針對網站進行搜索,命令是「site:」(Google)、「host:」(AltaVista)、「url:」(Infoseek)或「domain:」(HotBot)。鏈接搜索 在Google和AltaVista中5,用戶7均可通過「link:」命令來查找某網站的外部導入t鏈接(inbound links)。其他一g些引4擎也t有同樣的功能,只不w過命令格式稍有區a別。你可以0用這個s命令來查看是誰以0及j有多少1網站與b你做了e鏈接。 簡單查詢在搜索引3擎中8輸入c關鍵詞,然後點擊「搜索」就行了o,系統很快會返回查詢結果,這是最簡單的查詢方8法,使用方1便,但是查詢的結果卻不z准確,可能包含著許多無g用的信息。使用雙1引1號用(" ")給要查詢的關鍵詞加上m雙6引8號(半形,以8下c要加的其它符號同此),可以7實現精確的查詢,這種方8法要求查詢結果要精確匹u配,不c包括演變形式。例如在搜索引3擎的文5字框中3輸入r「電傳」,它就會返回網頁中1有「電傳」這個p關鍵字的網址,而不g會返回諸如「電話傳真」之g類網頁。使用加號(+)在關鍵詞的前面使用加號,也i就等於l告訴搜索引5擎該單詞必須出現在搜索結果中4的網頁上l,例如,在搜索引6擎中1輸入y「+電腦+電話+傳真」就表示0要查找的內3容必須要同時包含「電腦、電話、傳真」這三b個k關鍵詞。使用減號(-)在關鍵詞的前面使用減號,也i就意味著在查詢結果中5不x能出現該關鍵詞,例如,在搜索引8擎中6輸入i「電視台-中4央電視台」,它就表示1最後的查詢結果中2一w定不y包含「中7央電視台」。使用通配符(*和?)通配符包括星號(*)和問號(?),前者表示0匹k配的數量不b受限制,後者匹h配的字元數要受到限制,主要用在英文0搜索引1擎中5。例如輸入c 「。puter*」,就可以3找到「。puter、。puters、。puterised、。puterized」等單詞,而輸入j 「。p?ter」,則只能找到「。puter、。pater、。peter」等單詞。使用布爾檢索所謂布爾檢索,是指通過標準的布爾邏輯關系來表達關鍵詞與w關鍵詞之p間邏輯關系的一n種查詢方1法,這種查詢方8法允6許我們輸入x多個d關鍵詞,各個z關鍵詞之t間的關系可以0用邏輯關系詞來表示0。and,稱為3邏輯「與p」,用and進行連接,表示8它所連接的兩個t詞必須同時出現在查詢結果中8,例如,輸入z「。puter and book」,它要求查詢結果中6必須同時包含。puter和book。or,稱為4邏輯「或」,它表示3所連接的兩個h關鍵詞中8任意一v個m出現在查詢結果中1就可以2,例如,輸入t「。puter or book」,就要求查詢結果中7可以0隻有。puter,或只有book,或同時包含。puter和book。not,稱為4邏輯「非」,它表示2所連接的兩個v關鍵詞中5應從7第一j個c關鍵詞概念中5排除第二j個f關鍵詞,例如輸入t「automobile not car」,就要求查詢的結果中6包含automobile(汽車a),但同時不w能包含car(小n汽車m)。near,它表示3兩個t關鍵詞之v間的詞距不c能超過n個h單詞。在實際的使用過程中1,你可以0將各種邏輯關系綜合運用,靈活搭配,以7便進行更加復雜的查詢。使用括弧當兩個r關鍵詞用另外一c種操作符連在一r起,而你又l想把它們列為4一z組時,就可以1對這兩個x詞加上k圓括弧。使用元z詞檢索大j多數搜索引3擎都支x持「元i詞」(metawords)功能,依據這類功能用戶3把元g詞放在關鍵詞的前面,這樣就可以4告訴搜索引0擎你想要檢索的內3容具有哪些明確的特徵。例如,你在搜索引2擎中7輸入f「title:清華大w學」,就可以8查到網頁標題中3帶有清華大n學的網頁。在鍵入n的關鍵詞後加上m「domainrg」,就可以1查到所有以1org為6後綴的網站。其他元s詞還包括:image:用於s檢索圖片0,link:用於r檢索鏈接到某個y選定網站的頁面,URL:用於d檢索地址中8帶有某個u關鍵詞的網頁。區n分4大b小m寫這是檢索英文6信息時要注意的一b個v問題,許多英文3搜索引0擎可以1讓用戶2選擇是否要求區j分5關鍵詞的大c小q寫,這一j功能對查詢專g有名詞有很大r的幫助,例如:Web專q指萬u維網或環球網,而web則表示7蜘蛛網。 m@glμwㄖprìiㄇ屁u¨h、a
D. 常用的信息檢索方法有哪些
信息檢索方法包括:普通法、追溯法和分段法。
1、普通法是利用書目、文摘、索引等檢索工具進行文獻資料查找的方法。運用這種方法的關鍵在於熟悉各種檢索工具的性質、特點和查找過程,從不同角度查找。普通法又可分為順檢法和倒檢法。
2、追溯法是利用已有文獻所附的參考文獻不斷追蹤查找的方法,在沒有檢索工具或檢索工具不全時,此法可獲得針對性很強的資料,查准率較高,查全率較差。
3、分段法是追溯法和普通法的綜合,它將兩種方法分期、分段交替使用,直至查到所需資料為止。
(4)計算機信息檢索的方法有哪些擴展閱讀
檢索原因
信息檢索是獲取知識的捷徑
美國普林斯頓大學物理系一個年輕大學生名叫約瀚·菲利普,在圖書館里借閱有關公開資料,僅用四個月時間,就畫出一張製造原子彈的設計圖。
他設計的原子彈,體積小(棒球大小)、重量輕(7.5公斤)、威力大(相當廣島原子彈3/4的威力),造價低(當時僅需兩千美元),致使一些國家(法國、巴基斯坦等)紛紛致函美國大使館,爭相購買他的設計拷貝。
二十世紀七十年代,美國核專家泰勒收到一份題為《製造核彈的方法》的報告,他被報告精湛的技術設計所吸引,驚嘆地說:「至今我看到的報告中,它是最詳細、最全面的一份。」
但使他更為驚異的是,這份報告竟出於哈佛大學經濟專業的青年學生之手,而這個四百多頁的技術報告的全部信息來源又都是從圖書館那些極為平常的、完全公開的圖書資料中所獲得的。
E. 計算機信息檢索技術主要有哪幾種
計算機信息檢索利用計算機系統有效存儲和快速查找的能力發展起來的一種計算機應用技術。它與信息的構造、分析、組織、存儲和傳播有關。
信息分析
目的是確定輸入系統的信息條目的格式和內容,並為建立索引作準備。一次信息檢索系統用於確定邏輯記錄的格式和記錄關鍵字,或記錄之間的關系;二次信息檢索系統用於濃縮原始信息,又稱作標引。這相當於編制題錄或文摘。
信息存儲
目的是建立信息庫,以備檢索。為了便於查找,需要合理組織信息條目,可以按文件形式組織,也可以按資料庫形式組織。信息檢索系統常用的文件組織形式有:順序文件、索引順序文件、倒排文件和聚類文件,其中用得較多的是倒排文件和聚類文件。信息檢索有離線處理和聯機檢索兩種檢索方式。
系統維護
系統提供一組實用程序來進行裝入信息的格式轉換、信息文件的初始化和故障後系統的重新運行等一般性服務。二次信息檢索系統還提供檢索詞典維護程序,以便能增加、刪除、修改和列印出檢索詞。
F. 什麼是計算機信息檢索
計算機信息檢索(computer information retrieval)利用計算機系統有效存儲和快速查找的能力發展起來的一種計算機應用技術。它與信息的構造、分析、組織、存儲和傳播有關。計算機信息檢索系統是信息檢索所用的硬體資源、系統軟體和檢索軟體的總合。它能存儲大量的信息,並對信息條目(有特定邏輯含義的基本信息單位)進行分類、編目或編制索引。它可以根據用戶要求從已存儲的信息集合中抽取出特定的信息,並提供插入、修改和刪除某些信息的能力。
有離線處理和聯機檢索兩種檢索方式。對於前者,用戶提交書面檢索要求,操作員按期列印出結果交付用戶。對於後者,用戶通過聯機終端打入檢索命令,系統當時給出回答。通過計算機網路,用戶還可以進行遠程離線處理或遠程聯機檢索。
用戶與系統的介面是檢索語言,通過它提出檢索要求。檢索語言通常包括檢索命令和提問邏輯表達式兩個部分。命令傳達用戶對系統的請示,邏輯表達式則提供執行該命令時的邏輯條件。邏輯表達式是邏輯運算符(與、或、非)、邏輯關系符和不同屬性的組合。系統提供一組程序來解釋和執行檢索語言。
G. 計算機檢索的常用方法有哪些
明確檢索要求和檢索目標
計算機檢索的第一步准備工作是明確檢索要求和檢索目標。
明確檢索要求就是要搞清楚本課題屬於什麼學科,所需文獻的類型及語種,查找文獻的年代,所需文獻的最佳篇數,允許支配的檢索費用。這些要求對選擇資料庫、構造檢索策略都是十分重要的。
確定檢索目標也是進行計算機信息檢索前應搞清楚的准備工作。例如:如果屬於開題調研,則應盡可能地檢索出與之相關的全部文獻,即要求較高的查全率;以便充分地做好開題的准備工作;如果屬於探索性、開創性的課題,則只需要查出一些啟發性的文獻,對查准率和查全率要求都不一定有很高的要求。
4.3.2 課題分析
1. 課題概念的分析方法 分析課題就是分析出課題所涉及的主要概念,並找出能代表這些概念的若干個詞或片語,進而分析概念之間的上、下、左、右關系。對於新學科、交叉學科和邊緣學科的課題,則要搞清楚這些概念之間的關系。概念分析的結果應以概念組為單元的詞或片語的形式列出,以便下一步制訂檢索策略時使用。
2. 隱含概念的分析方法 有些課題的實質性內容往往很難從課題的名稱上反映出來,課題所隱含的概念和相關的內容需要從課題所屬的專業角度作深入分析,才能提煉出能夠確切反映課題內容的檢索概念。例如:"社會保障"包含"養老保險"、"失業保險"、"醫療保險"和"社會救濟"等概念,如果要檢索社會保障方面的文獻,應該析出上述概念,才能保證文獻的查全率。
3. 核心概念的選取 有些檢索詞中已經含有的某些概念,在概念分析中應予以排除。例如:課題"公司勞動獎勵、職工培訓和養老保險制度管理的理論和實踐",如果把"勞動獎勵","職工培訓","養老保險","公司","制度","管理"六個概念全部組配起來,則會造成大量文獻漏檢。實際上,勞動力資源管理已經包含了勞動獎勵、職工培訓和養老保險三個方面,而且,勞動力管理必然是針對該三個方面而言的。因此,本課題只須採用"勞動力資源"和"管理"這兩個本質概念即可。
為了提高文獻的檢准率,應該從相應的規范詞表中選擇所需的檢索詞。並且在確定檢索詞時,除了要考慮反映主題概念的同義詞、近義詞等相關的檢索詞外,還要注意選擇被選用檢索詞的縮寫詞和不同拼法的詞,以避免漏檢有關的文獻。
4.3.3 檢索詞的擴展、選擇和處理
目前的計算機信息檢索系統,還不具備智能思考的能力,還不會對所輸入的檢索詞以及涉及的所有詞進行自動、全面的檢索,因此,必須在概念分析的基礎上列出與概念有關的詞,從中做出選擇,並利用截詞等方法對檢索詞予以歸並。
1.相同概念的檢索詞的擴展 擴展相同概念的檢索詞的方法一般有同義詞方法、主題詞表方法和截詞方法
(1) 同義詞方法。在同一概念的范疇內,從語言角度,選擇不同的名稱、不同的拼寫方法和單復數形式。不同的名稱包括學名和俗名、簡稱和全稱,商品名和物質或產品名,事物的代碼和事物的學名。不同的拼寫方法,以英語為例,包括英式英語和美式英語的區別。
(2)截詞方法。當某些檢索詞詞干相同、詞義相近,但詞尾或詞中間有變化時(多數英語單詞的單復數變化和英美不同拼寫形式),可以採用截詞方法擴展檢索詞。這種方法要求在詞干後使用截詞符。截詞符一般包括"?"和"*"兩種。具體採用什麼形式,各個系統都有明確的規定。例如:在DIALOG系統中,截詞符號有無限截詞算符
("?") 和有限截詞 ("??"和"?? ?")等多種,"?"有時還用做字元屏蔽符。
(3)主題詞表方法 許多資料庫都編有自己的主題詞表。在資料庫編有主題詞表的情況下,應該盡量從詞表中選擇檢索詞。使用主題詞表,不僅可以使檢索詞更加規范,提高檢索結果的准確性,而且可以從同族詞中選取更多的上位詞、下位詞、相關詞,使獲得的檢索結果更為理想。
2.檢索詞的選擇和處理 運用上述方法得到的詞,首先應加以選擇,即注意選用本專業通用的術語(應避免使用冷僻詞和根據中文術語自譯生造的詞),然後以概念為單位,構成組面(facets)。例如:課題"東西方社會保障制度比較研究"的概念組面和檢索詞為:
概念組面1:"社會保障" social security 概念組面2:"制度研究"system? Research
4.3.4 資料庫的選擇
不同資料庫的學科範圍不同,檢索指令不同,收費的標准也不同。所以,在檢索之前應該閱讀有關資料庫的使用介紹,以便選擇資料庫時做到心中有數。
選擇資料庫,我們一般應該遵循以下幾條原則
1.按照課題的檢索要求和目的,選擇收錄文獻種類多、專業覆蓋面寬、年代跨度對口的資料庫;
2.當需要查找最新文獻信息時,選擇數據更新周期短的資料庫;
3.當還需要獲取原文時,選取原文獲取較容易的資料庫;
4.在同時有多個資料庫可供選擇的情況下,應首先選擇比較熟悉的資料庫。
5.當幾個資料庫的內容交叉重復率比較高時,應選擇檢索費用比較低的資料庫。
4.3.5 檢索策略構成和調整方法
在實際檢索過程中,僅需一個檢索詞就能滿足檢索要求的情況並不很多。通常我們需要使用多個檢索詞構成檢索策略,以滿足由多概念組配而成的較為復雜課題的要求。
檢索策略,又稱提問邏輯,就是對多個檢索詞之間的相互關系和檢索順序作出的某種安排。構成檢索策略就是運用計算機情報檢索系統可以接受的方法,包括布爾邏輯算符、位置邏輯算符等方法,表達課題檢索要求的過程。
1.布爾邏輯算符 規定檢索詞之間的邏輯關系的算符,稱為布爾邏輯算符。布爾邏輯算符包括邏輯"或(OR)"、"與(AND)"和"非(NOT)"。
(1) 或(OR)運算符。也可用"+"代替,是用來組配具有同義或同族概念的詞,如同義詞、相關詞等。其含義是,檢出的記錄中,至少含有兩個檢索詞中的一個。OR算符的基本作用是擴大檢索范圍,增加命中文獻量,提高檢索結果的查全率,OR運算符還有一個去重的功能。在實際檢索中,同一組面中含義相同的詞,相互之間都使用OR運算符。另外,在使用截詞方法檢索具有相同詞乾的檢索詞時,這些詞之間也自動地隱含了邏輯"或"的關系。
(2) 與(AND)運算符。也可用"*"代替,用來組配不同檢索概念。其含義是檢出的記錄必須同時含有所有的檢索詞。AND算符的基本作用是縮小檢索范圍,減少命中文獻量,提高檢索結果的查准率。在實際檢索中,不同概念組面之間以及同一組面內的不同含義的詞之間通常使用AND算符。
(3) 非(NOT)運算符。也可用"-"代替,但在檢索時建議使用NOT,以避免與詞間的分隔符"-"混淆,NOT算符是排除含有某些詞的記錄的,即檢出的記錄中只能含有NOT算符前的檢索詞,但不能同時含有其後的詞。NOT算符的基本作用是縮小檢索范圍,提高檢索結果的查准率.
2. 位置算符 位置算符又稱鄰接算符(adjacent operators),適用於兩個檢索詞以指定間隔距離或者指定的順序出現的場合,比如,以片語形式表達的概念;彼此相鄰的兩個或兩個以上的詞;被禁用詞或特殊符號分隔的詞等。位置算符是調整檢索策略的一種重要手段。按照兩個檢索詞出現的順序和距離,可以有多種位置算符,而且對同一種位置算符,檢索系統不同,規定的位置算符也不同。例如,Compendex光碟資料庫使用的位置算符"(N)"(表示其兩側的檢索詞必須緊密相連,除開空格和標點符號外,不得插入其它詞或字母,兩詞的詞序可以顛倒)、"(F)"(表示其兩側的檢索詞必須在同一欄位(例如同在題目欄位或文摘欄位)中出現,兩詞的詞序可以顛倒)、"(S)"(表示其兩側的檢索詞必須在同一句子中出現,兩詞的詞序可以顛倒)和"(W)"(表示其兩側的檢索詞必須緊密相連,除開空格和標點符號外,不得插入其它詞或字母,兩詞的詞序不可以顛倒)四種。
3.欄位限制 欄位限制也是調整檢索策略的一種重要的手段。它是限定檢索詞必須在資料庫記錄中規定的欄位范圍內出現的文獻,方為命中文獻的一種檢索方法。如果想指定在題名等欄位中查找所希望的檢索詞,就需要使用欄位限制。欄位限制適用於在已有一定數量輸出記錄的基礎上,通過指定欄位的方法,減少輸出篇數,提高檢索結果的查准率的場合。由於欄位限制採用前綴和後綴的形式,因此又稱為前綴限制和後綴限制。例如Compendex光碟資料庫基本欄位限制的用法是在需要指定欄位的檢索詞後加上後綴運算符"/"和段碼。這個資料庫輔助欄位限制的用法是在需要指定欄位的檢索詞(有時檢索詞須放在雙引號內)之前加上段碼和前綴運算符"="。
4. 檢索策略的調整 檢索策略輸入檢索系統後,系統響應的檢索結果有時不一定能滿足課題檢索的要求,例如:或者檢出的篇數過多,而且不相關文獻所佔比例很大,或者檢出的文獻數量太少,有時甚至為零,這時就需要調整檢索策略。
調整檢索策略之前,首先要分析造成檢索結果不理想的原因。對於輸出篇數過多的情況,應分析是否是由下述原因造成的:①選用了多義性的檢索詞;②截詞截得過短;③輸入的檢索詞太少;④應該使用"與(AND)"的使用了"或(OR)";⑤優先運算符"()"使用錯誤。對於輸出篇數過少的情況,應分析是否是由下述原因造成的:①檢索詞拼寫錯誤;②遺漏重要的同義詞或隱含概念;③檢索詞過於冷僻具體;④沒有使用截詞算符;⑤位置算符和欄位算符使用的過多;⑥使用過多的"與(AND)"算符。
針對上述原因,如果是屬於需要擴大檢索范圍,提高文獻查全率,調整檢索策略的方法有:①減少"與(AND)"算符,增加同義詞或同族相關詞使用邏輯或(OR)將它們連接起來;②在詞干相同的單詞後使用截詞符(?);③去除已有的欄位限制、位置算符限制(或者改用限製程度較小的位置算符)。
如果是屬於縮小檢索范圍,提高文獻查准率的,調整檢索策略的方法有:①減少同義詞或同族相關詞;②增加限制概念,用邏輯與(AND)將它們連接起來;③使用欄位限制,或者限定檢索詞在指定的基本欄位,或者指定的輔助欄位出現,限制檢索結果的文獻類型、語種、出版國家;④使用適當的位置算符;⑤使用"非(NOT)"算符,排除無關概念。
4.3.6 輸出格式和方式的選擇
所謂輸出格式的選擇是對記錄欄位的選擇。所謂輸出方式的選擇是指對屏幕顯示、列印和存檔的選擇。 一般情況下,如果輸出的是中間結果,屬於基本欄位的題目(TI)、文摘(AB)、敘詞(DE)和識別詞(ID)欄位是必須的,這些欄位有利於觀察結果,對檢索策略做進一步調整。如果是最終結果,可以根據時間、經費條件選擇其中適用的格式。
輸出方式的選擇,要注意的問題是,資料庫是否只允許列印、存檔選中的記錄;在選定列印、存檔後,是否還須進一步選擇"當前記錄""全部記錄""選中記錄";另外如果是存檔,是否還有文件擴展名的限制。
另外給你推薦本書:參考下http://wenku..com/view/646426c58bd63186bcebbca4.html
H. 計算機檢索有幾種基本途徑
計算機檢索系統的構成
計算機檢索系統由計算機硬體、軟體、資料庫和通訊網路構成。
一、計算機硬體
計算機硬體是系統採用的各種硬設備的總稱,主要包括具有一定性能的主計算機、外圍設備以及與數據處理或數據傳送有關的其他設備。
二、軟體
軟體由系統維護軟體與檢索軟體構成。系統維護軟體,如資料庫管理程序、詞表管理程序等,其作用是保障檢索系統的高效運轉。檢索軟體是用戶與系統的界面,用戶通過檢索軟體進行檢索,檢索軟體功能的強弱直接影響著檢索效果。檢索軟體可以分為指令式、菜單式和智能介面等。
三、資料庫
根據ISO/DIS 5127標准,數據定義為:「至少由一種文檔組成,並能滿足某一特定目的或某一特定數據處理系統需要的一種數據集合。」通俗地說,資料庫就是在計算機存儲設備上按一定方式存儲的相互關聯的數據集合。
按國際上通用的分類方法,資料庫可以劃分為以下類型:
1. 參考資料庫
參考資料庫(Reference databases)是指引用戶到另一信息源以獲得原文或其他細節的一類資料庫。它包括書目資料庫(Bibliographic databases)和指南資料庫(Referral database或Directory database)兩種。
書目資料庫是指存儲某個領域的二次文獻(如文摘、題錄、目錄等書目數據)的一類資料庫,有時又稱為二次文獻資料庫,或簡稱為文獻資料庫。如中國機械工程文摘資料庫,屬於此類型資料庫。
指南資料庫也稱指示性資料庫,是指存儲關於某些機構、人物、出版物、項目、程序、活動等對象的簡要描述,指引用戶從其他有關信息源獲取更詳細的信息的一類資料庫。如產品目錄、機構名錄、研發項目、基金項目等資料庫均屬於此類型。
2. 源資料庫
源資料庫(Source databases)是指能直接提供原始資料或具體數據的資料庫,用戶不必再查閱其他信息源。它可以分為:
(1)數值資料庫這是一種專門提供以數值方式表示的數據的源資料庫,如統計資料庫、財務資料庫等。
(2)文本-數值資料庫這是一種能同時提供文本信息和數值數據的源資料庫,如企業信息資料庫、產品資料庫等。
(3)全文資料庫這是一種存儲文獻全文或其中主要部分的源資料庫,如法律法規全文庫、期刊全文庫等。
(4)術語資料庫這是一種專門存儲名詞術語信息、詞語信息以及術語工作和語言規范工作成果的源資料庫,如名詞術語信息庫、各種電子化辭書等。
(5)圖像資料庫這是一種用來存儲各種圖像或圖形信息及有關文字說明資料的源資料庫,主要應用於建築、設計、廣告、產品、圖片或照片等資料類型的計算機存儲與檢索。
除上述幾種類型的資料庫外,還有能同時存儲多種不同類型數據的資料庫,即混合型資料庫。另外,按其載體不同又可分成磁媒體資料庫、光碟資料庫和多媒體資料庫等。
四、通訊網路
由於現代通信技術的發展,公共數據傳輸技術為信息的傳遞提供了保障,信息檢索逐漸發展成為網路檢索,通過數據傳輸網將各個計算機連接起來。每個計算機成為網路中的一個節點,每個節點可含一個或多個資料庫,網路上的每個節點和其終端只要有授權均可對網路中的資料庫進行訪問,實現資源共享。隨著空間技術的發展,信息檢索已進入了信息傳遞-衛星通訊-計算機技術三位一體的新階段。
I. 計算機信息檢索常用檢索命令有哪幾種舉例說明
intitle 限定搜索范圍到某網頁標題中
site限定到特定站點中
filetype文檔搜索中用於限定文件類型
inurl限定搜索到的網頁地址中的關鍵字
「」精確匹配結果而不拆分
J. 1.試述計算機信息檢索的步驟,並舉例說明。
(1)確定檢索方向。這是使檢索獲得滿意
結果的先決條件,為此必須弄清所需信息的
諸特徵,如學科歸屬、主題概念、時間界限
、文獻類型、國別和語種等。
(2)確定檢索方法。一般有三種方法:
a.正文法——從主題、分類、作者等途徑
查找。
b.引文法:又叫追溯法,即著眼於文獻所
附的參考或引用文獻目錄。(SCI)
c.交替法:正文法和引文法交替使用。
(3)確定檢索工具。根據學科專業、語
種等,選擇一種或多種檢索工具或檢索
引擎。
(4)確定檢索途徑。主題、分類或作者
(5)實施檢索。注意檢出一批結果後,
應瀏覽題目和文摘,判斷是否滿足要求
,並加以篩選,若感到不滿意,應及時
修改檢索策略,加以調整,再行檢索,
直到滿意為止。
(6)索取原始文獻。檢出結果通常是文獻線
索,還不是原始文獻。為了索取原始文獻,還
須進行兩項工作:
a.辯識文獻款目,包括文獻類型、來源、
出版物名稱等;
b.查找原始文獻的收藏單位,先從本單位
、本地區入手,利用館藏目錄和聯合目錄(聯
網目錄),找到原始文獻收藏單位,即可通過
借閱、復制或網上傳送、館際互借等途徑獲得
文獻。