導航:首頁 > 信息系統 > 影響信息檢索的因素有哪些

影響信息檢索的因素有哪些

發布時間:2022-10-23 04:51:58

① 影響文獻檢索效果的因素

判定一個檢索系統的優劣,主要從質量、費用和時間三方面來衡量。因此,對計算機網路信息檢索的效果評價,也應該從這三個方面進行。質量標准主要通過查全率與查准率進行評價。費用標准即檢索費用是指用戶為檢索課題所投入的費用。時間標準是指花費時間,包括檢索准備時間、檢索過程時間、獲取文獻時間等。查全率和查准率是判定檢索效果的主要標准,而後兩者相對來說要次要些。
查全率是指系統在進行某一檢索時,檢出的相關文獻量與系統文獻庫中相關文獻總量的比率,它反映該系統文獻庫中實有的相關文獻量在多大程度上被檢索出來。
查全率 = [ 檢出相關文獻量 / 文獻庫內相關文獻總量 ] × 100%

查准率是指系統在進行某一檢索時,檢出的相關文獻量與檢出文獻總量的比率,它反映每次從該系統文獻庫中實際檢出的全部文獻中有多少是相關的。
查准率 = [ 檢出相關文獻量 / 檢出文獻總量 ] × 100%

影響檢索效果的因素

查全率與查准率是評價檢索效果的兩項重要指標,查全率和查准率與文獻的存儲與信息檢索兩個方面是直接相關的,也就是說,與系統的收錄范圍、索引語言、標引工作和檢索工作等有著非常密切的關系。
(1) 影響查全率的因素
影響查全率的因素從文獻存儲來看,主要有:文獻庫收錄文獻不全;索引詞彙缺乏控制和專指性;詞表結構不完整;詞間關系模糊或不正確;標引不詳;標引前後不一致;標引人員遺漏了原文的重要概念或用詞不當等。此外,從情報檢索來看,主要有:檢索策略過於簡單;選詞和進行邏輯組配不當;檢索途徑和方法太少;檢索人員業務不熟練和缺乏耐心;檢索系統不具備截詞功能和反饋功能,檢索時不能全面地描述檢索要求等。
(2) 影響查准率的因素
影響查准率的因素主要有:索引詞不能准確描述文獻主題和檢索要求;組配規則不嚴密;選詞及詞間關系不正確;標引過於詳盡;組配錯誤;檢索時所用檢索詞(或檢索式)專指度不夠,檢索麵寬於檢索要求;檢索系統不具備邏輯"非"功能和反饋功能;檢索式中允許容納的詞數量有限;截詞部位不當,檢索式中使用邏輯"或"不當等等。
實際上,影響檢索效果的因素是非常復雜的。根據國外有關專家所做的實驗表明,查全率與查准率是呈互逆關系的。要想做到查全,勢必會要對檢索范圍和限制逐步放寬,則結果是會把很多不相關的文獻也帶進來,影響了查准率。企圖使查全率和查准率都同時提高,不是很容易的。強調一方面,忽視另一方面,也是不妥當的。應當根據具體課題的要求,合理調節查全率和查准率,保證檢索效果。

如果你需要相關論文可登陸維普或知網查找有關關鍵詞,一般大學圖書館和公共圖書館免費提供論文下載服務。

可供選擇關鍵詞:查全率 查准率 資料庫 信息檢索系統 性能評價 互逆性 互順關系 等

參考書目:
《現代信息查詢與利用》(大學教材)
作 者: 趙靜
出 版 社: 科學出版社
ISBN : 703013626
原 價: ¥30

其他書目查找可選關鍵詞:信息 檢索 利用 文獻 等

可利用國家圖書館書目查詢系統或者calis聯合目錄進行查詢。
http://210.82.118.4:8080/F
http://opac.calis.e.cn/simpleSearch.do

② 信息檢索三大要素

信息檢索的四個要素| [<<] [>>] 1 信息檢索的前題----信息意識
所謂信息意識,簡單地說,是人們利用信息系統獲取所需信息的內在動因,具體表現為對信息的敏感性、選擇能力和消化吸收能力。信息意識含有信息認知、信息情感和信息行為傾向三個層面。
信息素養(素質)(Information Literacy)一詞最早是由美國信息產業協會主席Paul Zurkowski在1974年給美國政府的報告中提出來的。他認為:信息素質是人們在工作中運用信息、學習信息技術、利用信息解決問題的能力。
2 信息檢索的基礎----信息源(信息的來源)
信息源的構成
按文獻載體分----印刷型、縮微型、機讀型、聲像型
按文獻內容和加工程度分--一次信息、二次信息、三次信息
按出版形式分----圖書、報刊、研究報告、會議信息、專利信 息、統計數據、政府出版物、檔案、學位論文、標准信息(它們被認為是十大信息源,其中後8種被稱為特種文獻。教育信息資源主要分布在教育類圖書、專業期刊、學位論文等不同類型的出版物中)
3 信息檢索的核心----信息獲取能力
(1) 了解各種信息來源
(2)掌握檢索語言
(3 )熟練使用檢索工具
(4)能對檢索效果進行判斷和評價
判斷檢索效果的兩個指標:
查全率=被檢出相關信息量/相關信息總量(%)
查准率=被檢出相關信息量/被檢出信息總量(%)
4 信息檢索的關鍵:信息利用
社會進步的過程就是一個知識不斷的生產—流通—再生產的過程。
為了全面、有效地利用現有知識和信息,在學習、科學研究和生活過程中,信息檢索的時間比例逐漸增高。
獲取學術信息的最終目的是通過對所得信息的整理、分析、歸納和總結,根據自己學習、研究過程中的思考和思路,將各種信息進行重組,船造出新的知識和信息,從而達到信息激活和增值的目的。

③ 在決定檢索效率的因素最重要的是

試述信息檢索效率的影響因素及改善方法席捲而來的網際網路正將整個世界的豐富信息資源帶到每一個人的面前,成為知識經濟時代不可缺少的重要工具。在網際網路上,幾乎可以找到個人所需的任何信息。為了幫助每個人順利檢索和查找網路信息,網路信息檢索應運而生。一、網路信息檢索的現狀1990年以前,網路信息檢索的現狀是沒有任何人能夠檢索互聯網上的信息,應該說,所有的網路信息檢索工具都是從1990年的Alan Emtage等人發明的Archie開始的,雖然它當時只可以實現簡單意義上的FTP文件檢索。隨著World Wide Web的出現和發展,基於網頁的信息檢索工具出現並迅速發展起來。1995年,基於網路信息檢索工具本身的檢索工具元搜索引擎由美國華盛頓大學的Eric Selberg人等發明。伴隨著網路技術的發展,網路信息檢索工具也取得了十足的發展,網路信息檢索的效率問題也越來越得到了人們的重視。關於信息檢索效率的內涵,莫斯在莫斯定律(1960)中指出:「當讀者在使用某信息檢索系統時,若取得信息時手續的麻煩和不便程度大於其得到該信息時,該檢索系統就會趨向於無人使用。」信息檢索效率,不僅是影響信息檢索系統價值的主要因素,還是人們評價信息檢索質量的重要指標。信息檢索效率是指全、准、快、便、省(檢全率、檢准率、檢索方便性、檢索成本與效益),最主要的是「全」和「准」。簡而言之,信息檢索效率,主要是指查找所需信息的全、准程度,即檢全率和檢准率。檢全率是指檢出相關信息記錄數與系統中全部相關
2020期刊投稿目錄大全,錄用率高,正規可查
廣告 專業期刊投稿平台! 一條龍指導發表,流程便捷,千家合作正規期刊可選, 查看詳情 >
EditSprings英文潤色,專注潤色二十年,品質有保障
廣告 EditSprings擁有 英文論文潤色,學術翻譯,論文預審,投稿期刊推薦等多項服務 查看詳情 >
期刊類期刊研快速發表
廣告 快速發表期刊類期刊,主編直接收稿,為您提供產業經濟研發快速發表完美解決方案。 查看詳情 >
「加急綠色通道」核心期刊發表無後顧之憂
廣告 作為一個核心期刊發表平台,與幾百家期刊保持密切合作關系。 查看詳情 >
加入VIP免費專享
VIP文檔免費下 付費文檔8折購 文檔格式隨意轉

剩餘8頁未讀,繼續閱讀
建築工地臨邊防護欄廠家直銷 量大價優
漢坤實業建築工地臨邊防護欄廠家直銷,量大價優,你正需要,我正專業,還實惠。
廣告查看詳情
版權說明:本文檔由用戶提供並上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
VIP專享下載
收藏
分享
轉換
APP
客戶端打開
VIP去廣告
你可能關注的內容

PaperRay畢業論文查重軟體高校指定安全靠譜查重平台。
廣告
PaperRay查重論文是首款三端電腦端,移動端,小程序查重軟體,

2021醫學影像學試題庫題庫免費下載!
廣告
歷年真題,模擬試題,考前壓題,全真模擬考試環境,原題命中率高,
相關推薦

試述信息檢索效率的影響因素及改善方法
4.4分 1999閱讀

網路信息檢索的影響因素及檢索策略
4.4分 1165閱讀

信息檢索效率的影響因素及改善方法
3.3分 534閱讀

網路信息檢索方法與策略分析
4.4分 6251閱讀

信息檢索效率的探討
4.5分 1522閱讀

網路環境下的信息檢索效率
4.3分 425閱讀

2012年5月課程考試《信息檢索與利用》論文卷紙
3.4分 630閱讀

高一數學暑假作業 2-1
4.2分 9220閱讀

九年級數學寒假作業1(無答案)
4.2分 1W 閱讀
暫無評論


0 /240

發布評論

關於作者

幸運的雨田 文庫新人
文檔

粉絲

等級

關注 個人主頁
進入專區
數據恢復
嗨格式電腦數據恢復
電腦恢復教程手機恢復教程
看過該文檔的人還看了

信息檢索的常用方法
相關文檔約112萬篇
第二章信息檢索方法
相關文檔約282萬篇

④ 分析影響信息檢索效率的因素有哪些,如何提高信息

對計算機網路信息檢索的效果評價,也應該從這三個方面進行.質量標准主要通過查全率與查准率進行評價.費用標准即檢索費用是指用戶為檢索課題所投入的費用.時間標準是指花費時間,包括檢索准備時間、檢索過程時間、獲取文獻時間等.查全率和查准率是判定檢索效果的主要標准,而後兩者相對來說要次要些.
查全率是指系統在進行某一檢索時,檢出的相關文獻量與系統文獻庫中相關文獻總量的比率,它反映該系統文獻庫中實有的相關文獻量在多大程度上被檢索出來.
查全率 = [ 檢出相關文獻量 / 文獻庫內相關文獻總量 ] × 100%
查准率是指系統在進行某一檢索時,檢出的相關文獻量與檢出文獻總量的比率,它反映每次從該系統文獻庫中實際檢出的全部文獻中有多少是相關的.
查准率 = [ 檢出相關文獻量 / 檢出文獻總量 ] × 100%
影響檢索效果的因素
查全率與查准率是評價檢索效果的兩項重要指標,查全率和查准率與文獻的存儲與信息檢索兩個方面是直接相關的,也就是說,與系統的收錄范圍、索引語言、標引工作和檢索工作等有著非常密切的關系.
(1) 影響查全率的因素
影響查全率的因素從文獻存儲來看,主要有:文獻庫收錄文獻不全;索引詞彙缺乏控制和專指性;詞表結構不完整;詞間關系模糊或不正確;標引不詳;標引前後不一致;標引人員遺漏了原文的重要概念或用詞不當等.此外,從情報檢索來看,主要有:檢索策略過於簡單;選詞和進行邏輯組配不當;檢索途徑和方法太少;檢索人員業務不熟練和缺乏耐心;檢索系統不具備截詞功能和反饋功能,檢索時不能全面地描述檢索要求等.
(2) 影響查准率的因素
影響查准率的因素主要有:索引詞不能准確描述文獻主題和檢索要求;組配規則不嚴密;選詞及詞間關系不正確;標引過於詳盡;組配錯誤;檢索時所用檢索詞(或檢索式)專指度不夠,檢索麵寬於檢索要求;檢索系統不具備邏輯"非"功能和反饋功能;檢索式中允許容納的詞數量有限;截詞部位不當,檢索式中使用邏輯"或"不當等等.
實際上,影響檢索效果的因素是非常復雜的.根據國外有關專家所做的實驗表明,查全率與查准率是呈互逆關系的.要想做到查全,勢必會要對檢索范圍和限制逐步放寬,則結果是會把很多不相關的文獻也帶進來,影響了查准率.企圖使查全率和查准率都同時提高,不是很容易的.強調一方面,忽視另一方面,也是不妥當的.應當根據具體課題的要求,合理調節查全率和查准率,保證檢索效果.

⑤ 造成互聯網上信息檢索困難的相關因素有哪些

按照信息搜集方法和服務提供方式的不同,搜索引擎系統可以分為三大類:

1.目錄式搜索引擎:以人工方式或半自動方式搜集信息,由編輯員查看信息之後,人工形成信息摘要,並將信息置於事先確定的分類框架中。信息大多面向網站,提供目錄瀏覽服務和直接檢索服務。該類搜索引擎因為加入了人的智能,所以信息准確、導航質量高,缺點是需要人工介入、維護量大、信息量少、信息更新不及時。這類搜索引擎的代表是:YAHOO、LookSmart、Open Directory、Go Guide等。

2.機器人搜索引擎:由一個稱為蜘蛛(Spider)的機器人程序以某種策略自動地在互聯網中搜集和發現信息,由索引器為搜集到的信息建立索引,由檢索器根據用戶的查詢輸入檢索索引庫,並將查詢結果返回給用戶。服務方式是面向網頁的全文檢索服務。該類搜索引擎的優點是信息量大、更新及時、毋需人工干預,缺點是返回信息過多,有很多無關信息,用戶必須從結果中進行篩選。這類搜索引擎的代表是:AltaVista、Northern Light、Excite、Infoseek、Inktomi、FAST、Lycos、Google;國內代表為:"天網"、悠遊、OpenFind等。

3.元搜索引擎:這類搜索引擎沒有自己的數據,而是將用戶的查詢請求同時向多個搜索引擎遞交,將返回的結果進行重復排除、重新排序等處理後,作為自己的結果返回給用戶。服務方式為面向網頁的全文檢索。這類搜索引擎的優點是返回結果的信息量更大、更全,缺點是不能夠充分使用所使用搜索引擎的功能,用戶需要做更多的篩選。這類搜索引擎的代表是WebCrawler、InfoMarket等。

性 能 指 標 我們可以將WEB信息的搜索看作一個信息檢索問題,即在由WEB網頁組成的文檔庫中檢索出與用戶查詢相關的文檔。所以我們可以用衡量傳統信息檢索系統的性能參數-召回率(Recall)和精度(Pricision)衡量一個搜索引擎的性能。 召回率是檢索出的相關文檔數和文檔庫中所有的相關文檔數的比率,衡量的是檢索系統(搜索引擎)的查全率;精度是檢索出的相關文檔數與檢索出的文檔總數的比率,衡量的是檢索系統(搜索引擎)的查准率。對於一個檢索系統來講,召回率和精度不可能兩全其美:召回率高時,精度低,精度高時,召回率低。所以常常用11種召回率下11種精度的平均值(即11點平均精度)來衡量一個檢索系統的精度。對於搜索引擎系統來講,因為沒有一個搜索引擎系統能夠搜集到所有的WEB網頁,所以召回率很難計算。目前的搜索引擎系統都非常關心精度。 影響一個搜索引擎系統的性能有很多因素,最主要的是信息檢索模型,包括文檔和查詢的表示方法、評價文檔和用戶查詢相關性的匹配策略、查詢結果的排序方法和用戶進行相關度反饋的機制。

主 要 技 術:一個搜索引擎由搜索器、索引器、檢索器和用戶介面等四個部分組成。

1.搜索器 搜索器的功能是在互聯網中漫遊,發現和搜集信息。它常常是一個計算機程序,日夜不停地運行。它要盡可能多、盡可能快地搜集各種類型的新信息,同時因為互聯網上的信息更新很快,所以還要定期更新已經搜集過的舊信息,以避免死連接和無效連接。目前有兩種搜集信息的策略: 從一個起始URL集合開始,順著這些URL中的超鏈(Hyperlink),以寬度優先、深度優先或啟發式方式循環地在互聯網中發現信息。這些起始URL可以是任意的URL,但常常是一些非常流行、包含很多鏈接的站點(如Yahoo!)。 將Web空間按照域名、IP地址或國家域名劃分,每個搜索器負責一個子空間的窮盡搜索。 搜索器搜集的信息類型多種多樣,包括HTML、XML、Newsgroup文章、FTP文件、字處理文檔、多媒體信息。 搜索器的實現常常用分布式、並行計算技術,以提高信息發現和更新的速度。商業搜索引擎的信息發現可以達到每天幾百萬網頁。

2.索引器 索引器的功能是理解搜索器所搜索的信息,從中抽取出索引項,用於表示文檔以及生成文檔庫的索引表。 索引項有客觀索引項和內容索引項兩種:客觀項與文檔的語意內容無關,如作者名、URL、更新時間、編碼、長度、鏈接流行度(Link Popularity)等等;內容索引項是用來反映文檔內容的,如關鍵詞及其權重、短語、單字等等。內容索引項可以分為單索引項和多索引項(或稱短語索引項)兩種。單索引項對於英文來講是英語單詞,比較容易提取,因為單詞之間有天然的分隔符(空格);對於中文等連續書寫的語言,必須進行詞語的切分。 在搜索引擎中,一般要給單索引項賦與一個權值,以表示該索引項對文檔的區分度,同時用來計算查詢結果的相關度。使用的方法一般有統計法、資訊理論法和概率法。短語索引項的提取方法有統計法、概率法和語言學法。 索引表一般使用某種形式的倒排表(Inversion List),即由索引項查找相應的文檔。索引表也可能要記錄索引項在文檔中出現的位置,以便檢索器計算索引項之間的相鄰或接近關系(proximity)。 索引器可以使用集中式索引演算法或分布式索引演算法。當數據量很大時,必須實現即時索引(Instant Indexing),否則不能夠跟上信息量急劇增加的速度。索引演算法對索引器的性能(如大規模峰值查詢時的響應速度)有很大的影響。一個搜索引擎的有效性在很大程度上取決於索引的質量。

3.檢索器 檢索器的功能是根據用戶的查詢在索引庫中快速檢出文檔,進行文檔與查詢的相關度評價,對將要輸出的結果進行排序,並實現某種用戶相關性反饋機制。 檢索器常用的信息檢索模型有集合理論模型、代數模型、概率模型和混合模型四種。

4.用戶介面 用戶介面的作用是輸入用戶查詢、顯示查詢結果、提供用戶相關性反饋機制。主要的目的是方便用戶使用搜索引擎,高效率、多方式地從搜索引擎中得到有效、及時的信息。用戶介面的設計和實現使用人機交互的理論和方法,以充分適應人類的思維習慣。 用戶輸入介面可以分為簡單介面和復雜介面兩種。 簡單介面只提供用戶輸入查詢串的文本框;復雜介面可以讓用戶對查詢進行限制,如邏輯運算(與、或、非;+、-)、相近關系(相鄰、NEAR)、域名范圍(如.e、.com)、出現位置(如標題、內容)、信息時間、長度等等。目前一些公司和機構正在考慮制定查詢選項的標准。

未 來 動 向:搜索引擎已成為一個新的研究、開發領域。因為它要用到信息檢索、人工智慧、計算機網路、分布式處理、資料庫、數據挖掘、數字圖書館、自然語言處理等多領域的理論和技術,所以具有綜合性和挑戰性。又由於搜索引擎有大量的用戶,有很好的經濟價值,所以引起了世界各國計算機科學界和信息產業界的高度關注,目前的研究、開發十分活躍,並出現了很多值得注意的動向。

1.十分注意提高信息查詢結果的精度,提高檢索的有效性 用戶在搜索引擎上進行信息查詢時,並不十分關注返回結果的多少,而是看結果是否和自己的需求吻合。對於一個查詢,傳統的搜索引擎動輒返回幾十萬、幾百萬篇文檔,用戶不得不在結果中篩選。解決查詢結果過多的現象目前出現了幾種方法:一是通過各種方法獲得用戶沒有在查詢語句中表達出來的真正用途,包括使用智能代理跟蹤用戶檢索行為,分析用戶模型;使用相關度反饋機制,使用戶告訴搜索引擎哪些文檔和自己的需求相關(及其相關的程度),哪些不相關,通過多次交互逐步求精。二是用正文分類(Text Categorization)技術將結果分類,使用可視化技術顯示分類結構,用戶可以只瀏覽自己感興趣的類別。三是進行站點類聚或內容類聚,減少信息的總量。

2.基於智能代理的信息過濾和個性化服務 信息智能代理是另外一種利用互聯網信息的機制。它使用自動獲得的領域模型(如Web知識、信息處理、與用戶興趣相關的信息資源、領域組織結構)、用戶模型(如用戶背景、興趣、行為、風格)知識進行信息搜集、索引、過濾(包括興趣過濾和不良信息過濾),並自動地將用戶感興趣的、對用戶有用的信息提交給用戶。智能代理具有不斷學習、適應信息和用戶興趣動態變化的能力,從而提供個性化的服務。智能代理可以在用戶端進行,也可以在伺服器端運行。

3.採用分布式體系結構提高系統規模和性能 搜索引擎的實現可以採用集中式體系結構和分布式體系結構,兩種方法各有千秋。但當系統規模到達一定程度(如網頁數達到億級)時,必然要採用某種分布式方法,以提高系統性能。搜索引擎的各個組成部分,除了用戶介面之外,都可以進行分布:搜索器可以在多台機器上相互合作、相互分工進行信息發現,以提高信息發現和更新速度;索引器可以將索引分布在不同的機器上,以減小索引對機器的要求;檢索器可以在不同的機器上進行文檔的並行檢索,以提高檢索的速度和性能。

4.重視交叉語言檢索的研究和開發 交叉語言信息檢索是指用戶用母語提交查詢,搜索引擎在多種語言的資料庫中進行信息檢索,返回能夠回答用戶問題的所有語言的文檔。如果再加上機器翻譯,返回結果可以用母語顯示。該技術目前還處於初步研究階段,主要的困難在於語言之間在表達方式和語義對應上的不確定性。但對於經濟全球化、互聯網跨越國界的今天,無疑具有很重要的意義。

⑥ 信息檢索的四個要素

1 信息檢索的前提----信息意識
所謂信息意識,是人們利用信息系統獲取所需信息的內在動因,具體表現為對信息的敏感性、選擇能力和消化吸收能力,從而判斷該信息是否能為自己或某一團體所利用,是否能解決現實生活實踐中某一特定問題等一系列的思維過程。信息意識含有信息認知、信息情感和信息行為傾向三個層面。
信息素養(素質)(Information Literacy)一詞最早是由美國信息產業協會主席Paul Zurkowski在1974年給美國政府的報告中提出來的。他認為:信息素質是人們在工作中運用信息、學習信息技術、利用信息解決問題的能力。
2.信息檢索的基礎----信息源
信息源定義:在聯合國教科文組織出版的《文獻術語中》,將信息源定義為:個人為滿足其信息需要而獲得信息的來源,稱為信息源。
信息源類型:
按照表現方式劃分:口語信息源、體語信息源、實物信息源和文獻信息源。
按照數字化記錄形式劃分:書目信息源、普通圖書信息源、工具書信息源、報紙、期刊信息源、特種文獻信息源、數字圖書館信息源、搜索引擎信息源。
按文獻載體分----印刷型、縮微型、機讀型、聲像型
按文獻內容和加工程度分--一次信息、二次信息、三次信息
按出版形式分----圖書、報刊、研究報告、會議信息、專利信 息、統計數據、政府出版物、檔案、學位論文、標准信息(它們被認為是十大信息源,其中後8種被稱為特種文獻。教育信息資源主要分布在教育類圖書、專業期刊、學位論文等不同類型的出版物中)
3.信息檢索的核心----信息獲取能力
1.了解各種信息來源
2.掌握檢索語言
3. 熟練使用檢索工具
4.能對檢索效果進行判斷和評價
判斷檢索效果的兩個指標:
查全率=被檢出相關信息量/相關信息總量(%)
查准率=被檢出相關信息量/被檢出信息總量(%)
4.信息檢索的關鍵:信息利用
社會進步的過程就是一個知識不斷的生產—流通—再生產的過程。
為了全面、有效地利用現有知識和信息,在學習、科學研究和生
活過程中,信息檢索的時間比例逐漸增高。
獲取學術信息的最終目的是通過對所得信息的整理、分析、歸納和總結,根據自己學習、研究過程中的思考和思路,將各種信息進行重組,船造出新的知識和信息,從而達到信息激活和增值的目的。

⑦ 影響查全率和查准率的因素有哪些

查全率與查准率是評價檢索效果的兩項重要指標,查全率和查准率與文獻的存儲與信息檢索兩個方面是直接相關的,也就是說,與系統的收錄范圍、索引語言、標引工作和檢索工作等有著非常密切的關系。
(1)
影響查全率的因素
影響查全率的因素從文獻存儲來看,主要有:文獻庫收錄文獻不全;索引詞彙缺乏控制和專指性;詞表結構不完整;詞間關系模糊或不正確;標引不詳;標引前後不一致;標引人員遺漏了原文的重要概念或用詞不當等。此外,從情報檢索來看,主要有:檢索策略過於簡單;選詞和進行邏輯組配不當;檢索途徑和方法太少;檢索人員業務不熟練和缺乏耐心;檢索系統不具備截詞功能和反饋功能,檢索時不能全面地描述檢索要求等。
(2)
影響查准率的因素
影響查准率的因素主要有:索引詞不能准確描述文獻主題和檢索要求;組配規則不嚴密;選詞及詞間關系不正確;標引過於詳盡;組配錯誤;檢索時所用檢索詞(或檢索式)專指度不夠,檢索麵寬於檢索要求;檢索系統不具備邏輯"非"功能和反饋功能;檢索式中允許容納的詞數量有限;截詞部位不當,檢索式中使用邏輯"或"不當等等。
實際上,影響檢索效果的因素是非常復雜的。根據國外有關專家所做的實驗表明,查全率與查准率是呈互逆關系的。要想做到查全,勢必會要對檢索范圍和限制逐步放寬,則結果是會把很多不相關的文獻也帶進來,影響了查准率。企圖使查全率和查准率都同時提高,不是很容易的。強調一方面,忽視另一方面,也是不妥當的。應當根據具體課題的要求,合理調節查全率和查准率,保證檢索效果。

⑧ 從決策角度看,影響消費者的信息搜尋活動的因素有哪些

著眼於決策角度的分析:影響消費者信息搜尋活動的因素有三類:
第一類是與產品風險相關的因素,第二類是與消費者特徵相關的因素,第三類是情境因素。與產品購買相聯系的風險很多,如財務風險、功能風險、心理風險、時間風險、社會風險等。一旦消費者認為產品或服務的購買涉及很大的風險,他將花更多的時間、力搜集信息,因為更多的信息有助於減少決策風險。與購買風險緊密相連的是購買者的不確定性,包括知識的不確定性和選擇的不確定性。越是在選擇上具有不確定性,越是傾向於搜集信息,越是在知識上具有不確定性,越是傾向於較少的搜集信息。消費者因素如個性、人口特徵、消費者知識水平同樣影響外部信息搜集活動。具有外向性格、心胸開闊的人,以及自信心強的人,一般與大量的信息搜集活動相聯系。對某一產品領域缺乏消費經驗的消費者,更傾向於大量的信息搜集。很多人口方面的特徵與消費者在信 息搜集活動存在密切聯系。高收入和受過高等教育的人具有更高的信息搜尋水平,同樣,處於較高職業地位的人,從事更多的信息搜集活動。另外,隨著年齡的增長,搜集活動呈下降趨勢。
情景因素有首先是時間因素。
可用於購買活動的時間越充裕,搜尋活動可能越多。其次,是消費者在從事購買活動前所處的生理、心理等方面的狀態。消費者的疲憊、煩躁、身體不適等均會影響消費者搜集外部信息的能力。再次,是消費者面臨的購買任務及其性質。如果購買活動非常重要,那麼購買會十分的謹慎,並伴有較多的外部信息搜集活動。最後,是市場的性質。研究人員發現,隨著備選品數量的增多,消費者會從事更多的信息搜尋活動。同樣,如果出售同類物品的店鋪較多,而且彼此靠近,消費者會更多的進行信息搜尋。

⑨ 造成互聯網上信息檢索困難因素有哪些

1.來自 ICP方面的因素 ICP 即是 Internet Content Provider 的簡稱 , 它是指網路信息提供者或者稱網站經營者。
2.網路信息資源內容缺乏質量控制
3.網路信息檢索工具方面的因素
網路信息檢索工具對信息的組織和標引缺乏規范控制
缺少多媒體視頻檢索工具
匹配演算法混亂
檢索規則缺乏統一標准, 支持功能不同
4.來自用戶方面的因素
.......

閱讀全文

與影響信息檢索的因素有哪些相關的資料

熱點內容
ajax不返回數據怎麼辦 瀏覽:791
抖音小程序怎麼放在視頻下方 瀏覽:628
壞道硬碟的數據怎麼導出 瀏覽:931
昆明西山區玩具批發市場在哪裡 瀏覽:677
程序員發布會是什麼 瀏覽:628
如何讓小程序有黏性 瀏覽:981
碧水源屬於哪個交易所 瀏覽:310
二手房交易哪些證 瀏覽:379
女性護理產品怎麼用 瀏覽:338
段然技術怎麼樣 瀏覽:181
戶戶通電視信息弱怎麼辦 瀏覽:162
聚寶齋手游交易怎麼樣 瀏覽:768
天諭都能交易什麼 瀏覽:433
武漢三菱文具批發市場在哪裡 瀏覽:234
pmma產品用什麼保護膜保護 瀏覽:137
怎麼找太陽能預測數據集 瀏覽:770
爬蟲解析數據有什麼用 瀏覽:247
dota2代理商怎麼樣 瀏覽:106
市政府辦公廳信息處有什麼作用 瀏覽:178
會計信息質量控制變數有哪些 瀏覽:54