❶ 1,什麼是信息加工信息加工的基本方式是什麼
信息加工理論不是某一種理論的名稱,而是一類理論的統稱。信息理論把人看做一個信息處理器,而人的消費行為就是一個信息處理過程,即信息的輸入、編碼、加工儲存、提取和使用的過程。消費者面對各種大量的商品信息,要對信息進行選擇性注意、選擇性加工、選擇性保持、最後作出購買並作出購買行為。這個過程可以用心理學原理解釋為:商品信息引起了消費者的有意或無意注意,那麼大腦就開始對所獲得的信息進行加工處理,這個過程包括知覺、記憶、思維和態度,於是購買決定就產生了。
從信息加工的角度來研究學習,起自不同的來源。有人認為(Ellis,1978),是受了格式塔記憶理論的影響,這種理論強調,有機體如何組織他們記憶的內容,反映了他們是如何主動地組織知覺的方式。也有人(Norman,1970)區分了對當今信息加工理論有影響的三種理論:(1)由埃斯蒂斯和斯彭思等人最早提出的學習的數學理論(mathematical learning theories);(2)強調以選擇性注意為起點、長時記憶痕跡為終點的信號探示理論(signal detection theories);(3)注重人工智慧和計算機模擬的計算機模型理論(Computer-model theories)。
按照斯奈爾貝克(G.E.Snelbecker)的觀點,目前,被認為屬於信息加工理論范圍的,大致可以分成以下三類:
1.側重於數理統計分析的資訊理論
美國學者香農(C.Shannon)被公認為是資訊理論之父。作為貝爾電話公司的技術人員,香農為了解決信息編碼的問題,提高通信系統的效率和可靠性,在研究過程中對信息進行了數學處理。他舍棄通信系統中消息的具體內容,把信息源發生的信息僅僅看作一個抽象的量。他把數理統計方法運用到通信領域,提出了信息熵的數學公式,從量的方面來描述信息的傳遞與提取的問題,並提出了信息量的概念。他設計出了一套在各種不同條件下測量信息的方法,從而奠定了現代信息理論的基礎(王雨田,1986年)。
簡單說來,香農的測度主要集中在輸送與接收的消息之間的相似性,以便計算送話者與受話者雙方能夠得到多少信息。香農把消息的交換作為通信的特徵。因此,資訊理論關注的是可能已被輸送的消息的影響,以及實際被傳送的信號。
心理學家們改編了香農的信息測度和理論。呈現給被試的刺激是與通訊系統中的信息源和傳送者(source and transmitter)相應的。通道(channel)被作為人類被試的特徵;被試對信號加以編碼和做出正確反應的最大精確度,被稱為是他的通道能量(channel capacity)。
信息分析把主要焦點放在被試在一系列嘗試中對所呈現的刺激做出反應的一致性程度上。例如,我們可以向被試呈現音色不同但其他各方面(如聲響和持續時間)完全相同的4種音調,要求被試做出四種不同的反應,這樣,我們不需要詳細計算,也可以確定被試是否加工了在這種情境中所有可得到的信息。
當向成人被試呈現單維刺激(即除了一個刺激維度不同外,其他方面都完全相同)時,會出現一種有趣的現象。一旦被試有了足夠的練習,從而清楚知道對每一種刺激應做出何種反應時,他們的精確性達到了十種漸進線,並在操作時一直保持精確性。而且,即便刺激只是通過不同的感覺通道被感知的,或刺激的排列方式有所不同,但能被正確識別的刺激項目的數量變化是很小的。1956年,米勒(G.Miller)發表了一篇文章,題目是:《神奇的數字,7土2:我們信息加工能量的一些限制(The Magical Number Seven,Plus Or Minus Two:Some Limits on Our Capacity for Processing information)》,他回顧了近20項研究,發現人類處理信息的能量是有限的。米勒提出,我們要用金子而不是廢品來填補這7個左右的記憶狹孔。米勒的文章發表後,心理學家們從事了數百項這類的研究。盡管有人對這種人類通道能量的計算程序抱有疑問,但許多心理學家接受了這一發現,從而對學習與記憶的研究產生了一定的影響。還有些人從另一個角度認為,我們可以把信息組織成「組塊(chunks)」,從而可以增加人類的信息加工能力,因此應該把重點放在人們組織信息的方式上。
就一般而言,心理學家認為,資訊理論有助於我們形成一種把人類作為信息加工者的模式。這個模式強調人在對刺激做出反應時的積極選擇的作用,而不是像在刺激-反應理論中所看到的那種起被動作用的人。與此同時,也有人認為(Simon,1979),把研究焦點放在狹窄的實驗室分析,對了解人類解決問題的過程沒有很大的幫助。
2.側重於計算機模擬的信息加工理論
把人視作信息加工者,這一觀念是與計算機技術的發展聯系在一起的。計算機技術是在第二次世界大戰期間,主要是因為要處理大量軍事數據而發展起來的。心理學家們發現,計算機程序也可以用來描述人類思維和學習的方式。一些研究人員用計算機來模擬人類問題解決過程和學習過程。這樣,心理學家就不再只是推測在「暗箱」內部所發生的事情了。
關於計算機與人類信息加工方面,有兩個主要的發展:一方面,盡管許多資訊理論專家對人類認知過程不感興趣,但他們對改進計算機加工信息的方式很關注。所以,他們可以用人類思維過程作為改進計算機處理數據的程序的指南。因此,人工智慧(artificial intelligence)這個術語常常只是用來指計算機所遵循的信息加工步驟,而不管這些步驟是否模擬了人類加工信息的實際的方式,這與這個術語本身的含義是有矛盾的(Simon,1969)。人工智慧中一個最實際的目標,是要發現計算機貯存、提取、運演和使用信息的最佳方式,至於人類在解決問題時是否遵循這些步驟,這不是他們所關心的。
但另外一些學者對計算機加工的興趣,集中在模擬人類問題解決過程上。計算機模擬(computer simulation)通常是指利用各算機和計算機語言來描述人類信息加工過程時所採用的方法。這方面最典型的人物是西蒙。他認為,人的認識活動與計算機是一一對應的
最初用計算機成功地模擬人類思維是由紐厄爾與西蒙(Newell and Simon)設計的。這個程序稱為「邏輯理論家(Logic Theorist)」的程序,能用來證明形式邏輯中的各種定理。「邏輯理論家」採用了人類在問題解決活動中所使用的一些處理方法,但它只能解決一些特定類型的問題。紐厄爾與西蒙在1972年又設計了一種更為精細的問題解決系統,稱之為「一般問題解決者(General Problem Solver)」。這個程序把據認為是人類問題解決活動之基礎的大量策略組合在一起。這個程序不但能證明邏輯定理,而且還能下棋、譜曲等。由此,他們提出了一個問題解決行為所涉及的基本結構,他們稱之為「信息加工系統」或「IPS」。問題解決者的接受系統(或感受器,即神經末梢和把感覺傳送至大腦的通道),是與信息加工器相聯結的,信息加工器則需利用記憶。記憶也為信息加工器提供信息,而信息加工器則為效應器提供信息。效應器就是指實施問題解決過程中的決策的動作過程。
3.側重於實際應用的認知信息加工理論
研究方法的問題一直是心理學研究中十分困難的問題。信息加工認知心理學繼承了實驗心理學的傳統,吸收了計算機科學的研究成果,形成丁一套比較完整的研究方法——實驗、模擬、理論分析相結合的研究方法。這種研究方法充分地反映了當代科學在實驗基礎上高度綜合的研究特點,以及定性研究與定量研究相結合、宏觀研究與微觀研究相結合的特點。正是研究方法的突破,促進了信息加工認知心理學的發展。這些研究方法有:
(一)實驗法
從一百多年前馮特在萊比錫建立了第一個心理學實驗室以來,實驗方法已被大多數心理學家所接受。這是因為實驗的方法能使研究者在控制的情境下,系統地操縱自變數,觀察因變數的變化,探討變數之間的關系。實驗有助於研究者搜集資料,驗證假說,提高價究的信度和效度。實驗方法是信息加上認知心理學採用的主要手段。
信息加工認知心理學的實驗主要是反應時實驗和眼動實驗。
(二)口述報告法
口述報告法,也稱出聲思考法,是一種由被試大聲地報告自己在進行某項操作時的想法來探討內部認知過程的方法。口述報告多半在操作時進行,也可以在操作後通過回憶來敘述。從某種意義上來講,口述報告的方法有些類似傳統的內省法,也可以認為是對內省法的批判與繼承。在進行口述報告實驗時,主試一定要要求被試大聲地如實報告操作時自己思考的詳細內容,使內部的思維過程外部言語化,但不要他們解釋情境或思維過程。被試所報告的應主要是短時記憶中保留的很快就會消失的信息。內克森和西蒙等人採用這種方法,在認知研究上取得了一定的成就。口述報告的方法已被許多信息加工認知心理學家所接受。
(三)計算機模擬的方法
計算機模擬是信息加工認知心理學最有代表性的一種獨特的研究方法。計算機模擬是心理學與計算機科學的交叉領域,也是人工智慧的重要組成部分。這種方法是想通過對心理過程的計算機模擬來認識人心理過程的本身,即對人的內部信息加工過程進行邏輯分析。
計算機模擬常和理論分析結合在一起,多從程序縮減、流程分析、程序模擬三個方面著手。 程序縮減是一種以潛在性因素作為資料來源,用分離認知因素來探討認知過程的方法。典型的設計是讓被試執行兩種復雜程度不同的任務,從對比的角度來探討復雜任務的操作時間和信息加工過程。流程分析是通過計算機流程圖的比較進一步探討操作時心理表徵的順序和方向。程序模擬是把人的認知過程編成各種計算機語言輸入計算機,如果輸入的程序能正常工作,設計者至少可以得知某種心理過程在邏輯上是可行的,即獲得邏輯合理性方面的驗證。例如,克拉克等人用計算機模擬的方法探討了人的句子理解過程,達柯等人則探討了人怎樣利用自己有限的短時記憶去處理和分析句子的前後關系,這些研究都取得了一定的成就。
❷ 數據加工處理的方法有哪些
數據處理,是對數據的採集、存儲、檢索、加工、變換和傳輸。根據處理設備的結構方式、工作方式,以及數據的時間空間分布方式的不同,數據處理有不同的方式。不同的處理方式要求不同的硬體和軟體支持。每種處理方式都有自己的特點,應當根據應用問題的實際環境選擇合適的處理方式。根據處理設備的結構方式、工作方式,以及數據的時間空間分布方式的不同,數據處理有不同的方式。不同的處理方式要求不同的硬體和軟體支持。每種處理方式都有自己的特點,應當根據應用問題的實際環境選擇合適的處理方式。數據處理主要有四種分類方式①根據處理設備的結構方式區分,有聯機處理方式和離線處理方式。②根據數據處理時間的分配方式區分,有批處理方式、分時處理方式和實時處理方式。③根據數據處理空間的分布方式區分,有集中式處理方式和分布處理方式。④根據計算機中央處理器的工作方式區分,有單道作業處理方式、多道作業處理方式和互動式處理方式。
數據處理對數據(包括數值的和非數值的)進行分析和加工的技術過程。包括對各種原始數據的分析、整理、計算、編輯等的加工和處理。比數據分析含義廣。隨著計算機的日益普及,在計算機應用領域中,數值計算所佔比重很小,通過計算機數據處理進行信息管理已成為主要的應用。如側繪制圖管理、倉庫管理、財會管理、交通運輸管理,技術情報管理、辦公室自動化等。在地理數據方面既有大量自然環境數據(土地、水、氣候、生物等各類資源數據),也有大量社會經濟數據(人口、交通、工農業等),常要求進行綜合性數據處理。故需建立地理資料庫,系統地整理和存儲地理數據減少冗餘,發展數據處理軟體,充分利用資料庫技術進行數據管理和處理。
❸ 信息加工
3.4.1信息加工的含義
所謂信息加工是指把搜集來的大量的原始信息,按照不同的目的和要求進行篩選和判斷、分類和排序、著錄和標引、編目和組織、存儲和分析,而使之成為具有一定使用價值的信息的過程。
一般而言,搜集來的原始信息是一種初始的、零亂的、孤立的信息。只有把這種零次信息進行分類、排序,使之成為規則的、有序的、系統的高次信息,才能使用;只有通過著錄和標引,使零次信息變成二次信息,才能便於信息的存儲、檢索和傳遞。因此,信息加工的過程就是在原始信息的基礎上,生產出價值含量高、方便用戶利用的新信息,使信息增值的過程。
按不同的標准,信息加工可分成不同的方式。
按加工處理響應時間的不同,可把加工分為實時處理加工和批處理加工。實時處理加工是指將送過來的數據立即進行處理,即時做出響應,一般適合常規的作業業務;批處理是指把送過來的數據存起來,達到一定的數量或時間後,再集中處理,一般適合統計分析業務。
按處理功能的深淺可把加工分為預處理加工、業務處理加工和決策處理加工。預處理加工是對信息簡單整理;業務處理加工是對信息進行分析,綜合出輔助決策的信息;決策處理加工是對信息進行統計推斷,產生的是決策信息。
按加工的工具不同,可分為手工加工和計算機加工。手工加工是利用手工設備對信息進行處理,主要存在於信息加工的初期階段。計算機加工是利用計算機進行數據處理,對原始數據進行加工處理,產生表格、圖形等結果。
3.4.2信息篩選
信息篩選是信息加工的第一個環節,其目的是去偽存真、去粗取精,保證信息的准確性和有效性。
3.4.2.1信息篩選的程序
信息篩選的基本程序主要包括以下幾個方面:
(1)信息整理。信息整理是信息篩選判別的前提,其目的是使零散的、雜亂無章的信息標准化、條理化,便於下一步的處理和分析。
(2)瀏覽審閱。瀏覽審閱是信息篩選判別的中心環節。其目的是清除那些明顯錯誤或無用的信息,保留那些明顯真實或有用的信息。對於一些一時無法確定去留的信息資料則放置一旁,留待進一步處理。
(3)再次審核。對於無法確定的信息,要採取會診或其他科學的方法,對其再次進行分析研究,以便科學地確定其取捨,提高信息篩選和判別的准確性。
3.4.2.2信息篩選的重點對象
(1)虛構信息。這類信息完全是虛構的、杜撰的,沒有一點事實根據,其主要源自信息搜集者的不良動機,對這類信息一定要清除。
(2)添加信息。這類信息雖有一定的根據,但其中某些情節和內容是信息搜集者、傳遞者通過主觀想像而不是根據事實依據添加進去的,需要對其進行分析區別。
(3)誇張信息。這類信息往往把事實誇大或縮小,是對事實的一種扭曲,會嚴重影響信息的真實度和可信度。
(4)偏頗信息。這類信息是片面地強調某一起作用的原因或扼殺某一起作用的要素。這類信息如果不加以校驗、糾偏,會影響到信息的使用價值,甚至會給信息使用者造成重大損失。
(5)殘缺信息。由於時間久遠、信息獲取途徑不正確,或者由於信息源本身無法接近,而僅僅通過個別現象或特徵得到的信息就是殘缺的信息。這類信息一般需要進一步補充收集。
(6)模糊信息。這類信息是由信息搜集者道聽途說、捕風捉影而來,往往帶有「據說」、「聽說」、「大概」、「也許」、「有跡象表明」等字樣。這類信息可信度差,必須重新搜集驗證。
(7)拼湊信息。這類信息往往把不同地點、不同時間、不同條件、不同性質的信息在搜集、加工、傳遞的過程中,人為地組合成同一地點、同一時間、同一條件、同一性質的同一信息,這種東拼西湊、張冠李戴的信息,從整體上看仍然是沒有事實依據的。
3.4.2.3信息篩選的方法
(1)感官判斷法。感官判斷法是指信息加工人員在瀏覽審閱原始信息過程中依靠自己的學識、技能和經驗,憑直覺判斷信息的真偽以及可信度大小的方法。
(2)對比分析法。對比分析法是指信息加工人員在篩選和判別信息過程中,通過對前後信息、左右信息、不同渠道搜集的同一信息進行對比分析,以確定信息的真偽和可信度的方法。
(3)專家判斷法。專家判斷法是指對一些一時無法取捨的信息交由專家裁決,確定其價值的方法。
(4)集體討論法。集體討論法是指通過集體的智慧對一些個人無法下結論的信息採用集體會診的方法以確定其取捨。
(5)現場核實法。現場核實法是指對有疑慮的信息,責成信息搜集人員或信息加工人員深入現場核實真偽的方法。
(6)數學核演算法。數學核演算法是指當對原始信息有疑慮時,由信息加工人員重新予以核算的加工方法。這種方法可以及時糾正那些因信息搜集計算錯誤、筆誤或傳遞過程中失誤造成的信息失真現象。
3.4.3信息分類
信息篩選是對信息的粗加工,信息分類就是對信息的細加工。只有對信息進行分類和排序,才能更好地對信息進行存儲、檢索、傳遞和使用。
3.4.3.1信息分類的基本程序
(1)確定分類方法。目前信息分類的方法很多,有地區分類法、內容分類法、主題分類法、時間分類法及綜合分類法等。到底採用哪一種分類法,直接決定著信息資料的分揀。因此,確定分類法是信息分揀的基礎和前提。
(2)實施信息分揀。這是信息分類的第二個環節,即把信息資料分門別類地放置,以便後一環節工作的開展。
(3)進行信息排序。信息分類以後,同一類目的的信息資料的放置也有前後順序的安排問題。通過信息的排序就能使信息成為井然有序的信息體系。
3.4.3.2信息分類的具體方法
(1)地區分類法。地區分類法是指根據地區的不同而進行的信息劃分方法。
(2)時間分類法。時間分類法是指依據時間順序劃分信息的方法。時間分類法也可以按年、月、日分層次進行劃分。
(3)內容分類法。內容分類法是指依據信息所包含的內容不同進行分類的方法。例如,根據行業,信息可細分為農業信息、工業信息、商業信息、服務業信息、旅遊信息、企業信息、基本建設信息、財政信息、金融信息等。
(4)綜合分類法。綜合分類法是以時間、地區、內容為依據綜合劃分信息的方法。按不同的組合,綜合分類法又可分為時間地區分類法、地區時間分類法、內容地區分類法、內容時間地區分類法、地區時間內容分類法、地區內容時間分類法、時間地區內容分類法和時間內容地區分類法等。
3.4.4信息著錄
信息著錄,亦稱信息描述,是指根據一定的管理規則和技術標准,對信息的外在特徵和部分內容特徵進行分析、選擇和記錄的過程。通過信息著錄,形成一條條反映原信息內容特徵和外在特徵的記錄,這種記錄就是條目或款目。將一批款目按照一定的次序編排而成的一種文獻報道和檢索工具就是目錄。款目是一種文獻的縮影,目錄是一批文獻的縮影。
3.4.4.1信息著錄的標准化
文獻著錄標准化是指在國家或國際范圍內,對文獻著錄的原則、內容、格式等做出具有一定約束力的規范。為開發和利用文獻資源,需要取得共同一致的書目情報語言來統一描述文獻特徵和報道、檢索文獻的方法。20世紀60年代,許多國家相繼在本國范圍內,實現了文獻著錄標准化。在此基礎上,國際圖書館協會聯合會(簡稱國際圖聯)專門工作小組,於1971年開始進行國際文獻著錄標準的制訂工作,並於1974年正式出版了《國際標准書目著錄》(ISBD),得到世界各國的普遍接受。《國際標准書目著錄》成功地解決了下列問題:
(1)使各國的文獻著錄項目及其排列順序具有互換性,即實現文獻著錄的國際統一。
(2)克服了語言障礙,使各國文獻著錄具有易識別性,即使不認識某種文字的讀者,也能通過標識符號系統,識別著錄項目。
(3)有助於將一般書目轉換為機讀目錄形式。
為了建立和健全我國統一的文獻報道體系,開展國際書目信息交流,更好地開發和利用文獻信息資源,我國在全國文獻工作標准化技術委員會第6分委員會(目錄著錄分委員會)和中國圖書館學會的共同努力下,1983年7月正式發表了全國文獻著錄標准系列中的《文獻著錄總則》(GB3792.1—83)。其後又出版了各個分則,包括《普通圖書著錄規則》、《連續出版物著錄規則》、《地圖資料著錄規則》、《檔案著錄規則》、《古籍著錄規則》、《檢索期刊條目著錄規則》、《文後參考文獻著錄規則》等。
3.4.4.2MARC格式
MARC(Machine Readable Catalogue)是機器可讀目錄英文縮寫,簡稱機讀目錄,就是以代碼形式和特定結構記錄在計算機存儲介質上的、用計算機識別和閱讀的目錄。
1965年,美國國會圖書館開始研製機讀目錄。1966年生產了MARCⅠ磁帶。1969年正式出版了MARCⅡ磁帶,其後陸續出版了專著、連續出版物、檔案與手稿資料、視覺資料、樂譜和地圖等資料類型的MARC數據文件。由於MARCⅡ格式是美國國會圖書館開發的,故稱為USMARC(又稱為LCMARC)。1977年,國際圖聯首次出版了《UNIMARC通用機讀目錄格式》,以後又不斷進行了修改。
CNMARC是我國國家書目機構依據 UNIMARC制訂的《中國機讀目錄格式》(China MARC Format),作為中華人民共和國文化行業標准 WH/T0503—96推出,它與ISO2709的規定相一致,以 UNIMARC為依據,凡UNIMARC中定義的欄位適合於我國出版物的有關規定都予以保留,並補充了我國出版物特有而 UNIMARC中所沒有的欄位定義。例如,它增加了如下欄位和子欄位:091統一書刊號;092訂購號;093專利號;094標准號;690中國圖書館分類法;692中國科學院圖書分類法;905館藏信息等。
3.4.4.3DubinCore標准
Dubin Core標准簡稱 DC。DC元數據格式是在 1995年3月由 OCLC(Online Computer Library Center,Inc.)和NCSA(National Center for Supercomputing Application)聯合召開的第一次專題研討會(即DCLC/NCSA Metadata Workshop)上產生的,目的是尋求一套簡潔有彈性,且非專業圖書館人員也可輕易掌握和使用的信息資源著錄格式,以提高網路信息資源的開發利用率。操作對象局限於網路上的電子文本資源。會議結果產生了13個元數據項,並以開會的地點都柏林(Dubin)命名。在1996年9月第三次研討會上,DC元數據將處理對象進一步擴充到圖像資源。為了能對圖像資源進行充分的著錄,新增了兩個著錄項——描述項(Description)和許可權管理項(Rights Management),同時修改了部分著錄項名稱,共產生了15個著錄項。1997年10月,在芬蘭赫爾辛基舉行的第五次系列研討會上,進一步明確了DC元數據格式的主要功能側重於信息資源的著錄或描述,而不是信息資源的評價,所以又將15個元數據項分為如下三類:
(1)資源內容描述類元數據項。該類中有下列元數據項:
題名項(Title):由資源創建者或出版者給定的資源名稱。
創建者項(Creator):資源的創建者。
主題詞項(Subject):能夠揭示資源對象主題內容或學科內容的關鍵詞。
描述項(Description):資源內容的文本描述,包括文獻類對象的文摘或視覺作品的內容描述等。
語言項(Language):資源對象所用的語言類型。
來源項(Source):二次資源的出處信息。一般的元素只包含當前資源的信息,如果對於揭示當前資源是必要的話,該項可包含二次資源的日期、創建者、形式、標識或其他元數據。
關聯項(Relation):二次資源及其與當前資源關系的標識。該元素允許在相關資源和資源描述間建立關聯。例如,編目自(Is version of)、翻譯自(Is based on)、節選自(Is part of)、格式轉換自(Is format of)等。
覆蓋范圍項(Coverage):資源知識內容的時空特徵。空間范圍是指物理區域,如經緯度、規范的地名等;時間范圍是指資源內容(時間段)而非資源產生的時間(時間點);時間描述採用與日期項(Date)相同的格式。
(2)知識產權描述類元數據項。該類中有下列元數據項:
著者項(Creator):對創造資源知識內容承擔主要責任的個人或機構。
出版者項(Publisher):負責使資源成為當前形態的責任者,例如出版社、大學的學院或者公司實體等。
合作者項(Contributor):是指沒有在 Creator元素中列出的對資源的知識內容具有重要貢獻的個人或組織,其貢獻次於創建者(如編輯、謄寫員、插圖作者等)。
許可權項(Rights):一個許可權管理的陳述,或者是指向一個許可權管理陳述的標識,或者是指向提供資源許可權管理信息內容的服務的標識。
(3)外部屬性描述類元數據項。該類中有下列元數據項:
日期項(Date):是指與創建或使資源成為可利用狀態相關的日期。
類型項(Type):資源的類別,例如小說、詩歌、報告、論文、詞典等。
識別符(Identifier):唯一標識資源的字元串或數字。例如,網路資源標識中的URL和URN,其他通用唯一性標識,如國際標准書號(ISBN)或其他規范名稱皆可作為標識符。
格式項(Format):資源的數據格式,用於註明需要什麼軟體或硬體來顯示和執行這一資源,如文本、JPG圖像、應用程序等。
3.4.5信息標引
信息標引也稱為信息揭示,是對信息的主要內容和其他形式特徵進行選擇、概括和提煉的過程。包括對信息形式特徵進行選擇,對信息的內容特徵進行分析,並轉換成反映信息內容主題的標識等具體內容。
3.4.5.1信息標引的程序
信息標引的程序一般包括三個環節。
(1)主題分析。即對信息所包含的主題進行分析,主要包括主題數量分析,即該信息包含多少個主題;主題結構分析,即每個主題有多少個主題概念因素;主題內容分析,即具體說明該信息包含了什麼主題、各個主題有哪些概念因素。
(2)主題標引。將主題分析結果轉換為主題標識。根據對信息主題的揭示程度,主題標引方式可以有四種策略:①整體標引:即對某一信息實體的整體主題用一個標識來進行概括性標引。②全面標引:即對某一信息實體的所有局部主題或不同主題及其主題概念因素分別進行詳細標引。③補充標引:即除對某一信息實體的整體主題作概括性標引外,還對部分局部主題及其主題概念因素單獨進行標引。④重點標引:即對某一信息實體中與信息系統的性質、任務、目的有關的主題部分進行標引。
(3)檢驗審核,即對上述主題分析和主題標引的過程和結果進行檢驗和審核,最後正式形成信息揭示的結果。
3.4.5.2 信息標引的方法
根據標引過程中所給出的標識形態和性質的不同,信息標引通常可分為分類標引和主題標引兩大類。
(1)分類標引。分類標引是給信息的內容或形式特徵給予分類標識的方法。通過分類標引,可以將具有共同學科屬性的信息類聚在一起,並依據各類信息之間的學科關系把所有信息組織成一個有層次、有條理的整體。從近現代分類法的編制方式來看,分類的方法主要有等級體系分類法、分面組配分類法和混合式分類法:
1)等級體系分類法。這類分類法是以文獻內容的學科性質為對象,按照知識門類的邏輯次序從一般到具體、從簡單到復雜,層層劃分,所形成的一種等級體系,其主要特點是:按學科、專業集中文獻,並從知識分類角度揭示各類文獻在內容上的區別和聯系,提供從學科分類檢索文獻信息的途徑。
2)分面組配分類法。這是一種依據分析兼綜合的原則編制的分類法類型,其基本思想是:任何復合主題,不管多麼復雜,都可以分解為相應的基本概念;同時它們也可以通過相應基本概念的組合加以表達,因此,分類法不必詳盡列舉所有主題,而只要在類表中按照范疇列出各種基本概念,並分別配以相應號碼。
3)混合式分類法。這類分類法是整合上述兩種分類法的優點,在詳盡列舉類表的基礎上,廣泛採用各種組配方式的方法。如《國際十進分類法》。
上述的等級體系分類法從古代起就廣泛應用於圖書館中對文獻資料的分類和檢索,現在仍然在圖書信息界廣為使用。其優點是:強調知識的系統化組織,符合人們認識事物的習慣,便於用戶按學科系統檢索有關文獻信息;類目的樹形結構適用於文獻的排架管理和檢索工具的編排組織:通常採用的阿拉伯數字和拉丁字母標識,通用性強,使國際統一分類達到資源共享成為可能。當然,等級體系分類法也有局限性,如受其體系結構的限制,直接的專指性差;不適合多角度標引和檢索;類目體系固定,事先列舉,不能及時反映新學科、新事物,修訂、增補很困難。
(2)主題標引。主題標引是一種以規范化或未經規范的自然語言作為信息主題標識的方法。按照選詞原則、組配方式、規范措施和編制方法。主題法可分為標題詞法、元詞法、關鍵詞法和敘詞法。
1)標題詞法。標題詞法是以標題詞(規范的事物名稱、名詞術語)作為信息主題內容的標識和檢索標識的方法。標題詞的來源主要是標引對象的名稱或標題中通用的定型名詞。標題詞的匯編稱為標題表,標題詞法的主要特徵是事先編表。標題詞以固定的組合方式組織在詞表中,檢索按既定組配執行。標題詞表的功能是對優選出來的標題詞從詞義、詞形、詞間關系和用法等方面進行管理和控制。保證一種事物只用一個標題詞表達,一個標題詞只表達一種事物或含義,避免使用過程中的混亂。標題詞法有較好的直接性和專指性,通用性強,比較適用於特性檢索,但靈活性較差。
2)元詞法。元詞法主張用最基本的、不能再分的詞彙——單元詞作主題詞,單元詞從信息內容中抽出,再經規范,能表達一個獨立的概念。比如,「計算機軟體」不是單元詞,而「計算機」和「軟體」是單元詞,在英語中單元詞經常是一個單詞。元詞法的突出特徵是:強調詞彙的單元化;強調後期組配。元詞法雖然提高了主題法的靈活性,但由於它過分強調詞彙單元化,詞彙處理方法又不甚合理,易發生錯誤組配,誤檢率較高,故實用性不是很好。
3)關鍵詞法。關鍵詞法是直接從信息資料的標題、文摘或正文中抽取出能表達主題概念的具有實質意義的信息單元(關鍵詞)作為主題詞,然後按字順序輪排以供信息檢索的方法,關鍵詞排序可組成供主題檢索的索引系統,比如,《科學引文索引》中的「輪排主題索引」,其關鍵詞就是從文獻標題中抽取出來的。關鍵詞法不受詞表控制,快捷簡便,適於用計算機組織和檢索信息。但缺點是由於關鍵詞法的詞語不規范,影響了信息的查全率和查准率。
4)敘詞法。敘詞法是從敘詞表中選取敘詞,通過概念組配來描述信息資料的主題,使標引和檢索達到更高專指度的方法。敘詞法的顯著特點是:檢索時可由多個敘詞形成任意合乎邏輯的組配,構成多種檢索提問式。敘詞法吸收了前述幾種類型主題法的長處,具有直觀、專指、靈活以及標引准確、查找方便等優點,在文獻檢索中得到了廣泛的應用。目前,國內外大多數檢索工具和資料庫都採用敘詞法,常用的敘詞表有《INSPEC敘詞表》、《原子能科學技術漢語主題表》、《國防科學技術主題詞典》、《地質學漢語主題表》及《漢語主題詞表》等。
3.4.6信息存儲
信息具有抽象性,它必須寄附在某種載體上才能表現出來。信息寄附在載體上的過程就是信息的存儲過程。
3.4.6.1信息存儲的意義和作用
信息存儲是指將經過加工處理後的信息按照一定的規定記錄在相應的信息載體上,並將這些載體按照一定特徵和內容性質組織成系統化的檢索體系的過程。信息存儲的意義和作用有以下幾點。
(1)有利於共享。信息存儲以後,用戶就可以共享信息庫,還可以反復使用,這樣提高了信息的利用率。
(2)方便檢索。將加工處理後的信息存儲起來,形成信息庫,就為用戶檢索到所需的信息提供了極大的方便。
(3)有利於集中管理信息,增大信息資源的擁有量和開發高層次的信息資源。
總之,在存儲信息時,必須充分考慮到檢索的方便性和高效性,做到存放條理化、分類合理化,檢索清楚、取用方便。
3.4.6.2信息存儲的主要技術
傳統的信息存儲技術是指紙張印刷存儲技術,現代信息存儲技術主要包括縮微存儲技術、聲像存儲技術、計算機存儲技術以及光碟存儲技術。它們具有存儲容量大、密度高、成本低、存取方便等優點,所以得到了廣泛的應用。
(1)紙張存儲技術。紙張存儲技術是最常用、使用時間最長的一種存儲技術。但它有許多不足,表現為存儲信息密度低、體積大、佔用空間多,而且紙張易燃燒、受潮霉爛、遭蟲蛀、風化等,不易保存。
(2)縮微存儲技術。縮微存儲技術是指利用攝影機將印刷品上的內容縮微拍攝到膠片上,沖洗成縮微膠片後予以存儲。縮微存儲技術的主要優點是:①存儲密度高,可以節省用紙張存儲信息空間的90%。②存儲力法簡單、成本低、比較經濟。③保存期長,通常環境中保存期長達50年,在標准條件下可保存幾百年。④縮微品忠實於原件,不易出錯,同其他存儲方法相比,其誤碼率為0。⑤採用縮微技術能將非統一規格的原始文件規范化管理。縮微技術還可以與計算機技術、通信技術結合使用,實現自動化檢索。其不足之處是:必須藉助縮微閱讀機或縮微閱讀復印機才能閱讀,並且不能對照閱讀,保存條件非常嚴格。
(3)聲像存儲技術。聲像存儲技術是指將信息通過錄音或者錄像等方式記錄存儲的一種信息存儲技術,包括錄音存儲技術、錄影存儲技術和電影存儲技術。
(4)光碟存儲技術。光碟存儲技術是利用激光和計算機,將各類信息數據化,並將其轉化為光信號,記錄在光碟上存儲信息的新型存儲技術。光碟存儲技術具有以下特點:①存儲密度高,容量大;②價格低廉,便於復制;③堅固耐用,存儲壽命較長。光碟密封較好,不宜受塵土、有害氣體以及電磁場的影響,而且它利用激光進行非接觸式存取,使用壽命達10年以上。其主要缺點是:誤碼率比較高。
(5)計算機存儲技術。計算機存儲技術是指利用計算機的內外存儲器來存儲信息的一種技術,按照在計算機中的作用,可以將計算機的存儲器分為內存儲器和外存儲器。其中,內存儲器直接與CPU打交道,其主要特點是速度快、容量小、價格高;外存儲器主要是內存儲器的後備和補充,被人們廣泛使用,其特點是存儲量大、成本低、可以永久離線保存信息。
3.4.7信息分析
信息分析是信息組織過程中必不可少的重要一環,是通過已知信息提示客觀事物的運動規律的過程。其主要任務就是信息研究人員藉助於一定的方法和手段,使原有信息在更深入、更全面、更綜合、更適用的層次上總結為全新的信息內涵,以滿足用戶解決特定課題的需要。
3.4.7.1信息分析的功能
信息分析對其所研究的對象來說,具有整理、評價、預測和反饋四項基本功能。
(1)整理功能:對信息進行搜集、組織,使之由無序變為有序。
(2)評價功能:對信息價值進行評價,以去粗取精、去偽存真。
(3)預測功能:通過對已知修訂稿內容的分析獲取未知或未來信息。
(4)反饋功能:根據用戶的實際消費效果對預測結論進行審議、評價、修改和補充。
一般來說,這四項基本功能是密切相關的,信息整理和評價是信息分析的兩項基本性功能,是為預測和反饋功能的實現做准備;預測和反饋是信息分析的兩項特徵性功能,是信息整理和評價功能的進一步拓展和延伸。
3.4.7.2信息分析的方法
信息分析方法是進行信息分析的工具,是實現信息分析工作的手段,雖然信息分析的內容千差萬別,規模與范圍大小各異,但它們的共同目標都是圍繞特定的決策問題,通過對問題的發展歷史與現狀深入分析研究,來揭示其發展規律,預測其發展前途和趨勢,這就決定了各種分析方法的共同特點和屬性。信息分析方法主要有定性分析法和定量分析法。
(1)定性分析方法。定性分析方法即邏輯學方法,是建立在邏輯推理和辯證分析的技術之上,根據已知的信息,藉助於比較、分析與綜合、歸納與推理等一系列邏輯學手段來揭示事物的發展規律和因果關系的一種研究方法。定性分析法的優點是推論嚴密、直感性強。但不足之處主要是:其結論僅僅是一種定性的傾向而無定量的說明,不夠具體和精細,不能完全適應技術經濟或工程項目、市場預測等需要定量化研究的課題。
(2)定量分析方法。定量分析方法即數學方法,是利用基礎數學、數理統計、應用數學及其他一切藉助於數學處理和計算的研究方法的總稱。這些方法的突出特點是:能對事物給出定量的描述,顯示出事物發展的具體程度;運用數學方法研究事物關系時,研究者直接接觸的是公式或模型等事物的同態系統,而不是事物本身。但定量分析法也有它的適用條件和局限性:數學計算時所採用的邊界條件是人們依據客觀事物抽象或假設出來的,這種抽象或假定是否合理,是否符合客觀實際,在確定最終結論時要予以審核或驗證;數學方法中所用的各種參量數據,有的是來自客觀統計,有的則來自主觀評估,因此數學方法研究的結果在信息分析研究的結論中只具有相對意義;客觀事物往往是多參量的、動態的復雜系統,而客觀事物的任何同態系統本質上都是近似的、靜態的和簡化的系統。
由此可見,邏輯學方法和數學方法各有所長。在信息分析研究中很難截然分開,一般來說,定性分析是定量分析的基礎,定量分析旨在為定性分析的結論提供論據,印證定性分析的結果。在具體的信息分析活動中,往往趨向於把兩種方法結合在一起使用。
❹ 當前常見的計算加工信息類型有哪些
計算機加工信息的類型有
1.基於程序設計的自動化信息加工.(如:用編程來畫拋物線)
2.基於大眾信息技術工具的人性化信息加工.(如:用excel計算班級的成績表,算出平均分,排名等)
3.基於人工智慧技術的智能化信息加工
信息加工是對收集來的信息進行去偽存真、去粗取精、由表及裡、由此及彼的加工過程。它是在原始信息的基礎上,生產出價值含量高、方便用戶利用的二次信息的活動過程。這一過程將使信息增值。只有在對信息進行適當處理的基礎上,才能產生新的、用以指導決策的有效信息或知識。
根據信息加工一般規律,分別進行人工加工和機器加工。 人工加工,主要是採集、分類、摘編、匯集、存檔; 機器加工,主要是採集輸入、編碼輸入、傳輸、程序計算、傳輸、解碼輸出、屏幕輸出或列印或刻錄光碟。 信息加工指通過判別,篩選,分類,排序,分析和再造等一系列過程使收集到的信息成為我們需要的信息,即信息加工的目的在於發掘信息的價值,方便用戶使用。信息加工是信息利用的基礎,使信息成為有用資源的重要條件。
❺ 什麼是信息加工信息加工的方式
信息加工是對收集來的信息進行去偽存真、去粗取精、由表及裡、由此及彼的加工過程。那麼你對信息加工了解多少呢?以下是由我整理關於什麼是信息加工的內容,希望大家喜歡!
信息加工是在原始信息的基礎上,生產出價值含量高、方便用戶利用的二次信息的活動過程。這一過程將使信息增值。只有在對信息進行適當處理的基礎上,才能產生新的、用以指導決策的有效信息或知識。
(1)信息的篩選和判別:在大量的原始信息中,不可避免地存在一些假信息和偽信息,只有通過認真地篩選和判別,才能防止魚目混珠、真假混雜。
(2)信息的分類和排序:收集來的信息是一種初始的、零亂的和孤立的信息,只有把這些信息進行分類和排序,才能存儲、檢索、傳遞和使用。
(3)信息的分析和研究:對分類排序後的信息進行分析比較、研究計算,可以使信息更具有使用價值乃至形成新信息。
(1)信息加工要善於運用創造性思維,對信息內容進行定性分析和定量分析,從中找出本質的規律性的東西。如果只局限於情況介紹、數據羅列,這種信息加工的作用很小。
(2)在信息加工過程中,要實事求是地對信息進行加工整理,切忌主觀臆斷,把不同時間、不同空間、不同性質的信息硬性拼湊,造成信息失真;切忌人為地加以誇大、縮小或在加工中使客觀事物變樣。
從不同的角度,信息加工方式有各種不同的劃分。
按處理功能的深淺分
按處理功能的深淺,可以把信息加工分為預處理加工、業務處理加工和決策處理加工三類方式。第一類是對信息簡單整理,加工出的是預信息。第二類是對信息進行分析,綜合出輔助決策的信息。第三類是對信息進行統計推斷,可以產生決策信息。
數據加工以後成為預信息或統計信息,統計信息再經過加工才成為對決策有用的信息。這種轉換均需要時間,因而不可避免地產生時間延遲,這也是信息加工的一個重要特徵——滯後性,在使用中必須注意這一點。信息的滯後性與信息的時效性是有矛盾的,信息工作者要認識信息的滯後性,盡量減少以至消除滯後性對時效性的制約和影響。
按處理的響應時間分
按處理的響應時間的不同,信息加工的方式又可分為兩種類型:
(1)一種是將送過來的數據立即進行處理,即時做出響應的“實時處理型”。一般實時處理系統只允許處理已確定的工作,只限於面向常規的作業業務,這是為了保證響應的及時性。
(2)另一種是將送過來的數據存起來達到一定數量或時間後,再集中處理的“批處理型”。這種處理方式適用於以下兩種統計分析業務:如果不搜集一定數量的必要數據,就沒有什麼處理意義和效果;沒有必要急於得到處理結果。
從發展來看,信息加工正從批處理形式向聯機處理形式發展,從事後處理為中心向實時處理發展。
按系統與用戶之間的距離分
按系統與用戶之間距離的遠近,信息加工方式可劃分為遠程處理方式和局域處理方式。遠程處理是指用戶不必去信息中心,而通過通信線路使用遠處的計算機進行處理的方式。實際上遠程處理是一種遠距離的聯機處理方式。因為除了終端和通信控制器以外,它和批處理方式完全一樣。與遠程處理相反,局域處理是指在放置計算機的地方使用計算機的方式。事實上,只有在區分遠程處理和局域處理的場合,才較多地使用這個概念,即在計算機網路中分布在各處的計算機各自進行處理的方式就叫做局域處理。
按企事業單位的管理和計算機配置分
按企事業單位的管理和計算機配置,信息加工處理的方式可分為集中式和分布式。集中式是將計算機放在單位機關等指定地方,由中心計算機集中承擔處理功能和處理量;分布式是以統一的規劃為基礎,將適當規模的計算機系統安裝在單位機關及其下屬單位,分別承擔處理功能和處理量。選擇集中式還是分布式的時候,要考慮企業的各種內部和外部條件。
按是否運用計算機分
傳統的信息加工主要是通過人腦進行,隨後相繼出現了手工設備和計算機。也就是說,進行信息加工一般有手工加工和計算機加工兩種方式。採用手工管理方式進行信息加工,不僅繁瑣、容易出錯,而且其加工過程需要很長時間,已經遠遠不能滿足管理決策的需要。計算機、人工智慧等技術的不斷發展和應用,大大縮短了信息加工時間,滿足了管理者的決策需求,同時人們也從繁瑣的手工管理方式中擺脫了出來。
計算機信息加工就是利用計算機進行數據處理,而且在處理過程中,又大量採用各種數學模型。這些模型的演算法往往是相當復雜的,常常包含大量的迭代和循環。不過現在已經有許多可供選擇的軟體包,如統計軟體包、預測軟體包、數學規劃軟體包、模擬軟體包等。