導航:首頁 > 數據處理 > 數據怎麼收集

數據怎麼收集

發布時間:2022-02-08 12:20:05

1. 如何進行資料庫數據採集

關注一下.建議先研究下dz論壇附帶的個人空間那個採集器再來研究如何用java實現吧,功能要先弄清楚了才能實現.
要弄明白如何從網上採集到相關的數據?
如何把數據寫入自己的資料庫?
最後如何把這些數據放到自己網站對應的模塊裡面去?

2. 收集數據的基本方法

1、當面調查詢問法。優點:較機動靈活,不受時間、地點的限制,得到的資料也往往比較真實。缺點:所花費的人力、物力、財力會比較大。

2、電話調查法。

3、會議調查詢問法。缺點:存在從眾的心理,受影響大,調查會的效果好壞與會議組織者的組織能力、業務水平和工作能力有很大的關系。

4、郵寄調查詢問法。缺點:所花的時間比較長、最大的問題是回收率低。

5、問卷調查詢問法。優點:費用適中,回收率較高,效果良好。

(2)數據怎麼收集擴展閱讀:

信息採集技術:

1、全自動電話訪談(CATS)

近年來出現的一種使用內置聲音回答技術,取代了傳統的調研方式和電話訪談。她利用專業調研員的錄音來代替訪問員逐字逐句地念出問題及答案。回答者可以將封閉式問題答案通過電話上的撥號盤鍵入,開放式問題的答案則被逐一錄在磁帶上。

2、互動式計算機輔助電話訪談(CATS)

互動式計算機輔助電話訪談是中心控制電話訪談的「電腦化」形式,每一位訪問員各坐在一台計算機終端或個人電腦前,當被訪問者電話被接通後,訪問員通過一個或幾個鍵啟動機器開始提問,問題和多選題的答案便立刻出現在屏幕上。這一方法省略了數據的編輯及錄入的步驟。

3、電腦櫃調研

電腦櫃調研是一種類似於公用電話亭的電腦直接訪談調研方式帶觸摸屏的計算機存放在可自由移動的櫃子里,計算機可以設計程序以指導復雜的調研,並顯示出全顏色的掃描圖像(產品、商店外觀等),還可以播放聲音和電視影像。

3. 如何進行數據採集以及數據分析

如何進行數據採集以及數據分析?可以從免費輿情監測系統 輿情調查軟體就從輿情監測系統的架構說起是,因為他們的技術手段都是一樣的呢
1、輿情採集系統:
一、只要是互聯網上發生的與「我」相關的輿情信息,都可以第一時間監測到,並且以最直觀的方式顯示出來,「一網打盡,一目瞭然」。監測網站類型包括:新聞、論壇、博客、貼吧、微博、電子報、搜索引擎等。
二、對於重點輿情以及負面信息通過手機簡訊等方式及時預警,不需要有專人值守就可以隨時掌握輿情。
三、自動分析輿情信息的發展變化趨勢、輿情信息的首發網站、作者、轉載情況、熱度變化、評估干預處理之後的效果等。
四、自動生成各種統計分析報表和輿情報告,助力輿情工作。配合相應的工作機制,可以有效提升輿情監管的質量和效率,提升輿情應對水平。
五、除了提供系統級7*24小時的運維服務,還配備專門的輿情分析師協助監測,人工預警。 系統建設目標是整合互聯網信息渠道,形成系統、有效的輿情監測機制。實現系統運行,監控互聯網信息、新浪、騰訊等主要微博微博,對其進行實時數據採集、全網監控、分析、檢索,對敏感信息進行預警,防止負面信息傳播,對重大事件做出最及時的反應和相應處理建議。並對近一段時期的熱點問題、敏感詞句進行搜索,從而掌握網路輿情,輔助領導決策服務。 主要的門戶網站,主要的報紙、主要的大型網路論壇、社區、貼吧、博客、微博。例如新浪新聞、各大報紙的電子報、天涯論壇、新浪微博、網路貼吧等。 各類與我相關的以及區域內有影響力的網站。 網路、谷歌、360搜索等搜索引擎。 論壇搜索,博客搜索、微博搜索等專業搜索引擎。 重點網站提供的站內搜索等。
2、輿情分析系統:

分析引擎是本系統的關鍵組成部分。其主要作用是對採集系統採集的數據,自動進行智能分析。分析引擎的主要功能包括:自定分析輿情級別、自動生成熱點、負面輿情研判、自動分類、自動生成專題、轉載計算、自動抽取輿情要素和關鍵詞、自動摘要、自動預警、自動生成統計圖表等功能。例如:多瑞科輿情數據分析站系統引擎內置了政府輿情模型、企業輿情模型和垂直監控模型,這些分析模型,是在多年輿情行業中按照客戶的實際需求,不斷重構和完善起來的,具有良好的實際應用效果。在實際項目中,不用通過二次開發就可以全面滿足政府、企業單獨應用。或者通過SAAS平台完成從上到下的垂直監測需求。對於特殊的應用需要,分析引擎還支持擴展插件,用於快速完成二次開發,支持各種需求定製。
3、輿情服務平台:
主要是用戶進行日常輿情管理的平台,能夠及時接受輿情信息,進行一些常規的輿情管理工作。

4. 數據的採集和收集

(一)測井系列的選擇

測井時,根據地層的特點和地質任務的要求,選擇一套合適的測井方法。這種能完成一定地質任務的測井方法組合,叫做測井系列。

按照劃分油氣水層的要求,選擇良好的測井系列應能做到:准確地分層、確定地層的界面;計算地層厚度和有效厚度;准確地判斷岩性和劃分滲透層;准確地計算儲層參數,如孔隙度、滲透率、泥質含量和含油飽和度、可動油等;准確地判斷油氣水層。

使用國產儀器時:

1.淡水泥漿測井系列

厚度大於2 m、電阻率小於20 Ω·m的中厚層、中低阻砂岩地層的測井系列為微電極系,電極距離為0.45 m、4 m的底部梯度電極類,聲速以及感應測井,有的油田還加井徑測井或自然伽馬測井。各種方法的用途是:微電極系和0.45 m底部梯度電極系詳細劃分地層岩石;微電極系、自然電位和聲速測井判斷岩性和劃分滲透層;微電極系反映沖洗帶,0.45 m底部梯度電極系反映侵入帶,4 m底部梯度電極系反映原狀地層岩石;聲速測井計算孔隙度;感應測井電阻率確定含油飽和度。

中厚層、電阻率大於20 Ω·m的高阻砂岩,要用側向測井代替感應測井,即測井系列為微電極(或微側向)、0.45 m和4 m底部梯度電極系、側向測井和聲速測井。

2.鹽水泥漿測井系列

在鹽水泥漿鑽井中,必須使用有聚焦能力的側向測井和微側向測井;用自然伽馬測井代替自然電位測井。這樣,鹽水泥漿的測井系列為微側向測井、自然伽馬測井、聲速測井、側向測井。

3.碳酸鹽岩測井系列

深、淺三側向測井、自然伽馬測井、中子-伽馬測井、聲速測井,2.5 m底部梯度電極系、自然電位(自然伽馬)是碳酸鹽岩的測井系列。

需要說明的是,上述測井系列並不一定是最佳的。隨著我國測井事業的發展,測井儀器的完善,上述測井系列將會有較大的調整,以取得更好的地質效果。

使用進口儀器時:

1)中等—軟地層、淡水泥漿條件下,使用以下測井方法:雙感應測井/球形聚焦(或八側向)測井—聲波速度測井、岩性—密度—中子—微電阻率—電磁波傳播測井。得到的測井曲線是:SP、ILd、ILm、SFL、Δt、Rwa、DEN、GR、U、Th、K、Pe、φD、φN、φEPT等。條件許可時,再加測地層傾角測井。

2)硬地層或鹽水泥漿條件時使用:雙側向測井—微球形聚焦測井、雙感應—球形聚焦測井—聲速測井、岩性—密度—中子—自然伽馬能譜測井。得到的測井曲線有:SP、LLd、LLs、MSFL、DEN、ILd、ILm、SFL、Δt、GR、U、Th、K、Pe、φD、φN等。有可能時,加測地層傾角測井、成像測井和核磁共振測井。

(二)地質錄井資料

1.泥漿錄井資料

用測井方法進行油氣水層評價時,直接需要泥漿相對密度、泥漿礦化度、泥漿電阻率、泥漿濾液電阻率、泥漿濾液礦化度、泥餅厚度等錄井資料。

在泥漿尋井過程中出現的油氣顯示異常數據資料也應認真全部收集,以便在測井油氣評價時間接參考使用。

2.鑽時錄井資料

鑽進速度的快慢,取決於地下岩層的可鑽性,即疏鬆性軟的岩層鑽進快;緻密堅硬的岩層鑽進慢。所以在進行測井油氣層評價時,常用來幫助判斷岩石的組成、沉積的類型、壓實程度,以及其他岩石物理性質。

對於碳酸鹽岩裂縫性油氣藏來說,鑽時的變化是發現縫、洞最及時的一項錄井資料。

3.岩屑錄井資料

岩屑錄井資料是鑽井地質評價中最及時、便宜、不可缺少的直接資料。

4.岩心錄井資料

石油地質工作者,對地下可能油氣藏的認識都是一種抽象,各人認識的抽象未必相同。只憑岩屑、鑽時、泥漿等錄井資料是不夠的,必須取得能夠直觀的、可提供作仔細分析化驗之用的岩心資料。有了岩心資料,就可以研究地層時代,岩性岩相變化,儲集層的物理性質,化學性質和裂縫發育情況,生儲層特徵及生油指標,儲層含油產狀,了解地層傾角、接觸關系、斷點位置等構造情況。

鑽井岩心錄井資料是測井的油氣評價和測井地質解釋研究的基礎。通過鑽井岩心的觀察和實驗室分析化驗獲取的地質信息和參數進行各種標定或刻度,在所建立的地質概念模型的基礎上,應用正演和反演模型,建立正確可靠的岩石物理與測井的關系,為提高測井地質的解釋精度奠定堅實的基礎。

(三)測井資料

1.測井數據

測井技術是油氣層評價和測井地質學研究應用重要的手段。根據地質分析與油氣評價的目的任務,可以由下述測井項目中形成測井系列進行測井數據資料的採集。

(1)常規測井項目

1)雙側向測井(DDL);

2)微側向測井(MLL);

3)補償中子測井(CN);

4)補償聲波測井(AC);

5)補償Z密度測井(Z-DEN);

6)自然伽馬測井(GR);

7)井徑測井(CAL);

8)自然電位測井(SP)。

(2)特殊測井項目

1)自然伽馬能譜測井(SL);

2)地層傾角測井(DIP);

3)重復式地層測試器(FMT)。

(3)現代測井項目

1)微電阻率掃描成像測井(STAR);

2)井周聲波成像測井(CBIL);

3)多極陣列聲波測井(MAC);

4)核磁共振測井(MRIL);

5)薄層電阻率測井(TBRT)。

目前在我國,進行地球物理測井工作時,根據解決油氣勘探與開發的實際需要設計組合成裸眼井和套管井測井系列,所測的資料經過精細處理和解釋,可進行地層岩性識別、解決硬地層的裂縫段的劃分、評價及裂縫產狀的確定、地層產狀的確定,識別低阻油氣層、劃分與評價薄層,還可進行固井質量檢查及管井的動態監測等等。測井系列的選擇應用,可參見表6-1。

表6-1 測井系列一覽表

2.測井解釋參數

測井的定量解釋評價油氣層採用了兩種不同類型的解釋模型和方法導出的一些數學關系式,即體積模型法和概率模型法,是目前測井資料數字處理所採用的基本方法。利用上述模型進行定量測井解釋時,除了需要地質鑽井資料和測井數據資料外,還需要測井解釋參數。

1)利用密度測井解釋基本公式時,需要岩石骨架密度(ρma)、泥質密度(ρsh)、孔隙流體密度(ρf)、泥質的相對體積(Vsh)。

2)利用聲波測井解釋基本公式時,需要岩石骨架聲波時差(Δtma)、泥質聲波時差、孔隙流體聲波時差(Δtf)、泥質的相對體積(Vsh);

3)利用中子測井解釋基本公式時,需要岩石骨架含氫指數(φma)、泥質含氫指數(φsh)、孔隙流體含氫指數(φf)、泥質的相對體積(Vsh)。

4)利用脈沖中子測井解釋基本公式時,需要岩石骨中子俘獲截面Σma、孔隙流體中子俘獲截面Σf、泥質中子俘獲截面Σsh

在用經驗關系式確定含水飽和度(Sw)和沖洗帶飽和度(Sxo)時,需要地層水電阻率(Rw)、泥漿濾液電阻率(Rmf)和孔隙度(φ)。

在用泥質的相對體積(泥質含量)經驗關系式確定泥質含量時,也需要給出測井解釋參數:

1)利用自然伽馬測井計算泥質體積公式時,則需要給出CGR,max(純泥岩地層的GR值)和CGR,min(CGR純砂岩層的GR讀數)。

2)利用自然電位測井計算泥質體積公式時,需要給出USP,max(純砂岩的SP幅度)和USP,min(純泥岩層的SP幅度)。

3)利用中子測井計算泥質含量公式時,需要給出φN,max(純砂岩地層的中子孔隙度值)和φN,min(純泥岩層的中子孔隙度值)。

4)利用中子壽命測井計算泥質含量公式時,需要給出Σmax(純砂岩地層的中子俘獲截面)和Σmin(純泥岩層的中子俘獲截面)。

5)利用聲波測井方法時需要給出φACSH(純泥岩地層聲波孔隙度)。

6)利用能譜測井計算時,需要給出純泥岩地層的鉀和Th含量,純砂岩地層的K和Th含量。

7)利用電阻率測井計算泥質含量時,需要給出Rsh(純泥岩層電阻率)和Rmax(純產油層最大電阻率)。

8)利用密度-中子、中子-聲波、密度-聲波等交會圖方法計算泥質含量時需要給出φNma、φNsh、ρma、ρsh、ρf、Δtf、Δtma、Δtsh等測井解釋參數。

在利用核磁共振測井研究和計算儲層的毛管束縛流體體積、自由流體體積、地層有效孔隙度、滲透率和孔隙結構時,關鍵性的測井解釋參數應該有φ(孔隙度)、T2cutoff、ρ(表面弛豫強度)。

在利用Waxman和Smits方程計算儲層含水飽和度時,需要給出總連通孔隙度φe、地層水電阻率Rw和陽離子交換量QV等參數。

5. 如何收集大數據

可用爬蟲爬取。既然是大數據,相信需要的體量不會太小吧,個人系統爬取難度和成本應該不會很小,建議找一家做大數據的公司代勞,省時省力,也花不了多少錢。

6. 拼多多商品數據怎麼收集

拼多多商品數據可以用多多情報通收集,多多情報通運用先進的大數據採集、清洗及儲存等大數據開發技術,通過對整個電商平台的公開交易數據進行抓取和分析,為各類目行業網店運營商家提供精準的商業數據。通過對數據的解讀,商家可以很直觀地了解行業細分類目市場的整體趨勢及消費者偏好,把握全局數據。並且還能對目標店鋪的商品定價策略、鋪貨策略、營銷策略等高價值商情和核心數據全盤掌握。多多情報通數據分析軟體

7. 數據怎麼收集數據怎樣管理

建立資料庫;

若果不明白,嘗試做表格,拆分數據不同的特性,組合相關的特性;
老師做成績表也是一種資料庫;

可以先嘗試使用excel做表格,分析相關和非相關特性;整理出來,後期想自己深入就去學資料庫,不想學可以外包,讓別人做,然後做數據查詢軟體等等……

8. 大數據怎麼收集

一般來說,有些人尋找數據,是為了做出正確的商業決策;有些人要完善自己的技能,在事業上更上層樓;另一些人或為社會,或為科學而搜尋數據。

特別是,有些人收集詳細的數據,是為了做出統計分析,卻不知道絕大多數的人可以找到已經為他們做好了一部分統計分析的資訊,包括報告、表單數據的總匯,甚至只是具體事實,幾乎所有的人都能夠找到對他們有用的數據。

由於不知道怎樣尋找豐富的數據,許多人根本不去尋找。他們根據自己的個人觀點做決定,或者根據新聞報導做決定,即使使用數據,也不知道使用對他們有用的數據類型或數據的來源。

想要找到需要的數據,必須要有明確的目標,和使用它的目地。資訊的目標越清晰,找到合適的資源就越容易。

下面是四種主要的數據來源,可以引導你找到最好的數據。

1)內部資訊

自己工作單位裡面已經有的資訊,是獲取數據首先應該考慮的地方。你可以找到對你的機構特別相關的、競爭者找不到的,詳細的數據。

這並不容易,你必須明白是什麼部門收集和保存這些數據,如何能夠訪問這個網址,以及允許什麼樣的用途。這是為什麼明確的、詳細的目標是如此的重要。

你可能需要向管理階層提出正式申請,獲得准許,而成功與否則要看你的特定目標和一個清晰的商業案例。

拒絕走後門或捷徑的誘惑。 你的IT部門設下的規則也許讓你頭痛, 但是它們的設立是為了保證你的工作單位遵守法律。

2)政府及非營利組織

如果你必須從單位以外的地方搜尋數據,一定要盡量從政府機構或非營利組織搜尋資料。每一個政府機構都會收集數據,而且它們有法律上的義務同公眾分享,至少分享一部分數據。 海量多的資料就在電腦、電話或公共圖書館里,等你使用。

政府機構的數據有些是交易型的 ,就是為了做出分析,特別收集起來的一份政府活動記錄或統計; 例如財產轉讓和投票記錄,就是交易型的數據。人口普查是統計數據,消費物價指數也是。雖然交易數據通常只有詳細的表格,例如個人的交易記錄,但是為了保護個人隱私,統計數據通常是匯總的型態。

有些機構的數據比別的機構有用,但是首先你得找到這個機構才能找到其它。需要一般美國人的數據,找美國人口普查局;需要知道豬腩的價格,找農業部。網上有一個門戶網站data.gov,可以幫你找到數據,但是如果你不熟悉術語或找不到正確的名稱,別放棄,可以打電話到似乎最適合的機構去問。

許多非營利組織是他們的專業領域中良好的數據來源。例如企業信息,就要調查相關的行業協會。一個很好的資料來源是《協會網路全書》( Encyclopedia of Associations),包含有企業協會、社會事業協會和研究協會。這本書在大多數公共圖書館和大學圖書館里都可以找到。 記住,這些機構通常分享的資訊都是報告的形式,不是數據,所以向他們申請資訊時要說清楚你要的是數據。

如果網上找到的數據來源不明確、不對應,不要使用它。網上浮動的數據集對於練習數據分析的人可能很有用, 但是如果你要靠它來決定策略,你最好知道它的正確來源。

3)商業性

如果你需要的數據無法從內部、政府機構,或非營利組織得到,不妨考慮購買它。 有些由政府收集和格式化的數據意義重大,價錢也便宜。不過要小心,並非所有的商業性數據的質量都好。在花費大價錢購買以前,問問出售者數據是怎樣得到的,如何處理的,並且調查一些樣本。

4)收集新的數據

最後一招是,由於數據根本不存在,而無法找到時,不妨自己出去收集一下。這要看你需要的是什麼數據。你可以根據你所需要的數據,進行一項調查,安裝感測器或派人出去觀察、衡量,得出數據。這可能會即花時間又花錢,好處是你收集的數據是你真正需要的,而且完全屬於你自己。

9. 如何收集數據

採集的樣本要能夠代表總體,並且分布均勻
根據任務目標的不同,明確待採集樣本的總體。不能把調研女性購物習慣的問卷廣泛的撒給包括男生在內的所有人群,要精準投放調查。不能只調研商場購物的女性的特點,而忽略網路購物,小市場購物,海淘購物等女性客戶的特點,要分布均勻。

明確記錄樣本採集的條件和環境
不同條件下的采樣樣本,會有不同的表現。要詳細的記錄采樣時的上下文,這樣才能在以後分析的時候明確哪些可能是干擾因素,也能夠幫助理解數據分析看到的一些現象。

使用高效的采樣工具
只有數據量大到一定程度,才具有統計學的意義,我們才可以根據數據分析結果得到統計學上的結論。因此,在短時間內,以較少的人力物力獲得樣本是很重要和必要的。如果研究領域有現成的采樣工具就再好不過了,務必在采樣之前詳細調研和分析現有的采樣工具,或者自行研究高效的采樣工具和設計采樣方法。

預處理樣本
採集到的數據質量參差不齊,會有數據錯誤,數據丟失的現象存在。因此,在真正利用數據進行分析之前,要對數據進行清洗。主要需要解決的問題是:如何使用殘缺樣本?某些樣本有部分數據殘缺,是因為沒有采樣到呢?還是因為某些樣本就不應該有這些數據?需要人工分析下原因,再決定以何種方式補全樣本的殘缺屬性或者丟棄樣本。

利用統計指標或數據挖掘技術合理分析樣本
當採集好了大量的數據,肉眼是無法了解數據說明什麼問題的。因此需要使用統計學上的常見指標或者數據挖掘技術來分析樣本。統計學上的指標一般有概率分布,中位數,期望,方差,相關系數等。數據挖掘技術一般有聚類,分類,關聯分析,時序分析等。

分析統計結果的具體含義
統計學的結果得到了之後,我們還需要理解各個參數能夠說明什麼問題。這些參數的表現是否符合人們的常識和規律,如果不符合是因為什麼原因造成的。然後根據統計結果來得出結論或者繼續修正樣本採集和分析的任務。

7
備份樣本和各個階段的預處理樣本
最重要的,好不容易採集好的樣本,丟了或者弄出錯實在可惜。所以要認真備份原始的樣本以及各個階段的預處理樣本和相應的處理方法。這樣即使當前數據出了錯誤,還可以回滾到原始的版本,而不會沒有樣本可用。

閱讀全文

與數據怎麼收集相關的資料

熱點內容
學生技術很差怎麼辦 瀏覽:927
找水果代理怎麼做 瀏覽:603
懂車帝打不開小程序怎麼辦 瀏覽:486
全市場公募保險機構多少家 瀏覽:779
如何開一個水產批發市場 瀏覽:912
子宮息肉怎麼吃完美產品調理 瀏覽:384
桂林銀行拒絕該交易多久解除 瀏覽:815
屏蔽群發信息怎麼解除 瀏覽:467
廣告代理費用怎麼算 瀏覽:425
計算機子程序是什麼 瀏覽:858
船務代理有什麼意義 瀏覽:202
如何跳槽美國程序員 瀏覽:980
百老泉怎麼做區域代理 瀏覽:8
信宜人民政府網招錄信息欄在哪裡 瀏覽:323
如何開通小程序接收驗證碼 瀏覽:662
平台買的信息屬於什麼費用 瀏覽:795
如何使用微信查看朋友的信息 瀏覽:841
如何看待現在理財產品違約 瀏覽:963
做酸奶代理商怎麼樣 瀏覽:457
python怎麼爬取數據 瀏覽:583