『壹』 SPSS自帶案例數據文件介紹及說明
SPSS自帶案例數據文件介紹及說明
SPSS自帶案例數據文件介紹及說明SPSS初學者對案例數據文件的需求很大,其實在SPSS軟體包安裝過程中,這些文件已經自動放在你的電腦硬碟中了。那麼如何找到它呢,我前面介紹過「SPSS自帶案例數據從哪裡下載」,需要的同學可以自行查找或下載,今天分享SPSS自帶案例數據文件說明,詳見下文:
accidents.sav
該假設數據文件涉及某保險公司,該公司正在研究給定區域內汽車事故的年齡和性別風險因子。每個個案對應一個年齡類別和性別類別的交叉分類。
adl.sav
該假設數據文件涉及在確定針對腦卒中患者的建議治療類型的優點方面的舉措。醫師將女性腦卒中患者隨機分配到兩組中的一組。第一組患者接受標準的物理治療, 而第二組患者則接受附加的情緒治療。在進行治療的三個月時間里,將為每個患者進行一般日常生活行為的能力評分並作為原始變數。
advert.sav
該假設數據文件涉及某零售商在檢查廣告支出與銷售業績之間的關系方面的舉措。為此,他們收集了過去的銷售數字以及相關的廣告成本。
aflatoxin.sav
該假設數據文件涉及對穀物的黃麴黴毒素的檢測,該毒素的濃度會因穀物產量的不同(不同穀物之間及同種穀物之間)而有較大變化。穀物加工機從 8 個穀物產量的每一個中收到 16 個樣本並以十億分之幾 (PPB) 為單位來測量黃麴黴毒素的水平。
anorectic.sav
在研究厭食/暴食行為的標准症狀參照時,研究人員1對 55 名已知存在進食障礙的青少年進行了調查。其中每名患者每年都將進行四次檢查,因此總觀測數為 220。在每次觀測期間,將對這些患者按 16 種症狀逐項評分。但 71 號和 76 號患者的症狀得分均在時間點 2 缺失,47 號患者的症狀得分在時間點 3 缺失,因此有效觀測數為 217。
bankloan.sav
該假設數據文件涉及某銀行在降低貸款拖欠率方面的舉措。該文件包含 850 位過去和潛在客戶的財務和人口統計信息。前 700 個個案是以前曾獲得貸款的客戶。剩下的 150 個個案是潛在客戶,銀行需要按高或低信用風險對他們進行分類。
bankloan_binning.sav
該假設數據文件包含 5,000 位過去客戶的財務和人口統計信息。
behavior.sav
在一個經典示例中2,52 名學生被要求以 10 點的標度對 15 種情況和 15 種行為的組合進行評價,該 10 點的標度從 0 = 「極得體」到 9 = 「極不得體」。平均值在個人值之上,值被視為相異性。
behavior_ini.sav
該數據文件包含 behavior.sav的二維解的初始配置。
brakes.sav
該假設數據文件涉及某生產高性能汽車盤式制動器的工廠的質量控制。該數據文件包含對 8 台專用機床中每一台的 16 個盤式制動器的直徑測量。盤式制動器的目標直徑為 322 毫米。
breakfast.sav
在一項經典研究中3,21 名 Wharton School MBA 學生及其配偶被要求按照喜好程度順序對15 種早餐食品進行評價,從 1 =他們的喜好根據六種不同的情況加以記錄,從「全部喜歡」到「只帶飲料的快餐」。
breakfast-overall.sav
該數據文件只包含早餐食品喜好的第一種情況,即「全部喜歡」。
broadband_1.sav
該假設數據文件包含各地區訂制了全國寬頻服務的客戶的數量。該數據文件包含 4 年期間 85 個地區每月的訂戶數量。
broadband_2.sav
該數據文件和 broadband_1.sav一樣,但包含另外三個月的數據。
car_insurance_claims.sav
在別處被提出和分析的4關於汽車損壞賠償的數據集。平均理賠金額可以當作其具有伽瑪分布來建模,通過使用逆關聯函數將因變數的平均值與投保者年齡、車輛類型和車齡的線性組合關聯。提出理賠的數量可以作為刻度權重。
car_sales.sav
該數據文件包含假設銷售估計值、訂價以及各種品牌和型號的車輛的物理規格。訂價和物理規格可以從 edmunds.com和製造商處獲得。
car_sales_uprepared.sav
這是 car_sales.sav 的修改版本,不包含欄位的任何已轉換版本。
carpet.sav
在一個常用示例 5中,一家公司非常重視一種新型地毯清潔用品的市場營銷,希望檢驗以下五種因素對消費者偏好的影響:包裝設計、品牌名稱、價格、優秀家用品標志和退貨保證。包裝設計有三個因子級別,每個因子級別因刷體位置而不同;有三個品牌名稱(K2R、Glory和Bissell);有三個價格水平;最後兩個因素各有兩個級別(有或無)。十名消費者對這些因素所定義的 22 個特徵進行了排序。變數優選包含對每個概要文件的平均等級的排序。低等級與高偏好相對應。此變數反映了對每個概要文件的偏好的總體度量。
carpet_prefs.sav
該數據文件所基於的示例和在 carpet.sav中所描述的一樣,但它還包含從 10 位消費者的每一位中收集到的實際排列順序。消費者被要求按照從最喜歡到最不喜歡的順序對 22 個產品概要文件進行排序。carpet_plan.sav中定義了變數 PREF1到 PREF22包含相關特徵的標識。
catalog.sav
該數據文件包含某編目公司出售的三種產品的假設每月銷售數據。同時還包括 5 個可能的預測變數的數據。
catalog_seasfac.sav
除添加了一組從「季節性分解」過程中計算出來的季節性因素和附帶的日期變數外,該數據文件和 catalog.sav是相同的。
cellular.sav
該假設數據文件涉及某攜帶型電話公司在減少客戶流失方面的舉措。客戶流失傾向分被應用到帳戶,分數范圍從 0 到 100。得到 50 分或更高分數的帳戶可能會更換提供商。
ceramics.sav
該假設數據文件涉及某製造商在確定新型優質合金是否比標准合金具有更高的耐熱性方面的舉措。每個個案代表對一種合金的單獨檢驗;個案中會記錄合金的耐熱極限。
cereal.sav
該假設數據文件涉及一份 880 人參於的關於早餐喜好的民意調查,該調查記錄了參與者的年齡、性別、婚姻狀況以及生活方式是否積極(根據他們是否每周至少做兩次運動)。每個個案代表一個單獨的響應者。
clothing_defects.sav
這是關於某服裝廠的質量控制過程的假設數據文件。檢驗員要對工廠中每次大批量生產的服裝進行抽樣檢測並清點不合格的服裝的數量。
coffee.sav
這是關於六種冰咖啡的認知品牌形象6的數據文件。對於 23 種冰咖啡特徵屬性中的每種屬性,人們選擇了由該屬性所描述的所有品牌。為保密起見,六種品牌用 AA、BB、CC、DD、EE 和FF 來表示。
contacts.sav
該假設數據文件涉及一組公司計算機銷售代表的聯系方式列表。根據這些銷售代表所在的公司部門及其公司的等級來對每個聯系方式進行分類。同時還記錄了最近一次的銷售量、最近一次銷售距今的時間和所聯系公司的規模。
creditpromo.sav
該假設數據文件涉及某百貨公司在評價最新信用卡促銷的效果方面的舉措。為此,隨機選擇了500 位持卡人。其中一半收到了宣傳關於在接下來的三個月內降低消費利率的廣告。另一半收到了標準的季節性廣告。
customer_dbase.sav
該假設數據文件涉及某公司在使用數據倉庫中的信息來為最有可能回應的客戶提供特惠商品方面的舉措。隨機選擇客戶群的子集並為其提供特惠商品,同時記錄下他們的回應。
customer_information.sav
該假設數據文件包含客戶郵寄信息,如姓名和地址。
customer_subset.sav
來自 customer_dbase.sav的擁有 80 個個案的子集。
debate.sav
該假設數據文件涉及在某政治辯論前後對該辯論的參與者所做的調查的成對回答。每個個案對應一個單獨的響應者。
debate_aggregate.sav
該假設數據文件匯總了 debate.sav中的回答。每個個案對應一個辯論前後的偏好的交叉分類。
demo.sav
這是關於購物客戶資料庫的假設數據文件,用於寄出每月的商品。將記錄客戶對商品是否有回應以及各種人口統計信息。
demo_cs_1.sav
該假設數據文件涉及某公司在匯編調查信息資料庫方面的舉措的第一步。每個個案對應不同的城市,並記錄地區、省、區和城市標識。
demo_cs_2.sav
該假設數據文件涉及某公司在匯編調查信息資料庫方面的舉措的第二步。每個個案對應來自第一步中所選城市的不同的家庭單元格,並記錄地區、省、區、市、子區和單元格標識。還包括設計前兩個階段的抽樣信息。
demo_cs.sav
該假設數據文件包含用復雜抽樣設計收集的調查信息。每個個案對應不同的家庭單元格,並記錄各種人口統計和抽樣信息。
dmdata.sav
該假設數據文件包含直銷公司的人口統計學和購買信息。dmdata2.sav包含收到試驗郵寄的聯系人子集的信息,dmdata3.sav包含未收到試驗郵寄的其餘聯系人的信息。
dietstudy.sav
該假設數據文件包含對 "Stillman diet" 7 的研究結果。每個個案對應一個單獨的主體,並記錄其在實行飲食方案前後的體重(磅)以及甘油三酸酯的水平(毫克/100 毫升)。
dvdplayer.sav
這是關於開發新的 DVD 播放器的假設數據文件。營銷團隊用原型收集了焦點小組數據。每個個案對應一個單獨的被調查用戶,並記錄他們的人口統計信息及其對原型問題的回答。
german_credit.sav
該數據文件取自加州大學歐文分校的 Repository of Machine Learning Databases 8中的"German credit" 數據集。
grocery_1month.sav
該假設數據文件是在數據文件 grocery_coupons.sav的基礎上加上了每周購物「累計」,所以每個個案對應一個單獨的客戶。所以,一些每周更改的變數消失了,而且現在記錄的消費金額是為期四周的研究過程中的消費金額之和。
grocery_coupons.sav
該假設數據文件包含由重視顧客購物習慣的雜貨連鎖店收集的調查數據。對每位顧客調查四周,每個個案對應一個單獨的顧客周,並記錄有關顧客購物地點和方式的信息(包括那一周里顧客在雜貨上的消費金額)。
guttman.sav
Bell 9創建了一個表,用來闡釋可能的社會群體。Guttman 10引 用了該表的一部分,其中包括五個變數,用於描述以下七個理論社會群體的社會交往、對群體的歸屬感、成員的物理親近度以及關系正式性:觀眾(比如在足球比賽 現場的人們)、聽眾(比如在劇院或聽課堂講座的人們)、公眾(比如報紙或電視觀眾)、組織群體(與觀眾類似但具有緊密的關系)、初級群體(關系密切)、次 級群體(自發組織)及現代社區(因在物理上親近而導致關系鬆散並需要專業化服務)。
health_funding.sav
該假設數據文件包含關於保健基金(每 100 人的金額)、發病率(每 10,000 人的比率)以及保健提供商拜訪率(每 10,000 的比率)的數據。每個個案代表不同的城市。
hivassay.sav
該假設數據文件涉及某葯物實驗室在開發用於檢測 HIV 感染的快速化驗方面的舉措。化驗結果為八個加深的紅色陰影,如果有更深的陰影則表示感染的可能性很大。用 2,000 份血液樣本來進行實驗室試驗,其中一半受到 HIV 感染而另一半沒有受到感染。
hourlywagedata.sav
該假設數據文件涉及在政府機關和醫院工作的具有不同經驗水平的護士的時薪。
insurance_claims.sav
該假設數據文件涉及某保險公司,該公司希望構建一個模型用於標記可疑的、具有潛在欺騙性的理賠。每個個案代表一次單獨的理賠。
insure.sav
該假設數據文件涉及某保險公司,該公司正在研究指示客戶是否會根據 10 年的人壽保險合同提出理賠的風險因子。數據文件中的每個個案代表一副根據年齡和性別進行匹配的合同,其中一份記錄了一次理賠而另一份則沒有。
judges.sav
該假設數據文件涉及經過訓練的裁判(加上一個體操愛好者)對 300 次體操表演給出的分數。每行代表一次單獨的表演;裁判們觀看相同的表演。
kinship_dat.sav
Rosenberg 和 Kim 11 開始分析 15 個親屬關系項(伯母、兄弟、表兄妹、女兒、父親、孫女、祖父、祖母、孫子、母親、侄子或外甥、侄女或外甥女、姐妹、兒子和叔叔)。他們讓四組大學生(兩組 女同學,兩組男同學)根據相似程度將各項排序。他們讓其中的兩組同學(一組女同學,一組男同學)進行了兩次排序,第二次排序和第一次排序採取的標准不同。 這樣,一共得到六組「源」。每個源對應一個 15 x 15 的近似值矩陣,其單元格中的值等於源中的人數減去此源中對象被劃分的次數。
kinship_ini.sav
該數據文件包含 kinship_dat.sav的三維解的初始配置。
kinship_var.sav
該數據文件包含自變數 gender、gener(ation) 和 degree (of separation),這些變數可用於解釋 kinship_dat.sav的解的維數。具體而言,它們可用來將解的空間限制為這些變數的線性組合。
marketvalues.sav
該數據文件涉及 1999–2000 年間 Algonquin,Ill. 地區新的房屋開發中的住房銷售。這些銷售僅僅來自公眾記錄。
nhis2000_subset.sav
美國健康訪問調查 (NHIS) 是針對美國全體公民的大型人口調查。該調查對美國的具有全國代表性的家庭樣本進行了面對面的訪問,並獲取了每個家庭的成員的健康行為和健康狀態的人口統計 信息和觀察數據。該數據文件包含取自 2000 年調查信息的子集。國家健康統計中心。2000年美國健康訪問調查。公用數據文件和文檔。ftp://ftp.cdc.gov/pub/Health_Statistics/NCHS/Datasets/NHIS/2000/。2003 年發布。
ozone.sav
這些數據包含了用來根據其餘變數預測臭氧濃度的六個氣象變數的 330 個觀察值。在以前的研究人員中,12和 13發現了這些變數之間的非線性,這妨礙了標准回歸方法。
pain_medication.sav
該假設數據文件包含用於治療慢性關節炎疼痛的抗炎葯的臨床試驗結果。我們感興趣的是該葯見效的時間以及它和現有葯物的比較。
patient_los.sav
該假設數據文件包含被醫院確診為疑似心肌梗塞(即 MI 或「心臟病發作」)的患者的治療記錄。每個個案對應一位單獨的患者,並記錄與其住院期有關的一些變數。
patlos_sample.sav
該假設數據文件包含在治療心肌梗塞(即 MI 或「心臟病發作」)期間收到溶解血栓劑的患者的樣本治療記錄。每個個案對應一位單獨的患者,並記錄與其住院期有關的一些變數。
poll_cs.sav
該假設數據文件涉及民意測驗專家在確定正式立法前公眾對法案的支持水平方面的舉措。個案對應注冊的選民。每個個案記錄選民居住的縣、鎮、區。
poll_cs_sample.sav
該假設數據文件包含在 poll_cs.sav中列出的選民的樣本。該樣本是根據 poll.csplan中指定的設計來選取的,而且該數據文件記錄包含概率和樣本權重。請注意,由於該抽樣計劃使用與大小成正比 (PPS) 方法,因此,還有一個文件 (poll_jointprob.sav) 包含聯合選擇概率。在選取了樣本之後,對應於選民人群統計信息及其對提交法案的意見的附加變數將被收集並添加到數據文件。
property_assess.sav
該假設數據文件涉及某縣資產評估員在利用有限的資源不斷更新資產價值評估方面的舉措。個案對應過去一年中縣里所出售的資產。數據文件中的每個個案記錄資產所在的鎮、最後評估資產的評估員、該次評估距今的時間、當時的估價以及資產的出售價格。
property_assess_cs.sav
該假設數據文件涉及某州資產評估員在利用有限的資源不斷更新資產價值評估方面的舉措。個案對應該州的資產。數據文件中的每個個案記錄資產所在的縣、鎮和區,最後一次評估距今的時間以及當時的估價。
property_assess_cs_sample.sav
該假設數據文件包含在 property_assess_cs.sav中列出的資產的樣本。該樣本是根據property_assess.csplan中指定的設計來選取的,而且該數據文件記錄包含概率和樣本權重。在選取了樣本之後,附加變數 Current value將被收集並添加到數據文件。
recidivism.sav
該假設數據文件涉及某政府執法機構在了解其管轄區域內的屢犯率方面的舉措。每個個案對應先前的一名罪犯,並記錄其人口統計信息和第一次犯罪的詳細資料;如果在第一次被捕後兩年內又第二次被捕,則還將記錄兩次被捕間隔的時間。
recidivism_cs_sample.sav
該假設數據文件涉及某政府執法機構在了解其管轄區域內的屢犯率方面的舉措。每個個案對應在2003 年 6 月期間第一次被捕釋放的先前的一名罪犯,並記錄其人口統計信息和第一次犯罪的詳細資料,及其第二次被捕的數據(如果發生在 2006 年 6 月底之前)。根據recidivism_cs.csplan中指定的抽樣計劃從抽樣部門選擇罪犯;該計劃使用與大小成正比 (PPS)方法,因此,還有一個文件 (recidivism_cs_jointprob.sav) 包含聯合選擇概率。
rfm_transactions.sav
此假設數據文件包含購買交易數據,即每筆交易的購買日期、購買商品和消費金額。
salesperformance.sav
這是關於評估兩個新的銷售培訓課程的假設數據文件。60 名員工被分成 3 組且都接受標準的培訓。另外,組 2 接受技術培訓;組 3 接受實踐教程。在培訓課程結束時,對每名員工進行測驗並記錄他們的分數。數據文件中的每個個案代表一名單獨的受訓者,並記錄其被分配到的組以及測驗的分 數。
satisf.sav
該假設數據文件涉及某零售公司在 4 個商店位置所進行的滿意度調查。總共對 582 位客戶進行了調查,每個個案代表一位單獨客戶的回答。
screws.sav
該數據文件包含關於螺釘、螺栓、螺母和圖釘的特徵的信息14。
shampoo_ph.sav
這是關於某發製品廠的質量控制的假設數據文件。在規定的時間間隔對六批獨立輸出的產品進行檢測並記錄它們的 pH 值。目標范圍是 4.5–5.5。
ships.sav
<