導航:首頁 > 數據處理 > 縱向數據如何描述

縱向數據如何描述

發布時間:2023-03-29 02:37:54

㈠ 課件中縱向數據的特點列舉的有幾項

縱向數據(Longitudinaldata)或面板數據(Paneldata)面板數據,即PanelData,是截面數據與時間序列綜合起來的一塵悶種數據資源。
橫截派譽彎面數據(Cross-sectionaldata)橫截面數據是指在某一時點收集的不同對象的數據。它對應同一時點上不同空間(對象)所組成的一維數據集合,研究的是某一時點上的某種經濟現象,突出空間(對象)的差異。橫截面虛差數據的突出特點就是離散性高。
時間序列數據(Time-seriesdata)時間序列數據是指對同一對象在不同時間連續觀察所取得的數據。
3、縱向數據(Longitudinaldata)或面板數據(Paneldata)面板數據,即PanelData,是截面數據與時間序列綜合起來的一種數據資源。

㈡ 醫學生都想學的縱向隨訪數據分析,你學會了嗎

                                                                              作者丨Lily

                                                     來源丨醫數思維雲課堂(ID:Datamedi)   

在醫學臨床實驗研究中,我們經常會收集到患者的多次 重復測量縱向隨訪數據 ,即每一個患者都有多次觀測值,這些觀測值是在不同時間記錄的,觀測次數、時間和間隔都不一定一樣,且多次觀測值都具有潛在相關性,往往在做分析時是我們更需要關注的。

那麼問題來了,面對不同於我們經常收昌仔塵集到的橫斷面數據,該如何處理分析這些縱向數據呢?別急耐禪,聽我慢慢道來。

針對 縱向隨訪數據 ,結合數據特點,應利用 線性混合效應模型 進行建模。該模型包含了 固定效應以及隨機效應 ,其中隨機效應描述的是在不同層次的不同水平中,各變數對總體觀察變數的貢獻。

那針對線性混合效應模型,如何建模分析呢?今天我推薦R語言當中線性混合效應模型的兩個包:

1、 nlme包,這是相對成熟的R包,它除了可以分析分層的線性混合效應模型,也可以處理非線性模型。在優勢方面,個人認為它可以處理相處復雜的線性和非線性模型,可以定義方差協方差結構,也可以在廣義線性模型中定義連接函數。缺點呢,隨機效應的定義過於呆板,並且當數據量很大時,速度很慢,也不能處理多元數據。

2、 lme4包,相對於nlme包而言,它的運行速度快一點,對於固定效應、隨機效應的結構也可以相對更復雜一點。但是不能處理協方差和相關系數結構。

接下來通過案例,讓我們更好的理解這個模型:

例: 牛奶蛋白質含量 這個數據是縱向數據的一個典型的例子。曾經被Diggle,et.al.(2013)等研究過,這個數據關於79頭澳大利亞的奶牛牛奶蛋戚坦白質含量和三種飼料的關系,對每一頭奶牛計劃觀測19次,每周一次,但是結果得到,有些奶牛觀測了19周,有些不到19周,還有最少的觀察了12次。

變數名稱變數解釋

id牛的編號

week第幾周

protein蛋白質含量

diet飼料種類:1.barley;2.lunpins;3.mixed

01  數據的基本描述

library(lattice)

data_milk<-read.csv("milk.csv")

head(data)

xyplot(protein ~ week | diet, data = data_milk,

       type = c("b", "smooth"), lwd = 2,

       as.table = TRUE, ylab = "protein",

       xlab = "Time (weeks)")

02  建立線性混合效應模型

1、 nlme包

library(nlme)

model1<-lme(protein~week+diet,random=~week|id,data_milk,method="ML")

summary(model1)

結果如下:

接下來我們可以用 F檢驗來看各個變數的顯著性 :

anova(model1)

結果如下:

通過上述結果來看,兩個變數都顯著,但week的系數是負數,這是由於總體上,一開始試驗時牛奶的蛋白質含量大多相對較高,後面有幾周下降,然後有回升,所以總體來說似乎隨時間是下降的。

2、 lme4包 ,但是推薦使用 lmerTest包 ,它的結果可以 輸出P值 ,即顯著性結果值。

library(lme4)

library(lmerTest)

model2<-lmer(protein~week+diet+(week|id),data_milk)

summary(model2)

結果如下:

通過上述兩個包建立的模型可以看出,得到的結果幾乎一樣,但是 lmer()函數 針對變數較多時建立模型較好,運行速度較快。同時也可以看得出,我們的響應變數是定量變數,因此,我們選擇建立線性混合效應模型,但若是我們的 響應變數是分類變數 ,那方法就不一樣咯。

怎麼樣?是不是挺簡單的,希望大家多多練習。如果你有關於回歸分析方面的問題,可以及時聯系我,我一定不遺餘力喲,期待我們的再次相約。

㈢ 縱向數據

Longtitudinal Data是當今統計學的一個前沿問題,其主要發展時間不超過50年,最早人們採用anova和manova來分析,現在已經存在的主要處理方法是Mixed Effect Model,尤其是linear Mixed Effect Model。與其相關的熱點是有孫前missing data的縱向數據分析,人們發展了selection model,shared parameter model等來進行處理,各喊凱悄種模型的敏感性分析也只一個當前的鄭渣熱點,09年有數片相關文章發表在Biometrics等雜志上

閱讀全文

與縱向數據如何描述相關的資料

熱點內容
三十萬做什麼代理 瀏覽:258
祛斑的合格產品有什麼標志 瀏覽:158
信息技術模擬考試怎麼登陸 瀏覽:399
海外點餐的微信小程序是什麼 瀏覽:965
微信小程序裡面的游戲在哪裡 瀏覽:762
小程序輕應用是什麼意思 瀏覽:652
代理商的錢怎麼處理 瀏覽:874
雙方不信任怎麼交易 瀏覽:320
歐美發達國家市場對什麼比較看重 瀏覽:979
番禺東江市場賣什麼 瀏覽:223
發現買賣粉絲可以投訴到什麼信息 瀏覽:793
到室外推銷產品怎麼做 瀏覽:600
什麼是單位信息採集表 瀏覽:169
蘋果手機怎麼設置數據和wifi使用 瀏覽:61
cf皮膚卡怎麼交易 瀏覽:12
審計項目如何履行程序 瀏覽:600
在哪裡能查詢到退費信息 瀏覽:505
我想做家電代理現在應該怎麼辦呢 瀏覽:12
雨刷數據怎麼判斷下雨 瀏覽:370
仲裁後如何啟動監督程序 瀏覽:192