『壹』 R語言創建向量、數據框以及數據框的操作
創建向量時,先給向量命名,如letters,名字後加「<-符號,接著寫函數c(元素)」,如「letters <- c(a,b,c,2,5)」。輸入"<-"的方法:同時按「alt和-」或先按"<"再按"-"。
向量只有一行,向量里元素的數據類型操作:class(向量名稱[第幾列]),如下:
給數據框的各列及各行命名,輸入函數c(元素為數字直接輸入,每個元素之間用逗號隔開,英文單詞要加引號,再用逗號分開),按要求輸入數據框的函數後,記得要輸入數據框如resualtdata,才能在結果中把數據框的各行各列內容顯示出來。
對數據框的各行和各列進的名稱修改時,方法:rownames(數據框名字)<-(各列名之間要用引號,列名之間用逗號隔開),colnames(數據框名字)<-(各行名之間要用引號,行名之間用逗號隔開),最後再把數據框名字寫上後運行。
第一種方法,class(數據框名稱[,第幾列]),第幾行的數字是空白的;同理,確定數據框中各行的數據類型,class(數據框名稱[第幾行,]),第幾列的數字是空白的。第二種方法,class(數據框名稱$第幾列的名稱),如下。
or
方法1:數據框名稱 [第幾行,第幾列];
方法2:數據框名稱["第幾行對應的名稱","第幾列對應的名稱"],此方法相應的行名和列名一定要加雙引號,否者運行是錯誤的。
4行6列:矩陣名稱<-matrix(1:24,nrow=4,ncol=6)
5行4列:矩陣名稱<-matrix(1:20,nrow=5,ncol=4)
參考在數據框中更改各行各列命名的方法,注意的是,輸入命名的函數後,運行不要從原始矩陣函數開始,不然會一直默認,應從矩陣名稱開始,或者輸入更改各行和各列的函數後,再輸入矩陣名稱,之後運行即可。
參考數據框的方法,同樣也要注意在使用X["D3","E2"]方法時,一定要給具體的行和列的名稱加引號。
在使用R語言時,輸入的字母,符號一定是用英文版,當命令發生錯誤時,要仔細核對,是不是格式出現錯誤,顯示不出結果時,輸入相應的函數後,是不是沒有輸入數據框或矩陣。
將作業寫至郵件 [email protected] ,抄送 [email protected]
『貳』 R語言更改列名
在R語言環境中,若數據集未預先命名列名,從文件data載入數據後,可以通過以下步驟為列名重新命名。首先,查看數據集的第一列,並將其更名。
例如,將數據集的第一列名稱修改為「id」:
colnames(data)[1] <- "id"
此操作僅更改變數的第一列名稱。
若需要批量更名所有列,可以採用如下代碼:
colnames(data) <- c("id","chr","dis","sample","count","maf")
此代碼將數據集的列名依次更改為「id」,「chr」,「dis」,「sample」,「count」,「maf」。完成更改後,可使用函數head(data)查看數據集前幾行,以確認列名是否已正確更新。
在數據預處理階段,為列名賦予有意義的名稱對後續分析至關重要。這樣做不僅便於理解和追蹤數據特徵,還能夠提高代碼的可讀性和維護性。