‘壹’ R语言创建向量、数据框以及数据框的操作
创建向量时,先给向量命名,如letters,名字后加“<-符号,接着写函数c(元素)”,如“letters <- c(a,b,c,2,5)”。输入"<-"的方法:同时按“alt和-”或先按"<"再按"-"。
向量只有一行,向量里元素的数据类型操作:class(向量名称[第几列]),如下:
给数据框的各列及各行命名,输入函数c(元素为数字直接输入,每个元素之间用逗号隔开,英文单词要加引号,再用逗号分开),按要求输入数据框的函数后,记得要输入数据框如resualtdata,才能在结果中把数据框的各行各列内容显示出来。
对数据框的各行和各列进的名称修改时,方法:rownames(数据框名字)<-(各列名之间要用引号,列名之间用逗号隔开),colnames(数据框名字)<-(各行名之间要用引号,行名之间用逗号隔开),最后再把数据框名字写上后运行。
第一种方法,class(数据框名称[,第几列]),第几行的数字是空白的;同理,确定数据框中各行的数据类型,class(数据框名称[第几行,]),第几列的数字是空白的。第二种方法,class(数据框名称$第几列的名称),如下。
or
方法1:数据框名称 [第几行,第几列];
方法2:数据框名称["第几行对应的名称","第几列对应的名称"],此方法相应的行名和列名一定要加双引号,否者运行是错误的。
4行6列:矩阵名称<-matrix(1:24,nrow=4,ncol=6)
5行4列:矩阵名称<-matrix(1:20,nrow=5,ncol=4)
参考在数据框中更改各行各列命名的方法,注意的是,输入命名的函数后,运行不要从原始矩阵函数开始,不然会一直默认,应从矩阵名称开始,或者输入更改各行和各列的函数后,再输入矩阵名称,之后运行即可。
参考数据框的方法,同样也要注意在使用X["D3","E2"]方法时,一定要给具体的行和列的名称加引号。
在使用R语言时,输入的字母,符号一定是用英文版,当命令发生错误时,要仔细核对,是不是格式出现错误,显示不出结果时,输入相应的函数后,是不是没有输入数据框或矩阵。
将作业写至邮件 [email protected] ,抄送 [email protected]
‘贰’ R语言更改列名
在R语言环境中,若数据集未预先命名列名,从文件data加载数据后,可以通过以下步骤为列名重新命名。首先,查看数据集的第一列,并将其更名。
例如,将数据集的第一列名称修改为“id”:
colnames(data)[1] <- "id"
此操作仅更改变量的第一列名称。
若需要批量更名所有列,可以采用如下代码:
colnames(data) <- c("id","chr","dis","sample","count","maf")
此代码将数据集的列名依次更改为“id”,“chr”,“dis”,“sample”,“count”,“maf”。完成更改后,可使用函数head(data)查看数据集前几行,以确认列名是否已正确更新。
在数据预处理阶段,为列名赋予有意义的名称对后续分析至关重要。这样做不仅便于理解和追踪数据特征,还能够提高代码的可读性和维护性。