㈠ R语言里如何生成数据统计数据框
你可以利用dplyr包进行计算,假设你的数据名为:yourdata
data <- yourdata[,c("siteNO","user","check")]
library(dplyr)
by_siteNO_USER <- group_by(data,siteNO,user)
need <- summary(by_siteNO_user,
mean =mean(check),
median=median(check))
㈡ 5、如何新建一个数据框图层与数据框是什么关系
ArcGIS中数据,图层,数据框,地图的关系(2009-10-10 ArcGIS比较突出的特点就是,数据和显示是分离的。尤其对于矢量数据而言,弄清数据,图层,数据框,地图之间的关系是非常重要的。数据,这里我们也把他分成为一个个要素类,每一个要素类就是一类要素的集合。基本可以分为点要素类,线要素类和面要素类。要素类的属性表中每一行代表一个要素,比如一条路,一块地,一个居民点等。而图层正是用来显示这些要素的,存储的是这些要素的显示信息。用一条路来举例,图层中存储了这条路用什么样的颜色和线形来显示。数据本身是没有显示信息的,因此当每次打开一个线形的要素类时,系统会随机的,自动给这个要素类附上一种显示信息。所以每次打开一个要素类时,线的颜色都会不同,正是这个原因。图层只存储线形的显示信息,并且通过引用数据来对数据进行某种特定线形的显示。数据框是图层的集合,一个数据框中可以包含多个图层。一次编辑只能编辑同一数据框下的内容。在ArcMap的数据窗口中,也只显示一个数据框内的信息。一个地图文档中可以包含多个数据框,另外地图文档中也可以存储一些地图元素,比如比例尺,指北针之类的。同一地图文档中的多个数据框可以在版面视图中同时显示出来,通过多个数据框的位置关系来生成更加美观的地图。比如中国地图中添加南海诸岛。则是南海诸岛在一个数据框中,中国地图在一个数据框中。这么说来,一个地图文档里的所有内容,可以出成一张完整的地图。
㈢ 空白excel数据统计表做一个有下拉箭头的数据框,怎么做
对空白单元格单击,然后在上面菜单里点,数据,数据有效性,设置,序列,来源可以写
1,2,3,4
或者
男,女
也可以写A1:A5,用已有的数据形成下拉数据
㈣ R语言创建向量、数据框以及数据框的操作
创建向量时,先给向量命名,如letters,名字后加“<-符号,接着写函数c(元素)”,如“letters <- c(a,b,c,2,5)”。输入"<-"的方法:同时按“alt和-”或先按"<"再按"-"。
向量只有一行,向量里元素的数据类型操作:class(向量名称[第几列]),如下:
给数据框的各列及各行命名,输入函数c(元素为数字直接输入,每个元素之间用逗号隔开,英文单词要加引号,再用逗号分开),按要求输入数据框的函数后,记得要输入数据框如resualtdata,才能在结果中把数据框的各行各列内容显示出来。
对数据框的各行和各列进的名称修改时,方法:rownames(数据框名字)<-(各列名之间要用引号,列名之间用逗号隔开),colnames(数据框名字)<-(各行名之间要用引号,行名之间用逗号隔开),最后再把数据框名字写上后运行。
第一种方法,class(数据框名称[,第几列]),第几行的数字是空白的;同理,确定数据框中各行的数据类型,class(数据框名称[第几行,]),第几列的数字是空白的。第二种方法,class(数据框名称$第几列的名称),如下。
or
方法1:数据框名称 [第几行,第几列];
方法2:数据框名称["第几行对应的名称","第几列对应的名称"],此方法相应的行名和列名一定要加双引号,否者运行是错误的。
4行6列:矩阵名称<-matrix(1:24,nrow=4,ncol=6)
5行4列:矩阵名称<-matrix(1:20,nrow=5,ncol=4)
参考在数据框中更改各行各列命名的方法,注意的是,输入命名的函数后,运行不要从原始矩阵函数开始,不然会一直默认,应从矩阵名称开始,或者输入更改各行和各列的函数后,再输入矩阵名称,之后运行即可。
参考数据框的方法,同样也要注意在使用X["D3","E2"]方法时,一定要给具体的行和列的名称加引号。
在使用R语言时,输入的字母,符号一定是用英文版,当命令发生错误时,要仔细核对,是不是格式出现错误,显示不出结果时,输入相应的函数后,是不是没有输入数据框或矩阵。
将作业写至邮件 [email protected] ,抄送 [email protected]
㈤ 《R语言实战》自学笔记5-数据框
数据框(data.frame)是R中最常处理的数据结构。
函数:data.frame(col1,col2,col3,....,row.name=NULL, check.rows = FALSE, check.names=TRUE, stringsAsFactors = default.stringsAsFactors())
其中的列向量col1, col2, col3,...可为任何类型(如字符型、数值型或逻辑型),每一列的名称可由函数names指定;
row.name用于指定各行(样本)的名称,默认没有名称,使用从1开始自增的序列来标识每一行;
check.rows用于用来检查行的名称和数量是否一致,默认为FALSE;
check.names来检查变量(列)的名称是否唯一且符合语法,默认为TRUE;
stringsAsFactors用来描述是否将字符型向量自动转换为因子,默认转换,若不改变的话使用stringsAsFactors = FALSE来指定即可。
每一列数据的模式必须唯一,不过你却可以将多个模式的不同列放到一起组成数据框。
先构建向量,再组成数据框。
直接用data.frame函数构建数据框。
R语言的下标索引是从1开始的,且下标索引为负数的话表示删除某个元素。
[] 可进行索引,括号内对应的是[行下标, 列下标]。
[1] 1 2 3 4 5 6 7 8
[1] "four"
[1] 1 2 3 4 5 6 7 8
[1] "four"
[1] 1 2 3 4 5 6 7 8
[1] "one" "two" "three"
attach、detach和with()
函数attach()可将数据框添加到R的搜索路径中。
函数detach()将数据框从搜索路径中移除。
函数attach()和detach()最好在你分析一个单独的数据框,并且不太可能有多个同名对象时使用。
with()就是把所有操作都限制在数据框上。
The following objects are masked by .GlobalEnv:
[1] 1 2 3 4 5 6 7 8
[1] "n1" "n2" "n3" "n4" "n5" "n6" "n7" "n8"
[1] 8
[1] 3
[1] 8
[1] "name" "values" "values2"
[1] "r1" "r2" "r3" "r4" "r5" "r6" "r7" "r8"
[1] 8 3
[1] "data.frame"
[1] "numeric"
[1] "character"
Length:8 Min. :1.00 Min. :1.00
Class :character 1st Qu.:2.75 1st Qu.:2.75
Mode :character Median :4.50 Median :4.50
Mean :4.50 Mean :4.50
3rd Qu.:6.25 3rd Qu.:6.25
Max. :8.00 Max. :8.00
[1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
㈥ python 用groupby之后生成新的数据框
最近在做一点点风控的东西,想把toad中的ks_bucket改修正下,原码里面是按得分的最大最小值划分的bucket,但我在实际的应用中想更个性化的划分节点去统计。
首先需要解决的一个问题是把0~1上的概率给划分到不同的区间,然后分别统计即可。
之前一直用groupby,分组后想count, sum,后变成df。在网上找了好几种方法,都没有成功,最后还是英文文档解决了我的问题。
这是划分好后的各列情况 , 第一列:概率,第二列:所属的区间, 第三列: 实际的label
我主要是 想把这三列 , 按第二列分组,统计各区间的总数,和label为1的数
用NamedAgg 即可把原来的分组变为数据框。