㈠ R語言里如何生成數據統計數據框
你可以利用dplyr包進行計算,假設你的數據名為:yourdata
data <- yourdata[,c("siteNO","user","check")]
library(dplyr)
by_siteNO_USER <- group_by(data,siteNO,user)
need <- summary(by_siteNO_user,
mean =mean(check),
median=median(check))
㈡ 5、如何新建一個數據框圖層與數據框是什麼關系
ArcGIS中數據,圖層,數據框,地圖的關系(2009-10-10 ArcGIS比較突出的特點就是,數據和顯示是分離的。尤其對於矢量數據而言,弄清數據,圖層,數據框,地圖之間的關系是非常重要的。數據,這里我們也把他分成為一個個要素類,每一個要素類就是一類要素的集合。基本可以分為點要素類,線要素類和面要素類。要素類的屬性表中每一行代表一個要素,比如一條路,一塊地,一個居民點等。而圖層正是用來顯示這些要素的,存儲的是這些要素的顯示信息。用一條路來舉例,圖層中存儲了這條路用什麼樣的顏色和線形來顯示。數據本身是沒有顯示信息的,因此當每次打開一個線形的要素類時,系統會隨機的,自動給這個要素類附上一種顯示信息。所以每次打開一個要素類時,線的顏色都會不同,正是這個原因。圖層只存儲線形的顯示信息,並且通過引用數據來對數據進行某種特定線形的顯示。數據框是圖層的集合,一個數據框中可以包含多個圖層。一次編輯只能編輯同一數據框下的內容。在ArcMap的數據窗口中,也只顯示一個數據框內的信息。一個地圖文檔中可以包含多個數據框,另外地圖文檔中也可以存儲一些地圖元素,比如比例尺,指北針之類的。同一地圖文檔中的多個數據框可以在版面視圖中同時顯示出來,通過多個數據框的位置關系來生成更加美觀的地圖。比如中國地圖中添加南海諸島。則是南海諸島在一個數據框中,中國地圖在一個數據框中。這么說來,一個地圖文檔里的所有內容,可以出成一張完整的地圖。
㈢ 空白excel數據統計表做一個有下拉箭頭的數據框,怎麼做
對空白單元格單擊,然後在上面菜單里點,數據,數據有效性,設置,序列,來源可以寫
1,2,3,4
或者
男,女
也可以寫A1:A5,用已有的數據形成下拉數據
㈣ R語言創建向量、數據框以及數據框的操作
創建向量時,先給向量命名,如letters,名字後加「<-符號,接著寫函數c(元素)」,如「letters <- c(a,b,c,2,5)」。輸入"<-"的方法:同時按「alt和-」或先按"<"再按"-"。
向量只有一行,向量里元素的數據類型操作:class(向量名稱[第幾列]),如下:
給數據框的各列及各行命名,輸入函數c(元素為數字直接輸入,每個元素之間用逗號隔開,英文單詞要加引號,再用逗號分開),按要求輸入數據框的函數後,記得要輸入數據框如resualtdata,才能在結果中把數據框的各行各列內容顯示出來。
對數據框的各行和各列進的名稱修改時,方法:rownames(數據框名字)<-(各列名之間要用引號,列名之間用逗號隔開),colnames(數據框名字)<-(各行名之間要用引號,行名之間用逗號隔開),最後再把數據框名字寫上後運行。
第一種方法,class(數據框名稱[,第幾列]),第幾行的數字是空白的;同理,確定數據框中各行的數據類型,class(數據框名稱[第幾行,]),第幾列的數字是空白的。第二種方法,class(數據框名稱$第幾列的名稱),如下。
or
方法1:數據框名稱 [第幾行,第幾列];
方法2:數據框名稱["第幾行對應的名稱","第幾列對應的名稱"],此方法相應的行名和列名一定要加雙引號,否者運行是錯誤的。
4行6列:矩陣名稱<-matrix(1:24,nrow=4,ncol=6)
5行4列:矩陣名稱<-matrix(1:20,nrow=5,ncol=4)
參考在數據框中更改各行各列命名的方法,注意的是,輸入命名的函數後,運行不要從原始矩陣函數開始,不然會一直默認,應從矩陣名稱開始,或者輸入更改各行和各列的函數後,再輸入矩陣名稱,之後運行即可。
參考數據框的方法,同樣也要注意在使用X["D3","E2"]方法時,一定要給具體的行和列的名稱加引號。
在使用R語言時,輸入的字母,符號一定是用英文版,當命令發生錯誤時,要仔細核對,是不是格式出現錯誤,顯示不出結果時,輸入相應的函數後,是不是沒有輸入數據框或矩陣。
將作業寫至郵件 [email protected] ,抄送 [email protected]
㈤ 《R語言實戰》自學筆記5-數據框
數據框(data.frame)是R中最常處理的數據結構。
函數:data.frame(col1,col2,col3,....,row.name=NULL, check.rows = FALSE, check.names=TRUE, stringsAsFactors = default.stringsAsFactors())
其中的列向量col1, col2, col3,...可為任何類型(如字元型、數值型或邏輯型),每一列的名稱可由函數names指定;
row.name用於指定各行(樣本)的名稱,默認沒有名稱,使用從1開始自增的序列來標識每一行;
check.rows用於用來檢查行的名稱和數量是否一致,默認為FALSE;
check.names來檢查變數(列)的名稱是否唯一且符合語法,默認為TRUE;
stringsAsFactors用來描述是否將字元型向量自動轉換為因子,默認轉換,若不改變的話使用stringsAsFactors = FALSE來指定即可。
每一列數據的模式必須唯一,不過你卻可以將多個模式的不同列放到一起組成數據框。
先構建向量,再組成數據框。
直接用data.frame函數構建數據框。
R語言的下標索引是從1開始的,且下標索引為負數的話表示刪除某個元素。
[] 可進行索引,括弧內對應的是[行下標, 列下標]。
[1] 1 2 3 4 5 6 7 8
[1] "four"
[1] 1 2 3 4 5 6 7 8
[1] "four"
[1] 1 2 3 4 5 6 7 8
[1] "one" "two" "three"
attach、detach和with()
函數attach()可將數據框添加到R的搜索路徑中。
函數detach()將數據框從搜索路徑中移除。
函數attach()和detach()最好在你分析一個單獨的數據框,並且不太可能有多個同名對象時使用。
with()就是把所有操作都限制在數據框上。
The following objects are masked by .GlobalEnv:
[1] 1 2 3 4 5 6 7 8
[1] "n1" "n2" "n3" "n4" "n5" "n6" "n7" "n8"
[1] 8
[1] 3
[1] 8
[1] "name" "values" "values2"
[1] "r1" "r2" "r3" "r4" "r5" "r6" "r7" "r8"
[1] 8 3
[1] "data.frame"
[1] "numeric"
[1] "character"
Length:8 Min. :1.00 Min. :1.00
Class :character 1st Qu.:2.75 1st Qu.:2.75
Mode :character Median :4.50 Median :4.50
Mean :4.50 Mean :4.50
3rd Qu.:6.25 3rd Qu.:6.25
Max. :8.00 Max. :8.00
[1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
㈥ python 用groupby之後生成新的數據框
最近在做一點點風控的東西,想把toad中的ks_bucket改修正下,原碼裡面是按得分的最大最小值劃分的bucket,但我在實際的應用中想更個性化的劃分節點去統計。
首先需要解決的一個問題是把0~1上的概率給劃分到不同的區間,然後分別統計即可。
之前一直用groupby,分組後想count, sum,後變成df。在網上找了好幾種方法,都沒有成功,最後還是英文文檔解決了我的問題。
這是劃分好後的各列情況 , 第一列:概率,第二列:所屬的區間, 第三列: 實際的label
我主要是 想把這三列 , 按第二列分組,統計各區間的總數,和label為1的數
用NamedAgg 即可把原來的分組變為數據框。