A. R語言自學筆記-2內置數據集
#b站視頻——R語言入門與數據分析
#內置數據集
#固定格式的數據(矩陣、數據框或一個時間序列等)
#統計建模、回歸分析等試驗需要找合適的數據集
#R內置數據集,存儲在,通過
help(package="datasets")
#通過data函數訪問這些數據集
data()
#得到新窗口 前面:數據集名字 後面:內容
#包含R所有用到的數據類型,包括:向量、矩陣、列表、因子、數據框以及時間序列等
#直接輸入數據集的名字就可以直接使用這些數據集
#輸出一個向量
rivers
#是北美141條河流長度
#這些數據集的名字都是內置的,一般我們在給變數命名時最好不要重復
#否則數據集在當前對話中會被置換掉
#例如
rivers<-c(1,2,3)
rivers
#不過影響不大
#再使用data函數重新載入這個數據集就可以了
data("rivers")
rivers
#一些常用內置數據集
#默認介紹頁面只有名字和介紹,並沒有給出數據分類
#哪些是向量、矩陣、數據框等?
#查看數據集除了直接敲數據集名字顯示數據之外
#還可以使用help函數查看每個數據集具體的內容
help("mtcars")
euro
#歐元匯率,長度為11,每個元素都有命名
#輸出向量的屬性信息
names(euro)
#將5個數據構成一個數據框
向量
state.abb #美國50個州的雙字母縮寫
state.area #美國50個州的面積
state.name #美國50個州的全稱
因子
state.division #美國50個州的分類,9個類別
state.region #美國50個州的地理分類
#
state<-data.frame(state.name,state.abb,state.area,state.division,state.region)
state
state.x77 #美國50個州的八個指標
state.x77
VADeaths #1940年弗吉尼亞州死亡率(每千人)
volcano #某火山區的地理信息(10米×10米的網格)
WorldPhones #8個區域在7個年份的電話總數
iris3 #3種鳶尾花形態數據
#以上矩陣→適合畫熱圖
heatmap(volcano)
#這里只是作為一個演示,還需要對這個圖進行一些調整
#更復雜的數據結構
Titanic #泰坦尼克乘員統計,是一個數組
UCBAdmissions #伯克利分校1973年院系、錄取和性別的頻數
crimtab #3000個男性罪犯左手中指長度和身高關系
HairEyeColor #592人頭發顏色、眼睛顏色和性別的頻數
occupationalStatus #英國男性父子職業聯系
#類矩陣
eurodist #歐洲12個城市的距離矩陣,只有下三角部分
Harman23.cor #305個女孩八個形態指標的相關系數矩陣
Harman74.cor #145個兒童24個心理指標的相關系數矩陣
#R中內置最多的數據集——數據框
cars #1920年代汽車速度對剎車距離的影響
iris #3種鳶尾花形態數據
mtcars #32輛汽車在11個指標上的數據
rock #48塊石頭的形態數據
sleep #兩葯物的催眠效果
swiss #瑞士生育率和社會經濟指標
trees #樹木形態指標
USArrests #美國50個州的四個犯罪率指標
women #15名女性的身高和體重
#列表
state.center #美國50個州中心的經度和緯度
#類數據框
Orange #桔子樹生長數據
#時間序列數據,和數據框類似,不同的是具有時間序列的順序,是數據分析中非常常見的格式
#能反映出變化情況以及變化的趨勢等
#因此有很多專門的方法用於時間序列的數據分析
co2 #1959-1997年每月大氣co2濃度(ppm)
presidents #1945-1974年每季度美國總統支持率
uspop #1790–1970美國每十年一次的人口總數(百萬為單位)
#除了內置數據集之外,許多R擴展包中也內置了很多數據集
#這些數據集作為擴展包的函數使用的案例
#載入R包之後這些數據集也同樣被載入進來
#例如MASS包中的Cars93數據
#包含了27個變數,是1993年93輛汽車的型號指標
install.packages("MASS")
library("MASS")
help("Cars93")
#使用data函數在參數package中等於對應R包的名字,即可列出每個R包中包含的數據集
#ex
data(package="MASS")
#顯示R中所有可用的數據集
data(package=.packages(all.available = TRUE))
#不載入R包使用其中的數據集
data(Chile,package="car")
Chile
#> data(Chile,package="car")
#Warning message:
# In data(Chile, package = "car") : data set 『Chile』 not found
#> Chile
#Error: object 'Chile' not found
install.packages("car")
library("car")
help("Chile")
B. R語言自學筆記-3設置路徑、R包操作
#設置默認路徑
#顯示當前工作目錄(軟體默認使用工作目錄)
getwd()
#修改默認工作目錄
setwd(dir = "e:/Rwork/")
#提示工作目錄
getwd()
#查看目錄下包含的文件
list.files()
#或者
dir()
#R包安裝
install.packages("vcd")
#顯示庫所在的位置
.libPaths()
#顯示庫里有哪些安裝包
library()
#載入包
library(vcd)
#or
require(vcd)
#直接輸入函數看某些函數來自於R的哪個包
#如何使用R包
help(package="vcd")
help(package="ggplot2")
#查看包的信息,列出R包的基礎內容,顯示內置的數據集的內容,給包中的函數作為案例來使用
library(help="vcd")
#還有一些包中的函數,是包的核心內容,擴展了R的功能
Arthritis
#列出包中所有包含的函數
ls("package:vcd")
#每個函數如何使用查看對應幫助文檔
#列出R包中包含的所有數據集
data(package="vcd")
#使用完一個包之後,將包從內存中移除
detach("package:vcd")
#再使用
Arthritis
#會出現報錯:需要重新再載入
#刪除已安裝的包
remove.packages("vcd")
#會將R包從硬碟上徹底刪除,無法繼續使用了,用得不多
#R包的批量移植(更換新設備)
#列出當前環境中已安裝的R包
installed.packages()
#取第一列,,,使用下標來訪問數據框的第一列
installed.packages()[,1]
#將所以R包名字保存到一個文件中
Rpack<- installed.packages()[,1]
save(Rpack,file = "Rpack.Rwork")
#將這個文件移到另一個設備上
#在另一個設備上使用load函數打開這個文件
#存到另外一個變數Rpack中
#看到這些R包
#Rpack
#批量安裝這些R包
#使用一個for循環
for(i in Rpack)install.packages(i)
#如何獲取R的幫助信息
help.start()
#查看某個函數的功能
help(sum)
#or
?plot
?sum
#快速了解函數參數而不想查閱詳細文檔
args(plot)
#查看函數使用案例
example(mean)
example("hist")
#列出R的一些案例圖
demo(graphics)
#查看R安裝的某個包的幫助文檔
help(package=ggplot2)
#有些R包包含vignette文檔,這中文檔包含更多內容,也更加規范,裡面有簡介、教程、開發文檔等
vignette()
#不是每個包都包含這種格式的文檔
vignette("xts")
#有時安裝了某包但使用help命令搜索不到相關函數,是因為沒有載入這個包
#需用使用library函數載入這個包
#載入之後才能使用help函數找到相關文檔
#或者直接在help命令中加上package選項 等於 要搜索R包的名字,這種方法比較麻煩
#??接要搜索函數名字,這種情況下不載入包也可以
#有些情況下,不知道具體的函數名,只能模糊搜索
#查找與繪制熱圖相關的幫助信息(使用這條命令進行本地搜索)
help.search(heatmap)
#提示搜索不到
#因為需要加上引號
help.search("heatmap")
#搜到stats包中的heatmap函數,可以用來繪制熱圖
#help.search("heatmap")也可以簡寫成下面一條命令
??heatmap#不需要加引號
#列出所有包含關鍵字的內容
apropos("sum")
#可以通過mod參數調整查詢的內容
apropos("sum",mod="function")#只列出函數
#help.search或??都是進行本地的文檔搜索
#有時搜索不到或者文檔太老了可以使用RSiteSearch()函數進行網路搜索
RSiteSearch(matlab)
#運行函數會使用默認瀏覽器來訪問R官網,在官網中進行搜索,列出更多的結果
#可以利用搜索引擎進行問題搜索