R
中,有一些內建的資料集,在學習或練習時,可以用來當做原始資料,如:
> CO2 Plant Type Treatment conc uptake 1 Qn1 Quebec nonchilled 95 16.0 2 Qn1 Quebec nonchilled 175 30.4 3 Qn1 Quebec nonchilled 250 34.8 4 Qn1 Quebec nonchilled 350 37.2 (以下略)上列結果會列出
CO2
這資料集中的欄位和資料,若只是要看某一欄位內的資料,可以使用「資料集名稱$欄位名稱」的指令來取得,如:
> CO2$Plant [1] Qn1 Qn1 Qn1 Qn1 Qn1 Qn1 Qn1 Qn2 Qn2 Qn2 Qn2 Qn2 Qn2 Qn2 Qn3 Qn3 Qn3 [18] Qn3 Qn3 Qn3 Qn3 Qc1 Qc1 Qc1 Qc1 Qc1 Qc1 Qc1 Qc2 Qc2 Qc2 Qc2 Qc2 Qc2 [35] Qc2 Qc3 Qc3 Qc3 Qc3 Qc3 Qc3 Qc3 Mn1 Mn1 Mn1 Mn1 Mn1 Mn1 Mn1 Mn2 Mn2 [52] Mn2 Mn2 Mn2 Mn2 Mn2 Mn3 Mn3 Mn3 Mn3 Mn3 Mn3 Mn3 Mc1 Mc1 Mc1 Mc1 Mc1 [69] Mc1 Mc1 Mc2 Mc2 Mc2 Mc2 Mc2 Mc2 Mc2 Mc3 Mc3 Mc3 Mc3 Mc3 Mc3 Mc3 12 Levels: Qn1 < Qn2 < Qn3 < Qc1 < Qc3 < Qc2 < Mn3 < Mn2 < ... < Mc1當我們要知道這些資料集中欄位意思等資訊,可以使用
help()
這個函式來開啟資料的相關文件:
> help(CO2)或是
> ?CO2就可以看到資料集描述、欄位定義與用法等資訊:
若要看目前可以使用的資料集有那些,可以使用
data()
這個函式:
> data()執行後,就會出現資料集的說明文件:
若我們想要使用其他套件的資料集的話,也是可以使用
data()
,但此時要傳入兩個參數,第一個參數是我們要引入的「資料集名稱」,第二個參數是該資料集所在的「套件名稱」,如在MASS
套件中,有一名為Cars93
的資料集,在引入之前使用他,會得這樣的結果:
> Cars93 錯誤: 找不到物件 'Cars93'若我們先執行下列指令:
> data(Cars93, package="MASS")再看一次
Cars93
的內容,就會看到他的資料結構:
> Cars93 Manufacturer Model Type Min.Price Price Max.Price 1 Acura Integra Small 12.9 15.9 18.8 2 Acura Legend Midsize 29.2 33.9 38.7 3 Audi 90 Compact 25.9 29.1 32.3 4 Audi 100 Midsize 30.8 37.7 44.6 5 BMW 535i Midsize 23.7 30.0 36.2 6 Buick Century Midsize 14.2 15.7 17.3 7 Buick LeSabre Large 19.9 20.8 21.7 8 Buick Roadmaster Large 22.6 23.7 24.9 9 Buick Riviera Midsize 26.3 26.3 26.3 (以下略)若我們己經有使用
library()
函式去引入MASS
這個套件,則我們可以直接使用Cars93
這個資料集。要什麼引入與缷除套件,可以參考【R筆記】R的套件載入與缷除 。
如果你需要進一步地認識 R,我推薦: