R中,有一些內建的資料集,在學習或練習時,可以用來當做原始資料,如:
> CO2 Plant Type Treatment conc uptake 1 Qn1 Quebec nonchilled 95 16.0 2 Qn1 Quebec nonchilled 175 30.4 3 Qn1 Quebec nonchilled 250 34.8 4 Qn1 Quebec nonchilled 350 37.2 (以下略)上列結果會列出
CO2這資料集中的欄位和資料,若只是要看某一欄位內的資料,可以使用「資料集名稱$欄位名稱」的指令來取得,如:
> CO2$Plant [1] Qn1 Qn1 Qn1 Qn1 Qn1 Qn1 Qn1 Qn2 Qn2 Qn2 Qn2 Qn2 Qn2 Qn2 Qn3 Qn3 Qn3 [18] Qn3 Qn3 Qn3 Qn3 Qc1 Qc1 Qc1 Qc1 Qc1 Qc1 Qc1 Qc2 Qc2 Qc2 Qc2 Qc2 Qc2 [35] Qc2 Qc3 Qc3 Qc3 Qc3 Qc3 Qc3 Qc3 Mn1 Mn1 Mn1 Mn1 Mn1 Mn1 Mn1 Mn2 Mn2 [52] Mn2 Mn2 Mn2 Mn2 Mn2 Mn3 Mn3 Mn3 Mn3 Mn3 Mn3 Mn3 Mc1 Mc1 Mc1 Mc1 Mc1 [69] Mc1 Mc1 Mc2 Mc2 Mc2 Mc2 Mc2 Mc2 Mc2 Mc3 Mc3 Mc3 Mc3 Mc3 Mc3 Mc3 12 Levels: Qn1 < Qn2 < Qn3 < Qc1 < Qc3 < Qc2 < Mn3 < Mn2 < ... < Mc1當我們要知道這些資料集中欄位意思等資訊,可以使用
help()這個函式來開啟資料的相關文件:
> help(CO2)或是
> ?CO2就可以看到資料集描述、欄位定義與用法等資訊:
若要看目前可以使用的資料集有那些,可以使用
data()這個函式:
> data()執行後,就會出現資料集的說明文件:
若我們想要使用其他套件的資料集的話,也是可以使用
data(),但此時要傳入兩個參數,第一個參數是我們要引入的「資料集名稱」,第二個參數是該資料集所在的「套件名稱」,如在MASS套件中,有一名為Cars93的資料集,在引入之前使用他,會得這樣的結果:
> Cars93 錯誤: 找不到物件 'Cars93'若我們先執行下列指令:
> data(Cars93, package="MASS")再看一次
Cars93的內容,就會看到他的資料結構:
> Cars93
    Manufacturer          Model    Type Min.Price Price Max.Price
1          Acura        Integra   Small      12.9  15.9      18.8
2          Acura         Legend Midsize      29.2  33.9      38.7
3           Audi             90 Compact      25.9  29.1      32.3
4           Audi            100 Midsize      30.8  37.7      44.6
5            BMW           535i Midsize      23.7  30.0      36.2
6          Buick        Century Midsize      14.2  15.7      17.3
7          Buick        LeSabre   Large      19.9  20.8      21.7
8          Buick     Roadmaster   Large      22.6  23.7      24.9
9          Buick        Riviera Midsize      26.3  26.3      26.3
(以下略)
若我們己經有使用library()函式去引入MASS這個套件,則我們可以直接使用Cars93這個資料集。要什麼引入與缷除套件,可以參考【R筆記】R的套件載入與缷除 。
如果你需要進一步地認識 R,我推薦:


