統計分析：使用 R/R/R 基礎知識的入門

R 基礎知識

如果您完成所有這些主題中的練習，您應該能夠相對熟練地使用 R（另請參見程式設計）。

以這種方式標記的文字用於討論 R 特定的要點。閱讀這些章節的順序，可以學習 R 的基礎知識。還有一些可以直接輸入 R 的命令；您應該能夠直接將它們複製貼上到您的 R 會話中^[1]。嘗試以下方法，瞭解如何將 R 用作簡單的計算器

輸入

100+2/3

結果

> 100+2/3

[1] 100.6667

在沒有關於如何處理命令輸出的任何說明的情況下，R 通常會將結果列印到螢幕上。目前，忽略答案前面的 [1]：我們會看到這在 R 一次輸出多個數字時很有用。請注意，R 遵循執行乘法和除法優先於加法和減法的標準數學規則：它先將 2 除以 3，然後再加 100。

R 命令有時可能難以理解，因此偶爾使用註釋來註釋它們可能會有所幫助。這可以透過鍵入井號 (#) 字元來完成：同一行上的任何後續文字都會被 R 忽略。這將在本華夏公益教科書中的 R 示例中廣泛使用，例如

輸入

#this is a comment: R will ignore it
(100+2)/3    #You can use round brackets to group operations so that they are carried out first
5*10^2       #The symbol * means multiply, and ^ means "to the power", so this gives 5 times (10 squared), i.e. 500
1/0          #R knows about infinity (and minus infinity)
0/0          #undefined results take the value NaN ("not a number")
(0i-9)^(1/2) #for the mathematically inclined, you can force R to use complex numbers

結果

> # 這是一個註釋：R 將忽略它

> (100+2)/3 # 您可以使用圓括號對操作進行分組，以便它們首先執行 [1] 34 > 5*10^2 # 符號 * 表示乘法，^ 表示“乘方”，因此這是 5 乘以（10 的平方） [1] 500 > 1/0 # R 知道無窮大（和負無窮大） [1] Inf > 0/0 # 未定義的結果採用 NaN 值（“非數字”） [1] NaN > (0i-9)^(1/2) # 對於數學愛好者，您可以強制 R 使用複數 [1] 0+3i

如果您對複數一無所知，不用擔心：它們在這裡並不重要。
請注意，您不能使用大括號 {} 或方括號 [] 對操作進行分組。

R 被稱為“面向物件”的程式。所有內容（包括您剛剛輸入的數字）都是一種型別的物件。稍後我們會看到這個概念為什麼如此有用。目前，您只需要注意您可以為一個物件命名，這樣可以將其儲存起來以便日後使用。可以使用箭頭狀符號 <- 和 -> 來分配名稱，如下面的練習中所示。您使用哪個符號取決於您是否更喜歡將名稱放在前面或後面（將 -> 視為“放入”和 <- 視為“設定為”可能會有所幫助）。與許多統計軟體包不同，R 通常不會顯示您執行的分析的結果。相反，分析通常以產生一個可以儲存的物件而告終。然後可以隨時從物件中獲取結果。因此，在 R 中進行統計分析時，您經常會發現自己命名和儲存物件。您選擇的名稱應包含字母、數字和“.” 字元^[2]，並且不能以數字開頭。

輸入

0.001 -> small.num                #Store the number 0.0001 under the name "small.num" (i.e. put 0.0001 into small.num)
big.num <- 10 * 100               #You can put the name first if you reverse the arrow (set big.num to 10000).
big.num+small.num+1               #Now you can treat big.num and small.num as numbers, and use them in calculations
my.result <- big.num+small.num+2  #And you can store the result of any calculation
my.result                         #To look at the stored object, just type its name
pi                                #There are some named objects that R provides for you

結果

> 0.001 -> small.num # 將數字 0.0001 儲存在名為“small.num”的名稱下（即，將 0.0001 放入 small.num 中）

> big.num <- 10 * 100 # 您可以將名稱放在前面，如果您反轉箭頭（將 big.num 設定為 10000）。 > big.num+small.num+1 # 現在您可以將 big.num 和 small.num 視為數字，並在計算中使用它們 [1] 1001.001 > my.result <- big.num+small.num+2 # 您可以儲存任何計算的結果 > my.result # 要檢視儲存的物件，只需鍵入其名稱 [1] 1002.001 > pi # 有一些 R 為您提供的命名物件 [1] 3.141593

請注意，當命令的最終結果是儲存（分配）一個物件時，例如在輸入行 1、2 和 4 上，R 不會列印任何內容到螢幕上。

除了數字之外，R 中可能最有用的命名物件是函式。您在 R 中進行的大部分有用的操作都是使用函式完成的，並且 R 預設情況下提供了許多函式。您可以透過鍵入其名稱，後跟一對圓括號來使用（或“呼叫”）函式。例如，啟動文字提到了以下函式，如果您想在已發表的作品中引用 R，您可能會發現它很有用

輸入

citation()

結果

> citation() 要在出版物中引用 R，請使用：R Development Core Team (2008). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL http://www.R-project.org. A BibTeX entry for LaTeX users is @Manual{, url = {http://www.R-project.org}, title = {R: A Language and Environment for Statistical Computing}, author = {{R Development Core Team}}, organization = {R Foundation for Statistical Computing}, address = {Vienna, Austria}, year = {2008}, note = {{ISBN} 3-900051-07-0}, } 我們在建立 R 上投入了大量時間和精力，請在使用它進行資料分析時引用它。另請參閱“citation("pkgname")”以引用 R 包。

許多 R 函式可以根據您提供給它們的引數產生不同的結果。引數放在圓括號內，用逗號分隔。許多函式有一個或多個可選引數：也就是說，您可以選擇是否提供它們。citation() 函式就是一個例子。它可以接受一個可選引數，用於提供 R 附加包的名稱。如果您沒有提供可選引數，通常會假設一個預設值（在 citation() 的情況下，此預設值為 "base"，即提供基本包的引用：提供 R 語言大部分基礎的包）。

函式的大多數引數都是命名的。例如，citation 函式的第一個引數名為 package。為了提供額外的清晰度，在使用函式時，您可以使用較長的形式 name=value 提供引數。因此

citation("base")

與

citation(package="base")

的作用相同。如果一個函式可以接受多個引數，使用長形式還可以更改引數的順序，如以下示例程式碼所示。

輸入

citation("base")      #Does the same as citation(), because the default for the first argument is "base"
                      #Note: quotation marks are needed in this particular case (see discussion below)
citation("datasets")  #Find the citation for another package (in this case, the result is very similar)
sqrt(25)              #A different function: "sqrt" takes a single argument, returning its square root.
sqrt(25-9)            #An argument can contain arithmetic and so forth
sqrt(25-9)+100        #The result of a function can be used as part of a further analysis
max(-10, 0.2, 4.5)    #This function returns the maximum value of all its arguments
sqrt(2 * max(-10, 0.2, 4.5))             #You can use results of functions as arguments to other functions
x <- sqrt(2 * max(-10, 0.2, 4.5)) + 100  #... and you can store the results of any of these calculations
x
log(100)              #This function returns the logarithm of its first argument
log(2.718282)         #By default this is the natural logarithm (base "e")
log(100, base=10)     #But you can change the base of the logarithm using the "base" argument
log(100, 10)          #This does the same, because "base" is the second argument of the log function
log(base=10, 100)     #To have the base as the first argument, you have to use the form name=value

結果

> citation("base") # 與 citation() 相同，因為第一個引數的預設值為 "base" 為了在出版物中引用 R，請使用：R Development Core Team (2008). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL http://www.R-project.org. A BibTeX entry for LaTeX users is @Manual{, title = {R: A Language and Environment for Statistical Computing}, author = {{R Development Core Team}}, organization = {R Foundation for Statistical Computing}, address = {Vienna, Austria}, year = {2008}, note = {{ISBN} 3-900051-07-0}, url = {http://www.R-project.org}, } 我們在建立 R 上投入了大量時間和精力，請在使用它進行資料分析時引用它。另請參閱 ‘citation("pkgname")’ 以引用 R 包。 > #注意：在這種特定情況下需要引號（見下文討論） > citation("datasets") #查詢另一個包的引用（在本例中，結果非常相似） 'datasets' 包是 R 的一部分。為了在出版物中引用 R，請使用：R Development Core Team (2008). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL http://www.R-project.org. A BibTeX entry for LaTeX users is @Manual{, title = {R: A Language and Environment for Statistical Computing}, author = {{R Development Core Team}}, organization = {R Foundation for Statistical Computing}, address = {Vienna, Austria}, year = {2008}, note = {{ISBN} 3-900051-07-0}, url = {http://www.R-project.org}, } 我們在建立 R 上投入了大量時間和精力，請在使用它進行資料分析時引用它。另請參閱 ‘citation("pkgname")’ 以引用 R 包。 > sqrt(25) #另一個函式："sqrt" 接受一個引數，返回其平方根。 [1] 5 > sqrt(25-9) #引數可以包含算術等 [1] 4 > sqrt(25-9)+100 #函式的結果可以用作進一步分析的一部分 [1] 104 > max(-10, 0.2, 4.5) #此函式返回其所有引數的最大值 [1] 4.5 > sqrt(2 * max(-10, 0.2, 4.5)) #您可以將函式的結果用作其他函式的引數 [1] 3 > x <- sqrt(2 * max(-10, 0.2, 4.5)) + 100 #... 並且您可以儲存任何這些計算的結果 > x [1] 103 > log(100) #此函式返回其第一個引數的對數 [1] 4.60517 > log(2.718282) #預設情況下，這是自然對數（以 "e" 為底） [1] 1 > log(100, base=10) #但您可以使用 "base" 引數更改對數的底數 [1] 2 > log(100, 10) #這與上面相同，因為 "base" 是 log 函式的第二個引數 [1] 2 > log(base=10, 100) #要使底數作為第一個引數，您必須使用 name=value 形式 [1] 2

請注意，在鍵入普通文字（例如包的名稱）時，需要將其用引號^[3]括起來，以避免與物件名稱混淆。換句話說，在 R 中

citation

指的是一個函式，而

"citation"

是一個文字 "字串"。這在提供繪圖示題等情況下很有用。

您可能會發現，瞭解 R 最棘手的一方面是瞭解在特定情況下使用哪個函式。幸運的是，R 不僅為其所有函式提供文件，還提供搜尋文件的方法，以及其他獲得幫助的方法。

在 R 中獲得幫助的方法有很多，線上資訊也很豐富。大多數 R 安裝都帶有相當詳細的幫助檔案，名為 "An Introduction to R"，但這對於第一次使用統計軟體包的使用者來說可能過於技術性。R 中自動提供的幾乎所有函式和其他物件都有一個幫助頁面，其中詳細介紹瞭如何使用它們。這些幫助頁面通常還包含示例，這對新使用者特別有用。但是，如果您不知道要查詢的內容的名稱，那麼找到幫助可能並不容易，儘管可以搜尋與物件相關的關鍵字和概念。某些版本的 R 可以輕鬆訪問幫助檔案，而無需輸入命令（例如，提供選單欄的版本通常具有 "幫助" 選單，而 Macintosh 介面在右上角也有一個幫助框）。但是，始終可以透過輸入適當的命令來訪問此功能。您可能想將以下部分或全部內容鍵入 R 會話中（此處未列出輸出，因為結果將取決於您的 R 系統）。

help.start()            #A web-based set of help pages (try the link to "An Introduction to R")
help(sqrt)              #Show details of the "sqrt" and similar functions
?sqrt                   #A shortcut to do the same thing
example(sqrt)           #run the examples on the bottom of the help page for "sqrt"
help.search("maximum")  #gives a list of functions involving the word "maximum", but oddly, "max" is not in there!
### The next line is commented out to reduce internet load. To try it, remove the first # sign.
#RSiteSearch("maximum")  #search the R web site for anything to do with "maximum". Probably overkill here!

倒數第二個命令說明了您在使用 R 幫助函式時可能會遇到的問題。幫助檔案的搜尋功能有時有點隨機。如果您找不到想要查詢的精確內容，通常檢視任何聽起來模稜兩可或相關的幫助檔案的 "另請參閱" 部分非常有用。在這種情況下，您最終可能會透過檢視 which.max() 幫助檔案的 "另請參閱" 部分找到 max() 函式。不太理想！。

統計分析：使用 R/R/退出簡介

R 中最基本的物件之一是向量，用於儲存同一型別的多個測量值（例如資料變數）。向量可以儲存幾種不同型別的資料。最常見的是數值向量，其中向量的每個元素都只是一個數字。其他常用的向量型別包括字元向量（其中每個元素都是一段文字）和邏輯向量（其中每個元素都是 TRUE 或 FALSE^[4]）。在本主題中，我們將使用 "datasets" 包提供的一些示例向量，其中包含美國州的資料（參見 ?state）。R 本身就是一個基於向量的程式；事實上，我們之前計算中使用的數字只是被視為具有單個元素的向量。這意味著 R 中的大多數基本函式在作為引數給出向量時將按預期工作，如下所示。

輸入

state.area                #a NUMERIC vector giving the area of US states, in square miles
state.name                #a CHARACTER vector (note the quote marks) of state names 
sq.km <- state.area*2.59  #Arithmetic works on numeric vectors, e.g. convert sq miles to sq km
sq.km                     #... the new vector has the calculation applied to each element in turn
sqrt(sq.km)               #Many mathematical functions also apply to each element in turn 
range(state.area)         #But some functions return different length vectors (here, just the max & min).
length(state.area)        #and some, like this useful one, just return a single value.

結果

> state.area #一個 NUMERIC 向量，以平方英里為單位給出美國各州的面積

[1]  51609 589757 113909  53104 158693 104247   5009   2057  58560  58876   6450  83557  56400

[14] 36291 56290 82264 40395 48523 33215 10577 8257 58216 84068 47716 69686 147138 [27] 77227 110540 9304 7836 121666 49576 52586 70665 41222 69919 96981 45333 1214 [40] 31055 77047 42244 267339 84916 9609 40815 68192 24181 56154 97914 > state.name #一個 CHARACTER 向量（注意引號），包含州名

[1] "Alabama"            "Alaska"             "Arizona"            "Arkansas"          
[5] "California"         "Colorado"           "Connecticut"        "Delaware"          
[9] "Florida"            "Georgia"            "Hawaii"             "Idaho"

[13] "Illinois" "Indiana" "Iowa" "Kansas" [17] "Kentucky" "Louisiana" "Maine" "Maryland" [21] "Massachusetts" "Michigan" "Minnesota" "Mississippi" [25] "Missouri" "Montana" "Nebraska" "Nevada" [29] "New Hampshire" "New Jersey" "New Mexico" "New York" [33] "North Carolina" "North Dakota" "Ohio" "Oklahoma" [37] "Oregon" "Pennsylvania" "The smallest state" "South Carolina" [41] "South Dakota" "Tennessee" "Texas" "Utah" [45] "Vermont" "Virginia" "Washington" "West Virginia" [49] "Wisconsin" "Wyoming" > sq.km <- state.area*2.59 #標準算術適用於數值向量，例如將平方英里轉換為平方公里 > sq.km #... 給出另一個向量，其中對每個元素依次執行計算

[1]  133667.31 1527470.63  295024.31  137539.36  411014.87  269999.73   12973.31    5327.63
[9]  151670.40  152488.84   16705.50  216412.63  146076.00   93993.69  145791.10  213063.76

[17] 104623.05 125674.57 86026.85 27394.43 21385.63 150779.44 217736.12 123584.44 [25] 180486.74 381087.42 200017.93 286298.60 24097.36 20295.24 315114.94 128401.84 [33] 136197.74 183022.35 106764.98 181090.21 251180.79 117412.47 3144.26 80432.45 [41] 199551.73 109411.96 692408.01 219932.44 24887.31 105710.85 176617.28 62628.79 [49] 145438.86 253597.26 > sqrt(sq.km) #許多數學函式也依次應用於每個元素

[1]  365.60540 1235.90883  543.16140  370.86299  641.10441  519.61498  113.90044   72.99062
[9]  389.44884  390.49819  129.24976  465.20171  382.19890  306.58390  381.82601  461.58830

[17] 323.45487 354.50609 293.30334 165.51263 146.23826 388.30328 466.62203 351.54579 [25] 424.83731 617.32278 447.23364 535.06878 155.23324 142.46136 561.35100 358.33202 [33] 369.04978 427.81111 326.74911 425.54695 501.17940 342.65503 56.07370 283.60615 [41] 446.71213 330.77479 832.11058 468.96955 157.75712 325.13205 420.25859 250.25745 [49] 381.36447 503.58441 > range(state.area) #但有些函式返回不同長度的向量（這裡，只是最大值和最小值）。 [1] 1214 589757 > length(state.area) #有些函式（如這個有用的函式）只返回一個值。 [1] 50

請注意，您的輸出的第一部分可能與上面的略有不同。根據螢幕的寬度，每行輸出中列印的元素數量可能不同。這是方括號中數字的原因，這些數字是在將向量列印到螢幕時生成的。這些帶括號的數字給出該行上第一個元素的位置，這是一個有用的視覺輔助。例如，檢視 state.name 的列印輸出，並從第二行開始計數，我們可以知道第八個州是特拉華州。

您可能偶爾需要從頭開始建立自己的向量（儘管大多數向量是從處理已存在的檔案中的資料獲得的）。用於構建向量的最常用函式是 c()，之所以這樣命名是因為它將concatenates物件連線在一起。但是，如果您想建立由數字的規律序列組成的向量（例如 2、4、6、8、10、12 或 1、1、2、2、1、1、2、2），可以使用幾個替代函式，包括 seq()、rep() 和 : 運算子。

輸入

c("one", "two", "three", "pi")  #Make a character vector
c(1,2,3,pi)                     #Make a numeric vector
seq(1,3)                        #Create a sequence of numbers
1:3                             #A shortcut for the same thing (but less flexible)
i <- 1:3                        #You can store a vector
i
i <- c(i,pi)                    #To add more elements, you must assign again, e.g. using c() 
i                             
i <- c(i, "text")               #A vector cannot contain different data types, so ... 
i                               #... R converts all elements to the same type
i+1                             #The numbers are now strings of text: arithmetic is impossible 
rep(1, 10)                      #The "rep" function repeats its first argument
rep(3:1,10)                     #The first argument can also be a vector
huge.vector <- 0:(10^7)         #R can easily cope with very big vectors
#huge.vector #VERY BAD IDEA TO UNCOMMENT THIS, unless you want to print out 10 million numbers
rm(huge.vector)                 #"rm" removes objects. Deleting huge unused objects is sensible

結果

> c("one", "two", "three", "pi") #建立一個字元向量

[1] "one" "two" "three" "pi" > c(1,2,3,pi) #建立一個數值向量 [1] 1.000000 2.000000 3.000000 3.141593 > seq(1,3) #建立一個數字序列 [1] 1 2 3 > 1:3 #相同的快捷方式（但靈活性較差） [1] 1 2 3 > i <- 1:3 #您可以儲存一個向量 > i [1] 1 2 3 > i <- c(i,pi) #要新增更多元素，您必須再次賦值，例如使用 c() > i [1] 1.000000 2.000000 3.000000 3.141593 > i <- c(i, "text") #向量不能包含不同型別的資料，因此 ... > i #... R 將所有元素轉換為相同型別 [1] "1" "2" "3" "3.14159265358979" "text" > i+1 #數字現在是文字字串：算術運算不可能 Error in i + 1 : non-numeric argument to binary operator > rep(1, 10) # "rep" 函式重複其第一個引數

[1] 1 1 1 1 1 1 1 1 1 1

> rep(3:1,10) #第一個引數也可以是一個向量

[1] 3 2 1 3 2 1 3 2 1 3 2 1 3 2 1 3 2 1 3 2 1 3 2 1 3 2 1 3 2 1

> huge.vector <- 0:(10^7) #R 可以輕鬆處理非常大的向量 > #huge.vector # 除非您想打印出 1000 萬個數字，否則不要取消此註釋 > rm(huge.vector) #"rm" 刪除物件。刪除未使用的巨大物件是明智之舉

R 中的分類變數儲存為一個稱為因子的特殊向量物件。這不同於填充了一組名稱的字元向量（不要將兩者混淆）。特別是，R 必須被告知每個元素只能是幾個已知級別之一（例如Male 或 Female）。如果您嘗試將具有不同未知級別的數

factor() 函式用於建立因子並定義可用水平。預設情況下，水平將從向量中的水平獲取***。實際上，您通常不需要使用 factor()，因為在從檔案讀取資料時，R 預設情況下會將文字轉換為因子（參見統計分析：使用 R 入門 / R / R / 資料框）。您可能需要使用 as.factor()。在內部，R 將水平儲存為從 1 開始的數字，但並非總是很明顯哪個數字對應哪個水平，通常不需要知道。

序數變數，即水平具有自然順序的因子，在 R 中被稱為 有序因子。它們可以透過建立因子的正常方式建立，但需要額外指定 ordered=TRUE。

輸入

state.region # 因子的示例：請注意，水平被打印出來

state.name # 這 *不是* 一個因子 state.name[1] <- "Any text" # 可以在字元向量中替換文字 state.region[1] <- "Any text" # 但不能在因子中替換文字 state.region[1] <- "South" # 這可以 state.abb # 這不是一個因子，只是一個字元向量

character.vector <- c("Female", "Female", "Male", "Male", "Male", "Female", "Female", "Male", "Male", "Male", "Male", "Male", "Female", "Female" , "Male", "Female", "Female", "Male", "Male", "Male", "Male", "Female", "Female", "Female", "Female", "Male", "Male", "Male", "Female" , "Male", "Female", "Male", "Male", "Male", "Male", "Male", "Female", "Male", "Male", "Male", "Male", "Female", "Female", "Female") #a bit tedious to do all that typing

使用程式碼可能更容易，例如，女性為 1，男性為 2

Coded <- factor(c(1, 1, 2, 2, 2, 1, 1, 2, 2, 2, 2, 2, 1, 1, 2, 1, 1, 2, 2, 2, 2, 1, 1, 1, 1, 2, 2, 2, 1, 2, 1, 2, 2, 2, 2, 2, 1, 2, 2, 2, 2, 1, 1, 1)) Gender <- factor(Coded, labels=c("Female", "Male")) # 然後可以將它轉換為命名水平

結果

收集資料時，某些資料點通常是未知的。這由於各種原因發生。例如，在分析實驗資料時，我們可能記錄了每個實驗的多個變數（例如，溫度、時間等），但忘記（或無法）記錄一個例項中的溫度。或者，在收集關於美國州份的社會資料時，某些州可能不記錄某些感興趣的統計資料。另一個例子是泰坦尼克號沉沒時的船上乘客資料，經過仔細研究，已經確定了船上 2207 人的票價等級，但無法確定其中 10 多名遇難者的年齡（參見 http://www.encyclopedia-titanica.org）。我們可以簡單地省略缺失資料，但在許多情況下，我們有一些變數的資訊，而另一些變數則沒有。例如，我們可能不想因為某個州缺少一個特定的感興趣資料而完全省略它。為此，R 提供了一個特殊的值，NA，表示“不可用”。任何向量，數值、字元或邏輯，都可以包含 NA 的元素。這些元素可以透過函式“is.na”識別。

輸入

some.missing <- c(1,NA)
is.na(some.missing)

結果

some.missing <- c(1,NA)

is.na(some.missing) [1] FALSE TRUE

請注意，如果存在缺失資料，一些分析很難執行。可以使用“complete.cases”或“na.omit”來構造省略缺失值的。資料集。

統計分析：使用 R 入門 / R / 矩陣和陣列

R 對向量中可以包含的內容非常嚴格。所有元素必須是相同型別，而且必須是數字型別^[5]、邏輯值或文字字串^[6]。如果您想要一個包含不同型別元素的集合，或者不是允許的向量型別之一，則需要使用列表。

輸入

l1 <- list(a=1, b=1:3)
l2 <- c(sqrt, log) #

結果

統計分析：使用 R 入門 / R / 簡單繪圖

在 R 中製作粗略的圖表非常容易，儘管調整圖表以獲得特定外觀可能很耗時。預設設定通常很合理。

輸入

stripchart(state.areas, xlab="Area (sq. miles)") #see method="stack" & method="jitter" for others
boxplot(sqrt(state.area))
hist(sqrt(state.area))
hist(sqrt(state.area), 25)
plot(density(sqrt(state.area))
plot(UKDriverDeaths)

qqnorm()
ecdf(

結果

統計分析：使用 R 入門 / R / 資料框統計分析：使用 R 入門 / R / 獲取資料到 R 統計分析：使用 R 入門 / R / 雙變數圖

↑ 根據您檢視本書的方式，您可能在每個命令前面看到一個“>”字元。這不是要輸入的命令的一部分：它是 R 本身產生的，用於提示您輸入內容。如果您從本書的線上版本中複製和貼上，此字元應該自動被省略，但如果您閱讀的是紙質或 pdf 版本，則在鍵入 R 時，您應該省略“>”提示。
↑ 如果您熟悉計算機程式語言，您可能習慣在名稱中使用下劃線（“_”）字元。在 R 中，通常使用“.”來代替。
↑ 您可以使用單引號（'）或雙引號（"）來分隔文字字串，只要開始和結束引號匹配即可
↑ 這些是 R 中的特殊單詞，不能用作物件的名稱。物件 T 和 F 是 TRUE 和 FALSE 的臨時快捷方式，但如果您使用它們，請注意：由於 T 和 F 只是普通的物件名稱，您可以透過覆蓋它們來更改它們的含義。
↑ 實際上有 3 種允許的數字型別：“普通”數字、複數和簡單整數。本書幾乎完全處理其中的第一種型別。
↑ 這並不完全正確，但除非您是計算機專家，否則您不太可能使用最終型別：儲存“原始”計算機位的元素向量，參見 ?raw

[1] 根據您檢視本書的方式，您可能在每個命令前面看到一個“>”字元。這不是要輸入的命令的一部分：它是 R 本身產生的，用於提示您輸入內容。如果您從本書的線上版本中複製和貼上，此字元應該自動被省略，但如果您閱讀的是紙質或 pdf 版本，則在鍵入 R 時，您應該省略“>”提示。

[2] 如果您熟悉計算機程式語言，您可能習慣在名稱中使用下劃線（“_”）字元。在 R 中，通常使用“.”來代替。

[3] 您可以使用單引號（'）或雙引號（"）來分隔文字字串，只要開始和結束引號匹配即可

[4] 這些是 R 中的特殊單詞，不能用作物件的名稱。物件 T 和 F 是 TRUE 和 FALSE 的臨時快捷方式，但如果您使用它們，請注意：由於 T 和 F 只是普通的物件名稱，您可以透過覆蓋它們來更改它們的含義。

[5] 實際上有 3 種允許的數字型別：“普通”數字、複數和簡單整數。本書幾乎完全處理其中的第一種型別。

[6] 這並不完全正確，但除非您是計算機專家，否則您不太可能使用最終型別：儲存“原始”計算機位的元素向量，參見 ?raw

[1]

[2]

[3]

[4]

[5]

[6]