重新編碼

分析資料前常常需要再次整理資料,方便日後做分析,整理資料第一步往往是將資料的調整值經過一些調整,以下介紹幾種重新編碼的方法。

  • 透過邏輯判斷式
  • 利用 cut 函數
> data <- iris # 使用 R 內建的資料。

> data$Sepal.Length <- ifelse(data$Sepal.Length > 5, 1,2) # Sepal.Length 如果大於 5 會變成 1,不會就會變成 2

> data$Species <- ifelse(data$Species %in% c(setosa), "IsSetosa","Notsetosa") # %in% 代表有包含到的概念

> x <- c(1, 5, 12, 18, 19, 21, 25, 31)
> cut(x, c(0, 10, 20, 30, 40), c(5, 15, 25, 35)) # cut 函數是透過切割點,重新賦予資料新的數值,本範例的切割的範圍是 0 ~ 10、10 ~ 20、20 ~ 30、30 ~ 40,0 ~ 10 範圍的賦予新的值是 5。
[1] 5  5  15 15 15 25 25 35
Levels: 5 15 25 35

results matching ""

    No results matching ""