R语言中subset函数用于从数据框中选择需要的观测值和变量,可以根据条件进行子集的选择。其基本用法如下:
subset(data, subset, select)
示例:
# 从数据框df中选择满足条件的观测值
new_df <- subset(df, subset = condition)
# 从数据框df中选择满足条件的观测值,并选择需要的变量
new_df <- subset(df, subset = condition, select = variables)
其中,condition
可以是一个逻辑向量,也可以是一个逻辑表达式,例如df$var > 10
表示选择变量var
大于10的观测值。variables
可以是一个字符向量,也可以是一个数值向量,例如c("var1", "var2")
表示选择var1
和var2
这两个变量。
需要注意的是,subset函数会在选择变量时自动将结果转换为数据框,因此返回的结果仍然是一个数据框。