tidymodels
是一个集合了多个数据科学和机器学习包的生态系统,但它本身并不提供数据分割的功能。数据分割通常是通过 rsample
包来实现的,因为 rsample
专注于重采样方法,提供了多种分割数据集的方式,如单次分割(initial_split
)、交叉验证(vfold_cv
)和bootstrapping(bootstraps
)等。
如果你只加载了 tidymodels
但没有加载 rsample
,你将无法直接使用 rsample
中的数据分割功能。不过,tidymodels
可能依赖于 rsample
或者其他包来提供某些功能,所以 rsample
可能会作为依赖包被间接加载。
如果你需要进行数据分割,你应该确保 rsample
包已经被安装并加载。这样,你就可以使用它提供的数据分割函数,如下所示:
install.packages("rsample") # 安装 rsample 包,如果尚未安装
library(rsample) # 加载 rsample 包
# 使用 initial_split 进行数据分割
split <- initial_split(mtcars, prop = 0.75)
# 获取训练集和测试集
train_data <- training(split)
test_data <- testing(split)
在这个示例中,mtcars
是R中自带的数据集,我们使用 initial_split
函数将其分割成训练集和测试集。
如果你正在使用 tidymodels
生态系统中的其他包,如 parsnip
或 recipes
,它们可能会与 rsample
配合使用,以提供一个完整的数据分析和建模流程。在这种情况下,确保 rsample
包也被加载是必要的。