我有一个SQL数据库,包含超过一百万行数据,我想在其上训练一个决策树分类器
有没有办法可以直接在SQL数据上进行训练,而不需要将其转换为DataFrame,或者转换为DataFrame是必需的吗?
回答:
显然,如果这是你所问的,你可以在SQL中运行Python和R脚本。这里有更多的文档:
在SQL Server中执行Python和R脚本SQL Server机器学习服务允许你在数据库中执行Python和R脚本。你可以用它来准备和清理数据,进行特征工程,以及在数据库内训练、评估和部署机器学习模型。该功能在数据所在的位置运行你的脚本,并消除了通过网络将数据传输到另一台服务器的需要。
你可以使用存储过程sp_execute_external_script在SQL Server实例上执行Python和R脚本。
机器学习服务中包含了Python和R的基础发行版。你可以安装和使用开源包和框架,如PyTorch、TensorFlow和scikit-learn,此外还有微软的包。