这些库是否可以互换使用?
从这里来看,https://stackshare.io/stackups/keras-vs-pytorch-vs-scikit-learn,似乎主要的区别在于底层框架(至少对于PyTorch来说)。
回答:
是的,确实有很大的区别。
SciKit Learn 是一个通用的机器学习库,建立在NumPy之上。它包含了很多机器学习算法,如支持向量机、随机森林,以及大量用于数据前处理和后处理的工具。它不是一个神经网络框架。
PyTorch 是一个深度学习框架,由以下部分组成:
- 类似于NumPy的向量化数学库,但支持GPU,并且包含很多与神经网络相关的操作(如softmax或各种类型的激活函数)
- Autograd – 一种算法,可以自动计算以基本操作定义的函数的梯度
- 基于梯度的优化例程,用于大规模优化,专门用于神经网络优化
- 与神经网络相关的实用函数
Keras 是一个更高层次的深度学习框架,它隐藏了许多细节,使代码比PyTorch或TensorFlow更简单、更简洁,但以牺牲可 hack 性为代价。它抽象了计算后端,可以是TensorFlow、Theano或CNTK。它不支持PyTorch后端,但这并非不可想象 – 你可以将其视为上述内容的简化和流线化子集。
简而言之,如果你使用的是“经典”的非神经网络算法,PyTorch和Keras对你都没有用。如果你在做深度学习,scikit-learn可能仍然对其工具部分有用;除了它,你还需要实际的深度学习框架,你可以选择Keras和PyTorch,但你不太可能同时使用两者。这非常主观,但在我看来,如果你在研究一个新的算法,你更可能选择PyTorch(或TensorFlow或其他一些低级框架)来获得灵活性。如果你正在将一个已知且经过测试的算法适应到一个新的问题设置中,你可能想要选择Keras,因为它更简单且入门门槛较低。