我精通C++、Ruby、Rails以及其他一些脚本语言。我想开始尝试并学习数据挖掘和机器学习的概念。
我希望能够掌握这些概念所需的编程知识。
哪种语言对数据挖掘和机器学习的支持最好?Python,Java,C++?JavaScript中有没有新兴的技术?
谢谢
回答:
我认为你的问题可能有点偏离目标。语言本身通常不提供支持:支持来自与这些语言接口的软件包,例如Apache Spark(与其机器学习包的接口)、Intel的MKL(针对Xeon Phi优化的向量和矩阵操作)、SciKit(Python接口)等。
尽管如此,我看到对支持分布式处理的语言的支持最为活跃。在我的领域内,Java/Spark 目前处于领先地位,但是一两个主要版本的发布可能会显著改变市场——例如,看看Tensor的热议,或者BeautifulSoup的持久力。
对于实验,从你熟悉的区域开始。Ruby和C++也有很多很好的工具可以很好地进行接口。只要你用这些工具来学习底层概念,我相信你用你已经熟悉的语言会取得最好的效果:这可以减少你学习过程中的挫折感。
Anony-Mousse和Patricio给出了非常好的观点,我完全同意。我正在使用Python和Scala工作,同时在Java和Spark的基础上进行开发。