最近,我发现有必要探索Intel DAAL MKL用于数据科学,但在寻找一个地方的正确安装以建立一个可用的环境时遇到了困难。经过几天以及多次尝试和失败后,我终于找到了一个最终的安装流程,我认为这对所有渴望开始他们数据科学冒险的数据科学爱好者来说将是有益的,使用Visual Studio Code或JupyterLab。以下是我推荐的在Windows 10上建立一个可用环境的步骤。
回答:
1. 下载并安装最新版本的Anaconda: https://www.anaconda.com/distribution/
2. 从其网站下载并安装最新版本的Graphviz安装程序: https://graphviz.gitlab.io/download/ (在我这里,graphviz-2.38.msi是最新的版本)
a. 为所有用户安装graphviz msi
b. 导航到环境变量: https://t.ly/Gz359
c. 为Graphviz创建一个新的环境路径(需要添加两个链接):(在我这里是:C:\Program Files (x86)\Graphviz2.38\bin\
和 C:\Program Files (x86)\Graphviz2.38\bin\dot.exe
d. 关闭所有命令和环境窗口
e. 打开一个新的cmd窗口并测试Graphviz的存在: c:\Users\MyDrive>dot -v
i. 你应该会得到版本和其他信息的报告(如果失败,请检查环境路径条目并可能修复你的Graphviz安装)
ii. Ctrl-C关闭报告
iii. 关闭cmd窗口
iv. 重启你的电脑
3. 以管理员身份导航到Anaconda命令提示符并保持在(base)环境中:
a. 在Windows 10中,搜索anaconda并选择anaconda命令提示符:
i. 右键点击它并选择以管理员身份运行
b. 导航到(base)环境的根目录:
i. cd\
c. 获取现有环境的当前列表:
i. conda env list
d. 删除任何不需要的环境:
i. conda env remove -n OldenvironmentName
e. 为Intel数据科学(ids)创建一个新的所需环境,使用最新的Conda库,并支持Python版本3.x:
i. conda create -n ids python=3 numpy pandas seaborn matplotlib scikit-learn daal4py jupyterlab -y
f. 激活新环境:
i. conda activate ids
g. 使用pip安装Graphviz:
i. pip install graphviz
h. 安装对Graphviz的Python支持:
i. conda install pydot python-graphviz -y
i. 检查通过cmd提示符是否可以访问dot:
i. dot -v
j. Ctrl-C关闭报告
k. 注册以下内容以增强Intel数据科学:
i. set USE_DAAL4PY_SKLEARN=YES
ii. python -c "import sklearn"
l. 重启我们的电脑
当你返回到桌面时,你将准备好使用你的新环境进行数据科学处理