为了进行一项实验,我需要足球比赛的数据(比赛前双方球队的结果和统计数据,比赛结果,观众数量,裁判等)。在www.flaschscores.com上,这些数据总结得非常好。从该网站导入数据到Azure ML实验中是否可行?
回答:
AzureML
仅支持以下数据格式:
- 纯文本文件(.txt)
- 带有标题的逗号分隔值文件(.csv)或不带标题的(.nh.csv)
- 带有标题的制表符分隔值文件(.tsv)或不带标题的(.nh.tsv)
- Excel文件
- Azure表
- Hive表
- SQL数据库表
- OData值
- SVMLight数据(.svmlight)(查看SVMLight定义了解格式信息)
- 属性关系文件格式(ARFF)数据(.arff)(查看ARFF定义了解格式信息)
- Zip文件(.zip)
- R对象或工作区文件(.RData)
尽管如此,这为您提供了很大的灵活性,您可以使用网络技术从任何网站抓取数据并创建csv文件,或者将数据存储在Azure SQL
数据库中,然后将该数据源连接到AzureMl
。
AzureML
本身并不设计用于从网站抓取数据。