我正在尝试读取这个链接
http://archive.ics.uci.edu/ml/machine-learning-databases/semeion/semeion.data
并对其进行格式化,然后存储到一个1593×256的数组中,这样我就可以应用一些机器学习技术并进行操作。你有什么抓取数据的建议吗?也许jQuery有相关的功能?
回答:
从你的问题中我了解到,你想知道如何实际获取数据,即在JavaScript中获取URL并将内容存储到字符串变量中,以便继续处理。对于这个需求,http://api.jquery.com/jQuery.ajax/ 应该会很有帮助。
文档中给出了许多示例,一个简单的示例是
$.ajax({ url: "http://archive.ics.uci.edu/ml/machine-learning-databases/semeion/semeion.data",}).done(function(content) { // 对内容进行处理});
不过,请记住,如果你想从一个Web应用程序中执行这样的操作,你托管网站的服务器需要允许跨域Ajax请求,关于这方面的信息可以参考 http://usejquery.com/posts/the-jquery-cross-domain-ajax-guide。
解析数据可以通过遍历字符串,将其按行分割成数组,然后再将每一行按列分割来实现。如果你不想自己编写这些代码,这里提供了一些指南 Javascript code to parse CSV data – 特别是,JQuery-cvs似乎可以配置以完全满足你的需求。