从Twitter数据中追踪飓风路径

我正在尝试从Twitter数据中追踪飓风桑迪的实际移动路径。我的方法如下:

我收集了2012年10月28日至2012年10月31日期间所有与标签“飓风桑迪”相关的推文(飓风桑迪于2012年10月29日在新泽西州布里甘廷附近登陆)。在接下来的两天里,它影响了许多邻近的州。我将收集的所有推文按时间顺序排列,然后将按时间排序的推文划分为固定大小的时间窗口。接着,在每个时间窗口内,我计算相关的推文,即那些指向飓风路径位置的推文。然后,我获取相关推文的发源地位置,并将它们连接起来以获得飓风的路径。

我面临的问题是如何确定任何推文与飓风路径的相关性,即如何判断一条推文是否来自飓风路径覆盖的区域。有什么可能的特征或算法可以做到这一点吗?


回答:

你有查看过这些数据吗?

Twitter数据99%是噪音,只有1%是有用的信息。

我怀疑你无法从这些数据中达到你的目标。特别是,在飓风真正经过的地方,网络可能已经瘫痪了…

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注