Feedback on Data Science LSTM Project

我意识到这个问题略微超出了这里通常提问的范围,请原谅这一点。我被分配了一项开放式的技术筛选任务,申请数据科学家的职位。这是第一次有工作要求这样做,所以我想确保我提交的作品非常出色。我被提供了一组数据,要求我识别问题并说明如何使用机器学习来解决它,提供目标特征的统计数据,预处理数据,建模数据,并解释结果。

我在寻找关于我的结果是否遗漏了什么重要内容的反馈。高层次的反馈就可以了。希望你们中有些人是数据科学家,曾经完成过这样的技术筛选,或者曾经审核过这样的筛选,可以为一个崭露头角的数据科学家提供一些有价值的反馈。

谢谢!

Github 项目链接


回答:

看看这个

Mars Express Power Challenge 获取数据,建模并预测热能消耗

在这里 https://kelvins.esa.int/mars-express-power-challenge/

挑战是获取数据并预测轨道器的未来消耗,以规划如何节省能源(在太阳区域存在过热的风险,而在太阳夜存在过冷的风险)

各团队采用了不同的方法,LSTM可能是我的选择。但获胜团队对“特征工程和选择”进行了非常详细的解释。关键在于,重要的不是使用的工具,而是特征提取和选择的正确选择。https://arc.aiaa.org/doi/pdf/10.2514/6.2018-2561

我读了获胜论文和你的作品。说实话,我更喜欢你的方法。正如你所看到的,如果你阅读了论文,你的方法论是相当可比的,但他们将特征提取研究放在了研究的中心位置。

你可以通过提供更多证据证明你为特征提取(FE)选择了正确的方法来确保你的工作。例如,你可以提供两种FE方法并比较它们的结果,或者,你可以解释你选择的方法,了解这篇特定论文的最新研究状态,这证明了blablabla…

你可以添加ARIMA、VAR、VARMA与你的比较结果,以说明“表现优异”,并引用过去三年该领域的最新研究论文,以及关于LSTM用于能耗预测的近期出版物的其他参考文献。

你的文档突然结束,人们会期待一个像常规论文中常见的装饰性结论。

就是这样了。

(请不要仅凭我的意见,因为我并不觉得自己是数据科学家 🙂 有一天我能做出你所做的事情,我会为自己感到非常骄傲 😉 谢谢分享,读起来很不错)

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注