根据诊断寻找药物的机器学习算法

训练数据集:

--------------------   患者年龄:        25患者体重:     60诊断一:      发热诊断二:      头痛    > 药物:           **克罗欣**---------------------------------患者年龄:        25患者体重:     60诊断一:      发热诊断二:      无头痛    > 药物:           扑热息痛----------------------------------

提供带有处方药的患者样本数据集。

如何根据患者的信息(年龄/体重)和诊断(发热/头痛/等)找到合适的药物?


回答:

你要完成的任务是分类,因为目标值是名义尺度。

正确使用术语非常重要,因为其余的工作已经由其他人完成,比如Python的sklearn库,其中包含了最相关的算法和大量用于测试和学习这些算法的数据。

看起来你有四个输入变量:

  1. 年龄 – 度量变量
  2. 体重 – 度量变量
  3. 诊断一 – 名义变量
  4. 诊断二 – 名义变量

你需要编码你的名义变量,我建议使用一个包含所有可能诊断的数组,例如:

发热, 头痛, 胃痛, x – [0, 0, 0, 0]

现在,如果诊断正确,每个数组元素将被设置为1,否则为0。因此,你总共有2 + n个输入变量,其中n是可能症状的数量。

然后你可以直接使用sklearn库,并开始使用最简单的分类算法:最近邻分类

如果结果不理想(可能结果不会很好),你可以开始使用更复杂的模型(SVM,随机森林)。但首先你应该学习术语,并使用简单模型来了解方法和处理流程。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注