我们目前运行SQL报告来提取测试执行输出,以便我们可以评估测试的成功程度,然后根据这些信息有根据地猜测哪些测试应该添加到我们的回归测试套件中。
然而,这种方法非常耗时,因为它需要有人逐一查看所有数据并做出某些假设。
我被指派研究使用人工智能来筛选数据的可能性,想知道是否有人尝试过这种方法,以及他们是如何实施的。
回答:
我不确定这是否可行,但你可以使用Python的scikit-learn现成工具
操作非常简单:
from sklearn.feature_extraction.text import TfidfVectorizerfrom sklearn.neural_network import MLPClassifierfrom sklearn.pipeline import Pipelineimport pandas as pd####DATA PREP##data = pd.read_csv('filepath')#Forgot the target xD# target = pd.read_csv('target_data_filepath')target = data.target #If target is in dataother_data = pd.read_csv('filepath_other')###MAKE MODEL##tfidf_vect = TfidfVectorizer()mpl_class = MLPClassifier()pipe = Pipeline([('Tfidf Vectorizer', tfidf_vect),('MLP Classifier', mlp_class)]pipe.fit(data, target) #remove target from data beforehand if applies####PREDICT###pipe.predict(other_data)
data
是你以单独条目形式的文本,每条记录的完整输出
target
是你之前发现的,是否应该包含在某处
other_data
是你想要测试的数据
但请注意,上述内容只是一个示例,我不保证所有方法名称都正确。要进一步了解,请参考scikit-learn的文档,以及像Packt上的《使用Python构建机器学习系统》这样的书籍,尽管价格不菲但内容详尽,还有很多免费的博客如machinelearningmastery.com