我已经用Python创建了一个通过REST API提供服务的机器学习算法,并希望将其部署在Google Cloud / Amazon EC2上以进行实时预测。在此之前,我想为模型进出的每个请求/预测创建一个“日志”——这对我来说似乎是一个好习惯,也可能有助于创建唯一的预测标识符。只需在数据库中存储一个简单的1或0,并附带日期时间戳和唯一ID即可。
我应该如何将这些数据发送到数据库而不影响模型的运行时间呢?在API中使用INSERT INTO语句?还是创建一个完全独立的API?
非常感谢您的帮助!
回答:
这取决于结果的延迟。如果您希望数据立即持久化到数据库中,那么在接收到请求时就必须立即创建一个API。由于这些本质上是日志文件,我的建议是本地存储日志,并在一天内一次性插入日志,以减少长时间的网络拥堵。如果您现有的API已经连接到数据库,那么我认为没有必要为一个简单的post
调用创建一个全新的API。