使用Flink运行器对TensorFlow进行变换

这可能看起来很傻,但这是我在这里的第一篇帖子。抱歉如果我做错了什么。

我目前正在使用TFX 0.11(即tfdv-tft-tfserving)和tensorflow 1.11构建一个简单的机器学习管道,使用的是Python 2.7。我现在有一个Apache Flink集群,我想用它来运行TFX。我知道TFX背后的框架是Apache Beams 2.8,而Apache Beams目前通过一个便携式运行器层支持Flink的Python SDK。

但问题是,我如何通过这个便携式运行器的概念,使用Apache Beams和Flink运行器在TFX(tfdv-tft)中编写代码,因为TFX目前似乎只支持DirectRunner和DataFlowRunner(Google Cloud)。

我在网上搜索了一段时间,看到TFX网站上的最后一行,

“请将有关tf.Transform的问题直接提交到Stack Overflow,并使用tensorflow-transform标签。”

这就是我在这里的原因。任何想法或解决方案都将非常感激。谢谢你!


回答:

感谢你的提问。

免责声明:便携式Flink运行器仍处于实验阶段,仅适用于少量输入数据。

以下是如何通过Beam在Flink上运行TFX的方法。

前提条件

运行Python管道的说明:https://beam.apache.org/roadmap/portability/#python-on-flink
注意:我们目前仅支持Flink 1.5.5

操作步骤

1) 构建工作容器:

  • 进入Beam检出目录
  • 运行gradle命令:./gradlew :beam-sdks-python-container:docker

2) 运行Flink的Beam JobServer:

  • 进入Beam检出目录
  • 运行gradle命令:./gradlew beam-runners-flink_2.11-job-server:runShadow注意:此命令不会结束,因为它会启动作业服务器并保持运行。

3) 提交管道

--experiments=beam_fn_api --runner PortableRunner --job_endpoint=localhost:8099 --experiments=worker_threads=100 --execution_mode_for_batch=BATCH_FORCED

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注