我有一个典型的场景,我希望将两个不同的工作者设置为监听模式(使用某些数据进行训练),并希望从不同的客户端调用它们。
for(100次) w1 (监听) <- c1 将调用 result1 w2 (监听) <- c2 将调用 result2 比较 (result1 和 result2)
w1和w2使用机器学习算法在不同数据上进行训练,因此完成其过程需要时间。所以它们需要保持在监听模式,不能每次都重新启动。
我尝试在不同的端口上运行它们,4730和4731。但我猜它只能在一个端口上工作,即4730。
客户端:
class client_(object): def __init__(self): self.gm_client = gearman.GearmanClient(['localhost:4730']) def callWorker(self, query): c_result = {} completed_job_request = self.gm_client.submit_job("db_worker", query) c_result = completed_job_request.result c_result = json.loads(c_result)
工作者:
def __init__(self): self.gm_worker = gearman.GearmanWorker(['localhost:4730']) self.gm_worker.register_task('db_worker', self.testClassifier) self.root_dir = os.getcwd() self.trainClassifier()
如何管理这种场景?如果不清楚,请告诉我。
回答:
你还必须运行gearmand服务器!客户端/工作者库不能直接用于从客户端向工作者发送消息。工作被发送到服务器,存储在内存队列中,并在相应的工作者可用时传递给它。
4730是gearmand服务器使用的默认端口。
你必须使用apt-get下载gearmand或从https://launchpad.net/gearmand下载并启动它。你传递给客户端和工作者的参数是服务器的主机名和端口。服务器使用传递给submit_job和register_task的字符串(在你的例子中是”db_worker”)来匹配工作和相应的工作者。
这意味着你可以为两个工作者使用同一个服务器和端口,你只需使用两个不同的函数名来注册它们即可。
你可以查看http://gearman.org/的文档,但它很糟糕…在这里你可以找到下载和运行服务器的说明:http://gearman.org/getting-started