我在Python的OpenAI库中使用Completions功能,类似于这样:
self.__response = self.client.chat.completions.create( model='gpt-4', messages=messages, stream=True)
在这之后,我只是循环处理数据块:
for chunk in self.__response: text = chunk.choices[0].delta.content # 在这里处理文本
如果我发现响应不符合我的期望,只需在循环中使用break
来阻止服务器继续生成响应并浪费代币,这样做就足够了吗?还是说有更正确的方法来实现这一点?
回答:
您需要为API生成的所有代币(单词或单词的一部分)付费,即使您没有处理它们。因此,提前中断循环可以阻止您处理更多的代币,但并不能阻止您为这些代币付费。
您可以使用’max_tokens’来限制生成的代币数量,这样可以节省费用,但这样做的话,您将永远只能得到较低的max_tokens响应,即使那个特定的响应是您想要的。