我正在开发一个使用GPT-4(通过OpenAI API)的视觉问答应用程序。问题是之前通过的测试模块现在由于回答质量下降而不断失败。这是GPT-4(或OpenAI API)的预期行为吗?
回答:
如果您在应用程序中使用gpt-4o
作为模型标识符,那么是的,底层模型可能会发生变化。
以gpt-4o
为例:
- 在我写这篇文章时,它指向
gpt-4o-2024-05-13
- 但很快它将指向更新的
gpt-4o-2024-08-06
新模型的回答质量是否会下降是一个很好的问题。公司使用各种指标来确保这种情况不会发生。而且AI模型的盲测评级通常显示人们对新模型的评价更高。
与此同时,很容易找到一些轶事性的意见,认为之前的某些模型更好。起初,我的印象也是gpt-4
比新版的gpt-4o
更好,但当我进行盲测时,我更喜欢gpt-4o
的回答。
如果您更喜欢坚持使用经过测试的旧版模型,您仍然可以使用更具体的ID,如gpt-4o-2024-05-13
。