假设我被招募参加一项大学研究,测试一个新的AI,我们将进行传统的图灵测试。我将坐在电脑前,通过基于文本的聊天与某物互动,这可能是计算机或另一名志愿者,然后我需要猜出它是什么。
假设我得到了一个特别好的激励来正确判断。我如何提高我的胜算?我应该谈论什么样的东西?
- 我应该尝试教聊天者一个我刚编造的简单新概念,然后对他们进行测验吗?
- 我应该尝试讲笑话和暗示,看他们是否“明白”吗?
- 我应该问哲学问题吗?
- 我应该尝试问一些人类倾向于“非理性”地以特定方式回答的实际问题吗?
回答:
请认识到,聊天机器人的现状仍然很糟糕。你能犯的最大的错误是尝试做一些奇怪的事情,在这种情况下,人类和AI都可能以一种奇怪的方式合理地回应。相反,只需进行正常的对话,并抵制你的对话者提出的任何重大偏离。这应该能让你轻松识别出任何处于当前已发布的技术水平的东西。
如果你遇到了一些远远超过现有技术水平的东西,我认为下一个门槛将是对审美决策的有针对性的询问:“你最喜欢的[电影|书|艺术家|餐]是什么?为什么?你会说你从不喜欢…吗?这方面有你不喜欢的地方吗…?”等等。