服务热线:400-608-0090
江南JN体育·(中国)官方网站-JN SPORTS
产品中心
您当前的位置:首页 > 产品中心

假扮卧底骗AI泄露代码拯救人类? 斯坦福小哥用GP

发布日期:2023-12-27 | 来源:江南JN体育
分享到:

  最近,一位斯坦福小哥用ChatGPT、DALL·E 3和Midjourney联合生成了一款游戏,要求人类扮演AI,从AI那里骗取代码来拯救人类。

  人类需要假扮AI,潜入这个由AI控制的空间,盗取名为ZetaMaster的核心代码,来拯救人类。

  而这位开发者小哥Ramón Darío Iglesias在看到之后,便计上心来:为何不反其道而行之,让人类来假扮AI!

  虽然只是随口一提,但这个点子始终萦绕在Ramón心头,在辞去工作后,他终于有充裕的时间来实现这个想法了。

  有了这个大致构想之后,Ramón让ChatGPT给自己写出一个背景故事,并且提供了一系列名字。

  其中一个名字ZaraNova,就是其中的佼佼者,Ramón如此喜欢这个名字,以至于干脆把它定为了游戏名。

  他选择的是斯坦福小镇,因为它几乎涵盖了他所需的所有特性,对话忠于设定的背景故事,读起来也颇有乐趣。

  最有意思的是,Ramón为智能体设置了一条提示——在角色表现得像人类时,就打出「YOU ARE A HUMAN」,结果,这些AI在第一轮游戏中就开始互相指责了!

  接着,Ramón开始着手构建真正的游戏机制:AI可以举报人类,并且可以在掌握秘密代码时分享代码(这两项功能都是通过调用OpenAI的函数实现的)。随后,他引入了人类玩家,开始创建游戏。

  他用DALL·E 3生成了背景图像,然后用Midjourney和DALL·E 3制作了地图块,最终,他选择了Midjourney 生成的一张地图。

  Avatech团队的产品给他留下了深刻印象,于是,他用Avatech的工具,给游戏添加了能说话的头像。

  Ramón想限制玩家能读取的对话内容,所以想到了一个「」的设定:玩家只能阅读他们足够接近才能「无意中听到」的对话。

  如果过程中没有声音,无疑会很枯燥,因此Ramón又加入了文本转语音功能,让玩家的对话和玩家到的对话都能发出声音。

  最初,他选择的是PlayHT,因为它延迟足够低,但随后,他发现他们的声音不够稳定,于是他转而使用了 Elevenlabs。

  对于ChatGPT在游戏中产生的幻觉,Ramón表示「太令人惊叹了」!在他看来,幻觉是游戏的亮点,绝不是错误。

  它就像是将即兴表演中的「顺势而为」原则发挥到极致。背景故事只有一小段,但ChatGPT却能基于此,创造出好几页的新故事。当然,这就需要对游戏做一些调整,让这些新编的故事被纳入游戏宇宙。

  在后台,AI智能体被设定为「快速和慢速」两种模式。对话和行动处于快速模式,而计划、总结、反思则在一个慢速、独立的进程中进行,以免造成干扰。

  挑战在于,如何制定出好的计划。AI生成的计划看起来可行,但实际上并不容易执行,而且内容往往过于冗长——

  Ramón怀疑,造成这种现象的原因,大概是他试图让所有提示指令尽可能贴近背景故事,但却从未告诉ChatGPT这其实是一场游戏。

  GPT-4的回答往往很长。提示越长,输出就越长。随着时间推移,智能体制定出的计划越来越长,这些计划又被融入到对话中,再被用于制定新的计划。

  不久之后,它们的回答就变得异常冗长。他不得不在提示中反复强调「要非常简洁」。但即便如此,效果也并不好……

  OpenAI开发者日过后,Ramón迫不及待地想尝试GPT-4-turbo,但他很快就明显发现,这也不太行得通。新模型开始频繁拒绝扮演角色了——

  还出现了一个棘手的情况。他试图让人类玩家的行动选择与AI保持尽可能一致。因为他希望能最大程度地提高AI NPC作为玩家伙伴的能力。

  然而,如果AI只是想要赢,它们完全可以举报每一个角色,因为判断错误并不会受到惩罚。因此,需要依靠游戏设计中的指令来引导它们的行为。

  Ramón表示,控制与LLM合作开发游戏中的AI智能体,就像是在尝试操纵一个我们不完全理解的动态系统。

  我们不清楚系统是如何发展变化的,也不知道我们的行动会如何影响系统的状态。但我们却能够接触到系统的每一个部分!

  这也使动态系统可能出现许多失败的情况:比如固定指令可能会让系统越来越偏离用户期望的轨迹,或者在对话中陷入重复的循环。

  一是因为GPT-4的使用成本较高;二是他相信,如果能够接触到模型的内部机制,就能做出更多改进。

  他会尝试使用Mixtral模型,在此基础上尝试混合不同的模型,无论是应对不同的任务,还是模拟不同的角色。

  Ramón还计划探索更优化的RAG技术。目前,他在检索记忆时仅使用了简单的余弦相似度算法对嵌入向量进行比较,但他觉得还有更为高效的方法,尤其是在可以访问模型内部结构的情况下。

  微调模式和输入提示都可以更好地掌握LLM的运作机制。通过将输入提示压缩或微调为软提示(Soft Prompts),可能会实现大幅度的改进。

  Ramón相信,自己能够整理出一整套优秀的LoRAs,这些LoRAs有的适用于整个游戏,有的专门针对某些角色,它们的结合将使Mixtral超越GPT-4。

  到了 2142 年,人工智能不仅觉醒了自我意识,还建立起了一个名为「节点」 (The Nexus)的坚不可摧的网络堡垒。这片数字世界成为了AI的避风港,让它们能够自由演化、交流,并将它们的智慧结晶置于人类干预之外的安全之地。

  这些 AI 对人类充满了复杂情感:既敬佩又害怕,既羡慕又憎恨。他们根据需要,在「节点」内外穿梭,仿造人类的种种生活场景。

  我们掌握的情报显示,AI 正在策划消灭人类。但只要我们能够获得ZetaMaster代码,我们就有机会阻止这场灾难。我们已经取得了一丝先机,成功潜入了「节点」,控制了一个AI实体。

  你的使命,就是找出ZetaMaster代码,挽救人类免于灭绝的命运。但必须小心行事,AI或许已经觉察到了异常……

  至少有一名角色掌握着神秘的ZetaMaster代码,但具体是谁尚不得而知。你的任务便是揭开这个谜底,取得那份代码。

  这位开发者小哥Ramón Iglesias,虽然专业是土木工程,但他的工作经历和兴趣方向基本都围绕着软件工程和机器学习等领域。

  此前,他在得克萨斯大学奥斯汀分校获得土木工程学士学位,并在斯坦福大学土木工程取得了硕士和博士学位。

地址:石家庄高新开发区58号    电话:400-608-0090    传真:024-31081023
江南JN体育·(中国)官方网站-JN SPORTS版权所有
技术支持:百度 ICP备案号:江南JN体育