4

OpenAI员工说提示词没用,这话没错、但也不全对

 8 months ago
source link: https://www.36kr.com/p/2587372432942471
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

OpenAI员工说提示词没用,这话没错、但也不全对

三易生活·2024-01-02 11:38
这个说法并不错,但仅仅只在一个有限的场景中生效。

相信有用过ChatGPT、文心一言、New Bing,以及其他AI大模型的朋友,可能都有相似的体验,那就是AI大模型很像小孩子,需要循循善诱才能给出想要的结果。而大模型输出优质结果的前提,是输入让AI能够理解的提示词(Prompt),这想必也早已是ChatGPT、文心一言这类产品用户的共识了。

interlace,1

然而,ChatGPT、GPT-4背后OpenAI公司有的员工似乎并不这么认为。近日OpenAI开发者推广大使Logan Kilpatrick在社交平台发文称,“热门观点:现在有很多人认为,为了在未来保持竞争力必须掌握提示词工程技能。但事实上,提示人工智能系统和与他人进行有效沟通并没有本质的区别。”

Logan Kilpatrick进一步解释,虽然提示词工程是一个越来越热门的专业领域,但2024年真正重要的三项基本技能是阅读、写作和口语,随着人工智能技术的不断发展,磨练这些技能将使人类在未来比高度智能的机器人更具竞争优势。

毫无疑问,这是一个颠覆大众认知的说法,但这位OpenAI“布道者”的说法有道理吗?

interlace,1

事实上,Logan Kilpatrick这个说法是正确的,但它仅仅在一个有限的场景生效。其实经过了大半年的迭代后,目前OpenAI面向消费级市场最先进的产品GPT-4,已经能够在一定程度上理解人类的意图和动机。相比基于GPT-3.5的ChatGPT,使用更加口语化、情绪化的内容来与GPT-4沟通时,后者往往可以洞察用户的需求、进而给出结果,但ChatGPT则会无动于衷。

这也就意味着,用户与GPT-4沟通和与人类沟通的差异正在变得越来越小,在这种情况下,Logan Kilpatrick认为提示人工智能和与他人进行有效沟通并没有本质的区别,显然是成立的。

可问题是,并非每一个人都是ChatGPT Plus的订阅用户,绝大多数人使用的还是免费的ChatGPT或其他AI大模型,而指望后者在自然语言理解(NLP)上目前能够达到GPT-4的水平显然不太现实。

interlace,1

更何况随着ChatGPT Plus订阅量的持续增长,GPT-4也不可避免地出现了性能下降的问题。此前在2023年夏季,来自斯坦福大学的研究人员就发现,相比于3月,6月版本的GPT-4在解决数学问题、回答敏感问题、代码生成、视觉推理上,全部出现了一定程度的降低。而指望着GPT-4继续保持现有的性能,这又需要OpenAI在算力上继续进行投资。

说回提示词,它到底有没有去学习的必要呢?自然是没有的。因为随着技术的进步,不仅是GPT-4,其他AI大模型的性能也在保持螺旋上升,这些大模型迟早都可以让用户实现类似与真正人类聊天的效果。但当下如果真的不了解提示词、掌握一点与AI沟通的小技巧,可能现在的AI应用就要对你关上大门了。

interlace,1

提示词的意义在于,当现阶段的AI大模型还是不是AI Agent、也不能自主设定目标时,它更像是一个有效率的工具,而非智能助手。提示词则是使用AI工具获得所需输出的有效方式,并且它的组成形式非常多样化,既可以是自然语言、也能是代码。

从某种意义上来说,提示词就像魔法咒语,只有念出准确的咒语才能让AI释放出对应的魔法,所以提示词就是将事物的本质和意义提炼成更短的单词。

interlace,1

按照百度集团副总裁、搜索平台负责人肖阳的话来说,就是提示词=任务+角色+上下文背景+细节补充。目前在不做提示词优化的情况下,AI大模型给出的答案往往会较为全面、中规中矩,但经过提示词优化后,答案质量则会显著提升。

比如你告诉大模型,让它给你做一个企业官网,效果可能会很一般。但如果你告诉大模型应用,让它作为一个产品经理来做一个网站,质量就会好很多。

再加上,目前的大模型往往都更强调通用性,这也就意味着在某些特定场景,大模型的能力是无法覆盖的,此时提示词工程(Prompt Engineering)就有了用武之地。它的作用就是探讨如何设计出最佳提示词,用于指导AI大模型帮助用户解决在各种细分场景遇到的问题。更何况,如今火热的思维链(CoT)技术,其实也可以被视为是提示词的延伸。

interlace,1

所以这样来看,Logan Kilpatrick并没有大放厥词,但他说的这个话只能听听。如果你是一个对于当下AI应用感兴趣,并且希望借助AI来改善工作和学习效率,那么了解和熟练运用提示词还是非常有必要的。

本文来自微信公众号“三易生活”(ID:IT-3eLife),作者:三易菌,36氪经授权发布。

该文观点仅代表作者本人,36氪平台仅提供信息存储空间服务。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK