4

ChatGPT的新功能对我们所有人到底意味着什么?

 11 months ago
source link: https://www.51cto.com/article/769607.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

ChatGPT的新功能对我们所有人到底意味着什么?

作者:Bernard Marr 2023-10-12 13:30:13
我们知道,迈向通用AI——可以做任何事情的AI——是开发者OpenAI计划的一部分。当谈到实现这个雄心勃勃的目标时,视觉以及说和听的能力是相当重要的。因此,在我们即将迎来ChatGPT向所有人开放的一周年之际,它获得了这些功能,这是有道理的。
9188ca640162154f273965e244ccfe161db669.png

ChatGPT新的更新和添加的功能总是很有趣,其最新的更新尤其发人深省。

我们知道,迈向通用AI——可以做任何事情的AI——是开发者OpenAI计划的一部分。当谈到实现这个雄心勃勃的目标时,视觉以及说和听的能力是相当重要的。因此,在我们即将迎来ChatGPT向所有人开放的一周年之际,它获得了这些功能,这是有道理的。

这将如何影响我们与新的数字朋友的关系呢?它将增加它进入我们生活并帮助我们应对日常挑战的能力,它对围绕ChatGPT(以及通用AI)在社会中的地位的大问题意味着什么?

新的ChatGPT更新的功能有哪些?

首先,通过获得从图像中分析和提取语言信息的能力,ChatGPT有效地获得了视觉能力。你可以简单地上传一张图片,让它描述显示的内容,还可以用它来执行复杂得多的任务,比如诊断如何修复自行车或割草机等损坏的机械。

这意味着,理论上,ChatGPT不仅可以分析照片,还可以分析图表和可视化、笔迹以及来自我们周围世界的各种非结构化数据。

显然,它有很多日常用途,从为你想要出售的商品创建Facebook Marketplace列表,到将白板上的涂鸦变成易于阅读的笔记。

OpenAI自己给出了如何使用它的例子,包括在冰箱里抓拍物品,问它晚餐可以做什么,以及就照片进行现场对话。

然而,根据《纽约时报》的报道,ChatGPT中部署的功能有一些局限性,其中一些是设计上的——例如,它在分析人脸方面受到限制。这样做是为了防止它被用来侵犯隐私,也符合OpenAI之前限制其产品的方式。

另一个可能产生深远影响的变化是,ChatGPT现在可以说话和听,至少如果你正在使用这款移动应用程序的话。

因此,语音革命使如今与Siri和Alexa这样的机器交谈变得非常正常。我们都很习惯这样一个事实,他们只能以有限的几种方式回应我们,一般来说,他们能做的最有用的事情就是打开和关闭其他设备。

这就是为什么与ChatGPT交谈是一个如此耐人寻味的想法。ChatGPT可能会进行更自然、更流畅的对话,很容易就会给人一种与真人交谈的错觉。

除了进行来回对话外,它还可以模拟它听到的声音,例如,可以用来为AI头像配音。以及其他一些更险恶的目的。

我之所以说有可能,是因为当我在发布后直接试用它时,不得不说它还没有完全到位。

ChatGPT有几次听不懂我说的话。更奇怪的是,它的训练数据似乎没有更新,让它知道自己会说话。当我向它寻求使用其语音功能的帮助时,它坚定地告诉我,它没有语音功能(用完美合成的人类声音)。我还看到报告说,它可能听不懂各种口音和方言。

这意味着什么?

进入一个机器不仅可以思考,还可以看、听和说话的时代,显然是一件非常重要的事情。我相信有很多人准备说,它还不能真正做好任何一件事。但很明显,事情才刚刚开始。

视觉和语音功能意味着我们很可能会看到ChatGPT技术出现在越来越多的便携技术中。我们已经有一副眼镜可以在你的眼前叠加ChatGPT,所以你永远不会被问题的解决方案所困扰。这些帮助你进行随意的闲聊。

其中一些人已经可以听和说了——尽管这些人使用第三方扩展来添加功能,而且OpenAI自己的集成技术应该(潜在地)提供更流畅的体验。

但是,无论我们身在何处,拥有实时的、由AI支持的图像分析都可以即时提供给我们,这可能会真正改变许多领域的游戏规则。

不过,这确实引发了一些伦理考量。最紧迫的是,值得记住的是,尽管ChatGPT推出了一系列行为限制,本应防止其被用于不道德目的,但这些限制很快就被绕过了,在某些情况下,甚至完全被删除了。

如果这是利用ChatGPT的视觉能力完成的,潜在的后果可能会更加严重,特别是如果不道德的演员找到了绕过面部识别障碍的方法。

在ChatGPT发布后不久,与其功能相似但没有限制的仿制版本开始出现。有时,它们的创造者专门将它们作为违反法律的工具出售。我们能在视觉或声音模仿能力上看到同样的情况吗?我认为,认为它不会发生的想法将是相当愚蠢的。

对通用AI的探索

然而,有可能有一些事情应该让我们更担心。

随着最新的一系列更新,ChatGPT正变得越来越多模式。这意味着它可以理解各种形式的输入并与之互动,比如图片和声音,而不仅仅是文字。

这一点很重要,因为AI发展的目标不可避免地是通用AI(AGI)。这是一个术语,指的是只要拥有必要的数据,就可以执行任何任务的机器,就像我们人类一样。多式联运可以很容易地被描述为朝着这一目标迈出了一大步。

或许可以肯定地说,AGI还有很长的路要走。谷歌工程总监雷·库兹韦尔预计我们将在2045年左右实现这一目标,DeepMind的CEO戴米斯·哈萨比斯也相信这将在未来几十年内完成。

然而,哲学家尼克·博斯特罗姆认为,“超智能”将在下个世纪初到来。AI先驱斯图尔特·罗素教授表示,距离这一目标还有一段路要走,还有一些重大问题我们还无法解决。

当它真的到来时,AGI可能会产生相当巨大的影响。在机器创造我们所需的一切的同时,它是否会让我们过上奢侈的生活,还是会带来更黑暗的命运,对于这一问题,各方仍存在分歧。

那现在怎么办?

无论是好是坏,政府或那些有能力做出决定的人似乎没有听取那些签署了暂停巨人AI实验请愿书的人的建议。

这意味着我们很可能会看到AI的发展继续并加速。像ChatGPT添加的功能将成为日常生活的一部分。它还将变得更可靠、更强大,并提供不断改进的用户体验。这意味着更多内置了该技术的应用程序和设备,以及越来越多的社交和工业使用案例。

ChatGPT现在可以看和听了,所以我认为用不了多久就会有人想出如何让它触摸、闻和尝的方法。然后,它将配备所有与我们相同的感官功能,从理论上讲,它能够完全理解我们感知环境的方式。

这将使它有可能帮助我们挖掘出大量的洞察力——关于世界的信息以及我们与世界的互动,这些信息超出了我们的有机大脑的范围。它将以它知道的方式向我们提供这些信息,由于它对我们自己的能力的理解,我们可以使用它。

有了AI,我们就踏上了一段目的地远未确定的旅程。

责任编辑:姜华 来源: 企业网D1Net

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK