4

一次性搞懂什么是AIGC!(一篇文章22个基本概念)

 1 year ago
source link: https://www.digitaling.com/articles/934226.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

一次性搞懂什么是AIGC!(一篇文章22个基本概念)

8888.jpg

本图由Midjourney生成

全新的时代,AIGC(Artificial Intelligence Generative Content,即人工智能生成内容)正在重新塑造着内容创作生态。当常识能被机器识别,当艺术被重新定义,当创意不再需要人工,广告营销行业将迎来一场生产变革巨浪。数英将持续聚焦AIGC领域,通过资讯分享、认知科普、方法总结、深度访谈等,带领大家多方位了解AIGC。

本期内容,我们将梳理22个AI基础概念,带你搞清楚。

关于AIGC往期内容:

1、全球巨头21条金句观点,AI是否能替代人类?
2、AI 爆火3个月了,广告圈应该关注啥?
3、同一个主题“妈妈”,30 张AI 绘画作品分享 (附完整提示词)
4、专访SOULO:首支全AI制作短片幕后揭秘,大胆操盘后的分享

以ChatGPT、Midjourney为首的AIGC软件出现至今,不过短短半年时间,已经从方方面面浸入到人们的生活里,与此同时,大量专业术语涌入我们视野。

AI、AIGC、AGI、Bing AI,ChatGPT……这些字母缩写到底是什么?有什么区别?和广告营销有什么关系?

本文将尽可能用最直白通俗的语言,结合广告营销案例,帮你搞清楚互联网上常见的AI术语。

一、基本概念/理论

1、AI 工作原理

AI,全称Artificial Intelligence,人工智能。顾名思义,让机器发展出像人一样的智能,可以看到、听到、思考、判断,然后根据经验作出决策。

而AI之所以能够走向现实生活,影响到多个行业领域的生产工作,离不开三个重要技术的支撑:深度学习、神经网络以及生成式对抗网络(GAN)。

1)神经网络

神经网络是一种模拟人脑神经元连接的算法模型。你可以把神经网络想象成一个大脑。就像大脑由许多神经元相互连接构成,神经网络也由许多"节点"或"神经元"通过"链接"相互连接。这些链接就像我们大脑中的神经连接,可以传递和处理信息。

2)深度学习

如果说神经网络像一个普通大脑,深度学习则是一个更加“聪明”的大脑。在这个“大脑”里,神经元被组织成许多层,这就像大脑的不同区域处理不同的任务一样。每一层都在学习和处理数据的不同特征或部分。这就使得深度学习能够处理非常复杂的问题,比如识别图像或理解自然语言。

3)生成式对抗网络(GAN)

GAN技术可以说是推动这次AIGC热潮的关键技术,有了它,AI才能够生成逼真的图像、音频和文本。

你可以把GAN的工作原理想象成是一个艺术家和艺术评论家的竞赛。艺术家(生成器)的工作是创造看起来真实的艺术作品,而艺术评论家(判别器)的任务是判断这个作品是否真的来自真正的艺术家,还是来自我们的AI艺术家。

艺术家(生成器)开始时可能不太擅长制作逼真的作品,而评论家(判别器)也可能并不擅长识别真伪。但是,随着他们不断的竞争,艺术家的作品变得越来越逼真,评论家的判断能力也越来越强。

在这个不断生成和对抗的过程中,AI逐渐学会了如何创作看起来非常真实的作品。

2、AI大模型/预训练大模型

AI大模型是一种机器学习模型。它可以学习和处理更多的信息,比如图像、文字、声音等,也可以通过训练,完成各种复杂的任务。比如智能语音助手和图像识别软件都会用到AI大模型。

这里的「预训练」,可以理解为像学生学习知识一样,机器也需要通过学习和训练来获取相关的知识和技能,来完成各种任务。AI预训练大模型可以通过不同领域的大量训练,掌握知识和技能。

由OpenAI公司开发的模型GPT就是一种大型语言模型,也是预训练模型的一种,它能够自动生成各类文本,比如新闻报道、小说,也可以回答问题、写文章、进行对话。GPT是目前自然语言处理领域最为先进的自然语言生成模型之一。

开源可以被理解为分享和合作的一种方式。在计算机编程中,当一个项目是开源的,意味着它的源代码是公开的,任何人都可以查看,修改和分享

想象你正在做一份蛋糕,如果你将蛋糕的配方公开,让所有人都可以制作这个蛋糕,甚至可以根据自己的口味对配方进行修改和优化,那么这个蛋糕的配方就可以被认为是"开源"的。

4、自然语言处理(NLP)

自然语言处理(NLP)就像是教计算机理解和使用人类语言的一种技术。举个例子,当你对手机说:“打开天气应用,查看明天的天气。”这就涉及到了自然语言处理。你的手机需要理解你的指令——这是什么意思,你想做什么,然后才能执行正确的动作。

自然语言处理需要用到很多开源的工具和软件,它们能够帮助研究员处理语言数据,大大降低开发的门槛,让自然语言处理技术的进步的速度变快。

5、AIGC

是指由AI自动创作生成的内容( AI Generated Content),即AI接收到人下达的任务指令,通过处理人的自然语言,自动生成图片、视频、音频等。

打个通俗点的比方,AIGC就像一支马良神笔,拥有的无尽创造力。这支笔的特别之处在于,是由AI打造的。来自AI的理解力、想象力和创作力的加持,它可以根据指定的需求和样式,创作出各种内容:文章、短篇小说、报告、音乐、图像,甚至是视频。AIGC的出现,就像是打开了一个全新的创作世界,为人们提供了无尽的可能性。从用户生成内容(UGC),到专业生成内容(PGC),再到现在的人工智能生成内容(AIGC),我们看到了内容创作方式的巨大变革和进步。

6、AIGC和Chat GPT的关系

AIGC是AI大模型,特别是自然语言处理模型的一种重要应用;ChatGPT则是AIGC在聊天对话场景的一个具体应用。

可以把AIGC看作是一个大的范畴,而ChatGPT是其中一个类别的小应用。

7、AIGC可以生成的内容

AIGC可以生成的内容很多,具体的种类和范围可能随着技术的发展而不断扩大。目前,一些常见的AIGC内容包括:

  • 文字:最基本的AIGC内容,可以与人类进行实时对话,生成不同风格的文字,诗歌、故事,甚至计算机代码等。

  • 图像:可以由文字或者图片,直接生成各种类型的图片。可以辅助人类进行绘画设计和发散想象力,大致可以分为图像自主生成工具和图像编辑工具两类。

  • 视频:可以通过文字描述,生成一段情节连贯的视频。比如广告片、电影预告片、教学视频、音乐视频等。也可以当作视频的剪辑工具。

  • 音频:可以生成逼真的音效,包括语音克隆、语音合成、文本生成特定音,音乐生成、声音效果等。

  • 游戏:游戏的剧情设计、角色设计、配音和音乐、美术原画设计、游戏动画、3D模型、地图编辑器等都可以让AIGC帮助完成。

  • 虚拟人:可以生成虚拟明星、虚拟恋人、虚拟助手、虚拟朋友等。指存在于非物理世界(如图片、视频、直播、一体服务机、VR)中,并具有多重人类特征的综合产物。

二、常见的AIGC应用

(一)常用软件

8、ChatGPT

ChatGPT是由OpenAI开发的一款大型预训练语言模型,就像一个会聊天的机器人。

它可以理解你说的话,并给出回答。这个机器人在互联网上读了很多书、文章,学到了很多知识,所以可以回答各种问题,甚至进行深入的讨论。不过,ChatGPT的理解与人类不同,人类理解事物时,有意识、经验和情感等多个层次的参与,而ChatGPT只是通过分析和模拟大量的文本数据来"学习"如何合理地回应。

1685529055619239.png

9、Midjourney

Midjourney是由美国旧金山的一家独立研究实验室创立的图片类AIGC应用程序,我们可以通过语言描述来生成图片。比如,输入一个苹果,它就会为你生成出一张苹果的图片。

1685529078312118.gif

10、Stable Diffusion

图片生成类AI大模型,可以在给定的任何提示词下生成图像,并支持根据关键词和图片检索。与Midjourney相比,生成图像的结果更可控。

1685529102834947.png

11、Bing AI

Bing AI就是搭载了GPT-4的Bing浏览器,它能够更好地理解用户意图,提供更加智能化、个性化的搜索和服务体验。

1685529140586388.gif

12、文心一言

文心一言是百度全新一代知识增强大语言模型,能够与人对话互动、回答问题、协助创作,具备更强的中文理解能力。

1685529157655785.png

13、文心一格

文心一格是百度基于文心大模型的文生图系统,搭建的图片生成类AI大模型,可以根据用户输入的指令提示,生成相应的图片。

1685529199814009.png

(二)AIGC在广告营销中的运用

随着AIGC的浪潮在现实中涌动,多个行业迎来了自我更迭的新机遇,广告行业也开始拥抱AIGC。我们可以从文本应用、图片应用、视频应用、市场分析的四个层面,探寻与AI共事的进击之路。

14、文本应用

当ChatGPT走进大众视野时,我们看到不少人感叹它强大的表达能力和迅猛的反应能力,无论向它抛出什么样的问题,它都能对答如流,甚至对于同一命题,也能给出许多不同的答案。这样蓬勃的新力量,正被更多品牌看见。

今年4月,户外运动品牌The North Face以重回山野为主题,对ChatGPT进行了发问,令人惊喜的是,ChatGPT给予了10000个答案。

The North Face《用AI给出10000个重回山野的理由》

点击查看项目详情

15、图片应用

AIGC的出现,不仅提速人们在绘图工作中的效率,更解锁了绘画创作的更多可能性,带来一些在艺术审美上的灵感。不得不说,AI的想象力、审美力和创作力,已然被更多人所见。今年4月,飞猪旅行就使用了AI技术生成了一组世界风景图,并将画面投放至地铁广告里,来往的人都能一睹AI眼里的世界。

飞猪旅行《玩得比想象更酷》:用AI生成的世界风景图

1685529419870482.jpg

16、视频应用

以往,制作广告的工作流是贯穿线上线下,线上对接脚本,线下注重执行,尤其是现场拍摄,一些不可抗力的因素会影响到计划进度。

如今,随着AIGC的横空出世,内容生产的工作流正发生着不小的改变,创作者可以选择纯在线上完成广告任务。即向AI发生任务指令,再通过线上的一些调试,便能形成一支广告片。就在最近,飞书发布了一支广告片《探》,便是纯由AI完成的。

飞书《探》:用AI生成画面的广告

17、其他营销应用

AI不仅仅能够提供创意内容,还能帮助品牌与商家优化媒介投放和客户管理系统。事实上,国内许多To B企业早就应用了AI技术,辅助客户优化营销效果。

比如,阿里妈妈发布的序列化智能投放技术,就是借助AI技术帮助商家实现合理投放;巨量引擎则使用了与GPT相同的transformer技术,帮助客户高效提升ROI。

三、AI的未来,机遇和挑战共生

18、多模态AI

在许多专家领袖对于AI的预言中,多模态AI是一个高频关键词。

多模态AI,即能够处理和理解多种类型数据(例如图像、文本、音频等)的人工智能。目前的AI技术大多只能处理文字数据,而多模态能够理解更多类型的信息。

比如,你在看一部没有字幕的外语电影,而你并不懂这种语言。如果有一个多模态AI,它可以同时理解电影中的视觉和听觉信息,然后把这些信息转化为你能理解的语言,为你提供实时的字幕。这就是多模态AI的应用场景之一,它可以处理并理解多种类型的信息,以帮助我们更好地获取和理解信息。

19、AGI

Artificial General Intelligence,即“人工通用智能”,这是另一个与AI未来相关的高频词汇。

它指AI能够在所有领域中,像人类一样学习各种知识,完成各种任务。AGI是人工智能的一种理想状态,也可以说是AI研究的终极目标,即让机器拥有与人类等同的智能。

现在的AI技术,虽然在特定任务上表现出超越人类的能力(如围棋、图像识别等),但它们仍然只是“窄”AI,仅限于特定任务。虽然研究者们对实现AGI的未来充满了希望,但这是否能在未来的某个时刻实现,以及何时能够实现,现在还不得而知。

四、AI领域新兴职业

20、提示词工程师

提示词工程师像是AI模型的导演,负责设计和优化指导AI行动的语言提示。

他们了解AI模型的工作原理,并使用这些知识来优化语言提示,从而引导AI模型产生更好的结果。他们的工作可以涵盖多种任务,比如提升AI对问题的理解,优化AI的回答,甚至引导AI生成全新的内容。这项工作更偏向语言艺术和人工智能的交叉领域。

21、提示词艺术家

提示词艺术家是AI的艺术合作者,用创意和技巧指引AI创建出吸引人的艺术作品。

他们可能会使用像Midjourney这样的图片生成模型,通过提供特定的提示词或语句,来生成新奇和独特的文本或图像内容。他们需要有深厚的艺术素养,同时也需要对AI模型的工作原理有一定的理解,以便能够精确地指导模型产生预期的艺术作品。

22、人工智能训练师

人工智能训练师就像是AI模型的教师,他们主要关注如何训练和优化AI模型。

他们为AI模型提供训练数据,监督学习过程,并调整模型参数以改善其性能。这些工作主要涉及到机器学习和深度学习的知识,需要对AI技术有深入的理解。

关于AIGC,你还有那些想要了解的问题?请在评论区留言告诉我们~


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK