3

真实世界的人工智能应用落地——OpenAI篇 ⛵ - ShowMeAI

 1 year ago
source link: https://www.cnblogs.com/showmeai/p/17005567.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client
65155847017662a0eec4f32b90138fa0.png

💡 作者:韩信子@ShowMeAI
📘 深度学习实战系列https://www.showmeai.tech/tutorials/42
📘 本文地址https://www.showmeai.tech/article-detail/414
📢 声明:版权所有,转载请联系平台与作者并注明出处
📢 收藏ShowMeAI查看更多精彩内容

AI 以迅速的发展,不仅仅在研究界带来了革新,在生活的方方面面也提供智能化,使我们更便利。在本篇内容中,ShowMeAI将介绍 OpenAI 的主要发展以及它们实际落地的 AI 产品应用。

💡 OpenAI vs DeepMind,两大人工智能巨头应对不同挑战

OpenAI 的使命侧重于以安全的方式为全人类实现人工智能的可用性。OpenAI 的模型为数据提取、文本生成、语音识别、图像生成或编辑等日常任务带来了高效的解决方案。尽管它们的任务和目标不同,但它们在开发大型模型方面有着共同的努力,这些模型在当今的大多数应用中都发挥着关键的作用。

5077ef03d5cc5429574dc225a3c1101c.png

DeepMind 的使命是解决智能问题,推动科学发展并造福人类。因此,它强调通用智能,即 AI 在任何情况下都能够自行学习。这也解释了为什么 DeepMind 所有的突破都依赖于深度强化学习,即 AI 只有一个目标和一组可能的行动,需要找出实现该目标的最佳方法。

5e94bbefa1e9f363bdfa4fdb04e2653a.png

💡 GPT3,超智能化的内容生成助手

💦 GPT3介绍

📘GPT-3 是一种深度学习模型,该模型经过训练后可以预测序列中的下一个标记,并能生成流畅逼真的文本,覆盖文本分析和摘要、文案撰写、代码生成等应用场景。GPT-3 在发布后不久就掀起了全球的热潮,促进了大量应用程序和初创公司的诞生。下图为用户使用 “Grammar Correction” 开始编程的操作示例。

16835adfbd0a2fc2bdbe48a58c7e92a4.gif

💦 现实生活中的应用

OpenAI 官方表示,OpenAI API是公司第一个商业产品,自推出九个月以来,超过 300 个应用在使用 GPT-3,成千上万的开发人员在使用平台。目前平均每天生成 45 亿个单词,且生产流量继续扩大中。

如果你需要在线的文本解决方案,那可以阅读更多相关信息并自己把模型玩起来:https://beta.openai.com/playground。OpenAI 为所有新帐户提供 18 美元的信用额度。

💡 CLIP,文本和图像的天然融合艺术

💦 CLIP介绍

📘CLIP 是 OpenAI 开发的一种大型预训练语言模型,将输入的文本映射到一个连续的向量空间,并通过计算两个文本之间的距离来进行文本分类和相似度计算。与传统的语言模型不同,CLIP可以通过学习数据库中的大量文本数据来实现端到端的文本分类,而不需要任何人工标注。因此,它可以用于许多不同的文本分类任务,包括情感分析、知识图谱构建和图像标注。下图表明 CLIP 极大地改进了图像分类的结果!

aa752ed00b72aa6bef2ee3ec8be50f31.png

💦 现实生活中的应用

CLIP可以完成零样本图像分类、图像描述、内容审核、图像生成等。值得注意的是,CLIP 是 DALLE 的构建块之一。

💡 DALL·E 2,优秀的艺术家

💦 DALL·E 2介绍

📘DALL·E 2 是 OpenAI 公司研发的一款新的人工智能系统,不仅可以根据文本描述生成对应的逼真图像,还可以根据文本提示修改图像内容,以及根据给定的图像拓展生成多种主题风格一致的“变体”。目前公开可用,可以直接访问 OpenAI 网站,也可以调用 API(2022 年 11 月已经发布!)。

96d0b260ee48774554bb82db2b8f698c.png

💦 现实生活中的应用

DALL·E 2 的影响力可与 GPT3 媲美,应用场景也非常丰富,包括插图、图像摄影、NFT 生成、图像编辑等。微软已经宣布 DALL·E 2 将为其 Designer App 提供支持;Shutterstock 还宣布与 OpenAI 建立合作关系,允许用户在平台上使用 DALL·E 2 进行创作!

493c4fcecc92906f34104ecccecb4061.png

💡 Whisper,听懂所有语言的智者

💦 Whisper介绍

📘Whisper 是一个自动语音识别 (ASR) 系统。它使用从网络上收集的 680,000 小时多语言和多任务监督数据进行训练。使用如此庞大且多样化的数据集可以提高对口音、背景噪音和技术语言的鲁棒性。此外,它还支持多种语言的转录,以及将这些语言翻译成英语。

💦 现实生活中的应用

Whisper 是免费和可编程的,使用体验令人兴奋!这也使其成为现有商业语音识别服务的有力竞争者。它也可能直接挑战了当前主流的“基于云的 ASR 服务”。

由于 Whisper 模型较小,便于本地运行的移动 App 使用,从而可以避免转录前数据上传云端导致的隐私问题(已经有人行动起来了 📘例如下方推文)。

809606396835fb21bc7941d3b9977249.png

💡 Codex,完美代码生成助手

💦 Codex介绍

📘OpenAI Codex 是一种基于 GPT-3 的自然语言到代码系统,有助于将 自然语言指令转换为十几种流行的编码语言。Codex 于去年 8 月通过 OpenAI 的 API 发布,是 GitHub Copilot 的主要构建块。

其实,可以要求 GPT3 解释一段简单的文本代码,从代码到解释性文本这个过程GPT3也可以做得很好,理解和生成代码的能力已经编码在 GPT3 中。而 Codex 专注于生成可执行代码,使其成为开发人员的绝佳助手。由于它已经集成到 Visual Studio 中,根据经验,将它无缝集成到开发周期中。

727e5cc7ee089786109ac252698e4b79.png

💦 现实生活中的应用

许多应用已经出现,包括各种代码助手 copilot、pygma 和 replit 等。

  • Copilot 编码助手能够根据指示生成代码、将注释转换为代码、生成测试并提出备选方案。
  • Pygma 使用 Codex 将 Figma 设计转换为高质量代码。
  • Replit 使用 Codex 描述选定的一段代码的作用,以便每个人都能理解其功能。

下图为 Replit 依靠 Codex 来解释部分代码。

51aa169b3ec8b7fc609008c09a0a01cd.gif

💡 ChatGPT,令人兴奋的AI聊天机器人

💦 ChatGPT介绍

📘ChatGPT 是 OpenAI 于 11 月 30 日推出的一款聊天机器人,能根据用户的提示,在对话中生成类似人类的文本响应,完成回答问题、提供信息或参与对话等各种任务。与许多使用预定义的响应或规则生成文本的聊天机器人不同,ChatGPT 经过了训练,可以根据接收到的输入生成响应,从而生成更自然、更多样化的响应。

ChatGPT的亮点主要有哪些?

  • 新增代码理解和生成能力,对输入的理解能力和包容度高,能在绝大部分知识领域给出专业回答。
  • 加入道德原则。即ChatGPT能够识别恶意信息,识别后拒绝给出有效回答。
  • 支持连续对话。ChatGPT具有记忆能力,提高了模型的交互体验。
fce67cb7781dacb7017bac2a66d28f7f.png

💦 现实生活中的应用

ChatGPT不仅会聊天,写得了代码,修复得了bug,还能帮你写工作周报、写小说、进行考试答题,绘画,看病,甚至你还可以诱骗它规划如何毁灭人类,许多人认为,ChatGPT不仅仅是一个聊天机器人,而可能是现有搜索引擎的颠覆者。

954c7f16138b318fe79bb34dda1d1d57.png

e9190f41b8de4af38c8a1a0c96f0513b~tplv-k3u1fbpfcp-zoom-1.image

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK