3

重磅:谷歌发布最强大AI模型【Google Gemini】 - 吳先森321

 9 months ago
source link: https://www.cnblogs.com/eryueren/p/17901497.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

一、前言

北京时间 2023年12 月 13 日Google 发布了最新的 Gemini Pro模型,并且提供了 API 访问。

一个更好的消息是:Gemini Pro 可免费使用。赶紧体验起来吧~

Google Gemini是一款由Google AI开发的大型语言模型聊天机器人。它能够进行多模态推理,支持文本、图像、视频、音频和代码之间的无缝交互。Gemini在语言理解、推理、数学、编程等多个领域都超越了之前的产品,成为迄今为止最强大的AI系统之一。Gemini可以广泛应用于创意设计、写作辅助、问题解答、代码生成等领域。Gemini对标的是GPT-4,并在试图证明优于OpenAI的GPT-4。

Google Gemini 有三种版本,分别适用于不同场景:Ultra、Pro 和 Nano

  • Gemini Ultra 是最大的版本,具有最强大的性能。可用于大型数据中心等,属于处理高复杂度任务的模型。

  • Gemini Pro 是面向开发者的版本,用于各种扩展任务的最佳模型。且已搭载于谷歌的对话机器人Bard中。它可以通过 Google AI Studio 或 Google Cloud Vertex AI 获取。

  • Gemini Nano 是应用于智能手机等移动设备终端上最高效的模型。

  • 多模态能力:Gemini可以处理文本、图像、代码、音频和视频等多种类型的信息。

  • 强大的对话能力:Gemini能够进行复杂的对话,并理解用户的上下文。

  • 自然流畅的语言生成:Gemini生成的语言非常流畅和自然。

四、Gemini总结

  • 它具备丰富的功能,包括函数调用、数据嵌入、语义检索、自定义知识嵌入以及聊天功能

  • 在专业的基准测试中,Gemini Pro 的表现超越了其他同类模型

  • 当前版本配备了 32K 文本上下文窗口,未来将推出拥有更广阔上下文窗口的版本

  • Gemini Pro 可处理文本输入并生成文本输出。还推出了一个专门的 Gemini Pro 视觉多模态终端,能够处理图像和文本输入,输出文本

  • 它支持 全球超过 180 个国家和地区 的 38 种语言

  • Gemini Pro 提供了多种 SDK,以便开发者在不同平台上构建应用,包括 Python、Android (Kotlin)、Node.js、Swift 和 JavaScript,助力开发者在任何平台上快速构建应用

  • 当前Gemini Pro 可免费使用(存在一定使用限制),并且其定价将十分 有竞争力

  • Google 还提供了一个免费的在线开发工具 Google AI Studio,你可以用它快速构建 Gemini 应用,Google AI Studio

  • 关于计费方式:跟OpenAI 计算单位不一样, Google 是按字符,OpenAI 是按 Token,如果是中文会便宜不少

1. 注册Google Cloud Platform帐户

有了Google Cloud Platform帐户,就可以通过 Google Cloud Vertex AI 或 Google AI Studio访问 Gemini Pro。

Gemini API 地址:ai.google.dev

2.Google Cloud Vertex AI

Google Cloud Vertex AI 使用 Gemini Pro,操作步骤:

  1. 登录 Google Cloud Platform

  2. 单击左侧导航栏中的 人工智能

  3. 单击 Vertex AI

  4. 单击 模型库,选择 Gemini Pro模型

  5. 打开 Language Studio

Vertex AI:

image

模型库:

image

3.Google AI Studio

Google AI Studio  使用 Gemini Pro,操作步骤:

  1. 登录 Google Cloud Platform

  2. 单击左侧导航栏中的 AI Platform

  3. 单击 AI Hub,选择 Gemini Pro

六、Gemini体验

Bard 网页

Gemini API 使用入门

Gemini API 参考

七、Gemini与GPT-4对比

  1. 按谷歌的说法Gemini在所有多模态任务中的表现都优于 GPT-4。GPT-4 只能处理图像和文本。(除了HellaSwag)

  2. Gemini 可以处理视频、音频、图像和文本。随着谷歌继续训练其工具包,它的性能可能会大大超过其他各种模型。

  3. 详情请参阅 Gemini 技术报告

  4. 进一步了解Gemini 的能力和运作方式

image

八、进一步了解

1.blog.google

2.一起交流~
公众号:【米七独立技术】


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK