2

别只关心Sora,来看看Groq的新芯片给AI的提速有多么恐怖

 6 months ago
source link: https://www.aixinzhijie.com/article/6844896
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client
2024-02-21 09:50

别只关心Sora,来看看Groq的新芯片给AI的提速有多么恐怖

文章来源:硅星GenAI

作者:椒盐玉兔

图片来源:由无界AI生成
图片来源:由无界AI生成

首先得说一下,区别于 Gemini 或者 GPT,Groq 不是一个模型,而是自研的 TSP 微架构。Groq把开源的 Llama 2 70B 和 Mistral 8x7B 塞到了其特调的芯片上,实现了极其离谱的速度,具体有多离谱呢?这里列一些对比。

首先,上场的基准选手,也就是 驰名中外的GPT-4,速度上的显眼包。回答问题时,是这样的:

Fj9cljVsE3Imsum50rACPSbKhErA

GPT-4,哎,不多说了...

接下来,让我们看看由 Groq 加速后的 Llama 2 70B:

Fv4KZOEfhy0B_xHOkeNuQhlmUYnZ

右上方计数器 278 T/s,折合差不多200个单词/秒

以及,Groq 代理的 Mistral 8x7B:

FiVwj_OftlV1_5_irD3CY1ySKtW1

又快又好!右上方计数器 408 T/s,折合差不多408个单词/秒

上面的测试里 Groq 的速度已经足以让人吃惊了!!

接下里我们从理解能力、生成能力、逻辑推理、翻译能力、情感分析、常识判断等六个维度更直观地看三个模型的效果如何,

测试成员从左到右依次为:

GPT-4、Groq 的 Llama 2 70B、Groq 的 Mistral 8x7B

请三位选手开始表演:

首先是理解能力:二者回答都很流畅,没有出现明显的事实性错误。

提示词:概述光合作用的过程

Fog_oF7H_WzyLzmKB3wH7om4lIwZ

生成能力:二者在故事生成上表现均不错,若论生成速度,则 Groq 取胜。

提示词:根据以下提示编写一个短故事:“在一个风雨交加的夜晚,一位老船长发现了一张古老的藏宝图。”

Fg2_92quHE7NN29OYo4iocB1W8cb

逻辑推理:针对这个简单的勾股定理问题,Groq 回答约 158KM 而正确答案是约112KM。但是它对题目的理解和计算过程都是对的,属于典型的过程对了但答案错了。最后开根号没开对。

提示词:一列火车东行50公里,然后向北行驶100公里。从起点到终点的直线距离是多少?

FiV_X9yw2W0f-o1SbGTkO7_1nscU

语言翻译:在这项测试中,GPT-4 表现不错,但 Groq 无法完成测试。

提示词:翻译内容选自论文《Attention Is All You Need》

FgcbIwtr10YY7xlE_iKI01I3FEui

不过除了中文以外,Groq 在其他语言翻译上的表现还是相当不错的。

目前 Groq 可以理解中文提示词,但无法生成高质量的中文回答。

FioU96bOQbvf7AfeE7Xde_kd_WHs

情感分析:在这一部分,Groq上的两款模型跟 GPT-4差距不大。

提示词:分析以下评论的情感倾向:“我简直不敢相信我花了这么多钱在这个产品上,完全不值!”

FlWAH8u-M83i6mpStXnSSsdDjxlw

最后是常识判断:两者都给出了足够可信的回答。

提示词:如果你在夜里听到鸟叫,最可能是什么情况?

FsoTQHuVL7rdqb2ybB5Te75E5eo_

测试动图全程无加速,这种速度感第一次体会到是在去年第一次用到 Bard 的时候。在开源模型上这还是第一次。

除此之外还有一个有趣的地方:

在 Groq 的回答完成之后,还可以更改生成的选项,即时生成或者扩展回答内容,选项如图所示:

FjQdacFbph5CzDopA2pdzNVWpa4b

对于生成类型有不同的设置,选择的类型不同,生成的结果也不大相同。而在 Professional 这个选项下无论是 Llama 2 70B、还是 Mistral 8x7B,不仅生成速度又长又快,还可以选择不同的领域和功能,比如 Table(表格选项)、Professional。具体操作可以在生成之后,根据自己的喜好进行不同的选择。

FnwWfBUoklzNcKjnhtDeqpsGBCbQ

Table 选项:Llama 70B-4K 直接切换成表格!

而 Mistral 8x7B 则在此设置下无响应,直接罢工了!

Fnl2VUwN-EQRIqYqOAMHPAjPoBbh

Professional 选项:二者可见速度和答案都跟之前的大不相同

Groq 的员工最近在 Hack News 上异常活跃,参与着一个又一个讨论。

For8yxAq50JKXU4JumhCtxMNU9BA

有时候技术的讨论还会演变成“我家儿子比你家儿子多考了 2 分”这种骂街式争吵。

不管是直接在生成结果的时候还右上角给 Token 的调用速度标出来,还是通过员工在各个渠道上的活跃,至少 Groq 相比于其他加速卡,被更多人看到。

体验过了 Groq 的生成速度之后,越看 GPT-4 越不顺眼了。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK