2

Gemini修bug神了!录网页视频把代码库甩给它就行,网友坐不住了:想要访问权限

 6 months ago
source link: https://www.qbitai.com/2024/03/126760.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

Gemini修bug神了!录网页视频把代码库甩给它就行,网友坐不住了:想要访问权限

head.jpg鱼羊 2024-03-09 10:49:02 来源:量子位

GPT-5或许能实现屏幕共享?

西风 发自 凹非寺

量子位 | 公众号 QbitAI

谷歌Gemini修改bug让网友大开眼界!

X一小伙分享,为测试Gemini 1.5 Pro,自己在编写一个网页的代码时故意留了3个bug,并分别录制了网页bug视频。

接着把代码库打包成文件连同视频一起输给了Gemini 1.5 Pro,提示它找到并修复代码中的所有bug,且要提供一个简要指南以及所做更改的说明。

没想到,Gemini 1.5 Pro还真就分分钟正确识别并修复了每一个bug。

5d93b2cc9c552a3dad51df2f4d6a4f2a.png

小伙将这种玩法po出来后热度不断攀升,网友们纷纷一键三连,转赞收藏量过万。

其本人还在评论区强调,“这只是一个简单的例子,也将是它最差的表现”,Gemini这小汁前途不可限量啊。

37a95f14f35c2a8777e09f42d3c7f555.png

有网友表示想起来一件事觉得有趣:英伟达黄院士前段时间曾公开表示“孩子们以后不需要学编程了”,那时候还有很多人反对称“AI不会取代程序员”。

e06dbac3533328cef748ec37130af489.png

但甭管怎么说,AI可以给程序员提供帮助是有目共睹的。

fd60b9c39b64ce9e1c8f810e238357e2.png

接下来我们展开来看Gemini 1.5 Pro修复bug的经过。

正如开头提到的,网友先是在编写网页代码时故意写错了3处:

14f0651a9dfe0a55c94eb952ea6d9565.gif

这就导致网页上的一些功能操作无法正常运行,于是小伙分别拍摄了3处无法正常运行的视频,每个视频十几秒。

然后将视频连同代码库一起输给了Gemini 1.5 Pro。

prompt为:

Fix the bugs in my code.Create a simple markdown guide for me to fix them,and then write the actual code to fix the bugs.I need the full code like it’s for a complete PR so I am make the changes.(修复我代码中的bug,为我创建一个简单的Markdown指南以修复bug,然后编写实际的代码来修复。我需要完整的代码,就像它是为了一个完整的Pull Request一样,这样我才能进行更改。)

2e31b5e382f8ce024e8f7acfd076f037.gif

随后,Gemini 1.5 Pro立刻准确识别了3个bug:

  • 点击一个待办事项并不会将其标记为完成/未完成
  • 主题切换器不会切换主题
  • 点击登录按钮不会触发任何操作
99a9596b392bc2fefc42ad7f74728f4d.gif

紧接着就分别给出了修复方案,附带代码:

372dd66b03faf39fdc14ac422e703799.gif

小伙仔细对照自己敲的代码,确认Gemini 1.5 Pro给出的答案是正确的:

a8426771cbd559451dc79f3eacd15839.gif

小伙还强调,这3个bug在代码库文件中其实离着很远,这也就意味着Gemini 1.5 Pro确实读完了完整的上下文。

03f906bd8cc1cb2045cdc26dd523568a.gif

“想要访问权限”

网友看到这一系列操作后激动搓手,直呼想要Gemini 1.5 Pro访问权限:

4a91c95094f2aeac858b7d83c22d7cb6.png
db97899d2b9bb50c8216e98b0d2462ef.png

除坐等外,还有网友表示用GPT-4帮忙修复代码也很好使,顺带畅想了一下GPT-5:

接下来可能是实时交互?或许能与GPT-5进行屏幕共享?

06419e0ffddafb5bf6606d4a16df732f.jpeg

而另一边已经获得访问权限的网友早就玩嗨了。

比如,一次性输给Gemini 1.5 Pro最新的10篇论文,让它从中找到一个作者的电子邮件地址。

结果Gemini 1.5 Pro第一次就成功找到了:

47e6eca175f989d91942204be81177cc.png

然后又让Gemini 1.5 Pro从超360000token的《哈利·波特与凤凰社》整本书中找到一句话的说话人,Gemini 1.5 Pro也成功找到了。

27b78625361a41338d29160fdb910c9e~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1710556152&x-signature=POYQeh9NFwgW4XqPLofXOrOaDBw%3D
e32d5fba536c42629b283b2302a23756~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1710556152&x-signature=K%2FcnDb9mHZA3LZqMi07DD847Rog%3D

测试继续上难度,一次性输入三本书,Gemini 1.5 Pro最后用时约1分钟再次成功找到对应的说话人:

9fae3e19a9c14e048f3e751918aef5a4~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1710556152&x-signature=dih%2F67imZJI%2BJDmRbUkiKpcfjC4%3D

惊讶之余,这位测试者总结了Gemini 1.5 Pro的逻辑推理能力:

对于常规提示,接近GPT-4的性能。

但当我添加数十个例子时,Gemini的性能在提升,似乎没有上限。多示例提示成为了新的微调方法。

67a154adcefb4adeb761e94e77255417~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1710556152&x-signature=6IXGsfJpQtpqqv3hf9SlTqZGbCg%3D

沃顿商学院教授Ethan Mollick也来整活了。输给Gemini 1.5 Pro一本352页的《太空60年》规则手册,约250000token,然后要求它扮演一个角色。

即使说明书分散在很多页上,而且非常复杂,但Gemini“似乎明白了”:

783db4d4f0204948ac16c86c2c751b86~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1710556152&x-signature=%2BN%2FZBLpLrmXqY5Pop3DCHDHF07k%3D

Ethan Mollick教授表示,对所有其他AI进行这项测试都是失败的,只有Gemini 1.5 Pro成功了。

509e3a599473472eb46982e8f4366c77~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1710556152&x-signature=P8RPRhcL14UCV8WTyTEGPQxjKuY%3D

这位网友想要编译整个X算法的代码存储库并将其上传到Gemini 1.5 Pro,正在线向网友征集想问的问题。

527623c002bc47ae8aeafd6c92d41dcc~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1710556152&x-signature=fZIhKEu5gKg%2BQwWjv6Q1YtD0hO8%3D

只见编译完成后,共310489token,Dogan Ural向Gemini 1.5 Pro提出了网友们关心的一系列问题,比如“在推特上扩大或者减少影响力的前5件事是什么?”

Gemini 1.5 Pro很轻松地给出了这样婶儿的答案:

7ad2ae9ab70a45e3b3c4540d9b94d9f0~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1710556152&x-signature=x6q0Mu4ILVt6JrlH%2BOyve3KSl3g%3D

你还见过哪些有趣的玩法?欢迎评论区分享~

参考链接:

[1]https://twitter.com/mckaywrigley/status/1762175776726663267
[2]https://twitter.com/mattshumer_/status/1759981272779108403?s=46&t=iTysI4vQLQqCNJjSmBODPw

版权所有,未经授权不得以任何形式转载及使用,违者必究。

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK