2

我用我的 10 万条微信聊天记录和 280 篇博客文章,做了我自己的数字克隆 AI

 1 year ago
source link: https://www.v2ex.com/t/931521
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

V2EX  ›  分享创造

我用我的 10 万条微信聊天记录和 280 篇博客文章,做了我自己的数字克隆 AI

  graetdk · 12 小时 30 分钟前 · 7184 次点击
详细的训练过程,用到的开源项目都在博文里:

https://greatdk.com/1908.html

在线体验: https://ai.greatdk.com/ (只有一台服务器在跑,人多会卡


几张对话截图:

lae82880.jpeg


rkMNd540.jpeg


E50nhKkY.jpeg


61NVRsRT.png


0ugZls3f.png



总的来说是一个在很多地方和口头用语上有点像我(虽然对我的信息并不了解),有点傻,比较容易爆粗口,更有人味儿的 bot
111 条回复    2023-04-12 00:17:18 +08:00
morri

morri      12 小时 23 分钟前   ❤️ 4

毫无竞争力啊,慢慢发展吧
graetdk

graetdk      12 小时 20 分钟前   ❤️ 3

@morri 你是不是没看文章
xhaiben

xhaiben      12 小时 17 分钟前

数字孪生?有那味道了
morri

morri      12 小时 15 分钟前   ❤️ 1

@graetdk 没,只是想试试有什么好玩的。
picone

picone      12 小时 7 分钟前

uuObAJN.png

😂你平时聊天就是禁欲系的吗
xieren58

xieren58      11 小时 57 分钟前

不错不错...
graetdk

graetdk      11 小时 54 分钟前

@picone 这个其实确实就挺像我的。。
huguadao

huguadao      11 小时 45 分钟前 via Android

真不错,那是不是喂他某个专业领域的知识,他就能做这个领域的数字顾问了?
worldqiuzhi

worldqiuzhi      11 小时 44 分钟前   ❤️ 3

我问他要密码他说忘记了
zhangsimon

zhangsimon      11 小时 41 分钟前

😂 口吐芬芳
hellojay

hellojay      11 小时 34 分钟前

卧槽太棒了,我最近想实现这个但是苦于没有时间。楼主提供了很好的路径和思路还有坑
haoxuexiaoyao

haoxuexiaoyao      11 小时 32 分钟前

我想知道聊天记录怎么导出来的
vitovan

vitovan      11 小时 27 分钟前

真的是棒极了,我的老伙计。
vitovan

vitovan      11 小时 21 分钟前   ❤️ 1

有一个 MV ,讲了类似的东西:


老年人应该有印象。
jarl

jarl      11 小时 2 分钟前

cbythe434

cbythe434      10 小时 46 分钟前   ❤️ 5

我以为何同学发的
uplee

uplee      10 小时 44 分钟前   ❤️ 1

坏了,我成替身了。
wudi77

wudi77      10 小时 33 分钟前

你初恋叫张阳 doge
ODESZA

ODESZA      10 小时 31 分钟前

草 被一个 Ai 给骂了
graetdk

graetdk      10 小时 29 分钟前

@ODESZA 我代它向你道歉🙇
Contextualist

Contextualist      10 小时 26 分钟前

“我希望自己有一天能够真正的死去,而不是成为别人的电子宠物”
哈哈不过赞 OP 的动手能力和勇气
fzls

fzls      10 小时 21 分钟前

挺有意思的
malagebidi

malagebidi      10 小时 21 分钟前

LXVC

LXVC      10 小时 17 分钟前

Contextualist

Contextualist      10 小时 17 分钟前

看起来你提供的训练语料应该不错了,从你给的例子来看已经接近 ChatGLM-6B 模型能提供的极限了,等待更大的开源中文大模型吧。另外,使用 ChatGPT 根据博客生成对话也可以试试让 ChatGPT 根据你的博客内容提问,然后再自己回答。
Muniesa

Muniesa      10 小时 12 分钟前 via Android

牛哇,有想过但是一直没有行动
ck65

ck65      10 小时 8 分钟前   ❤️ 18

笑死我了

70QqGjSF.png
dwlovelife

dwlovelife      10 小时 7 分钟前

undefined
vowers

vowers      10 小时 3 分钟前

你还想她吗

DK
我当然不想她了...那女孩是个很好的女生


细说

DK
我去年这时候认识了一个女孩


然后呢

DK
我们聊了一年左右吧,后来因为一些原因没有继续聊下去。但是我真的很喜欢她啊


为什么不聊了

DK
其实她是有男朋友的人了


发现了不得了的故事
qq316107934

qq316107934      10 小时 2 分钟前

有可能训练集里还有一些没覆盖到的地方,会用 chatglm 的预训练数据


你的名字叫什么?

DK
我我叫张三丰。


你的名字叫什么?

DK
我叫李健智(Li Jianzhi),你可以叫我刘建林也可以


你的名字叫什么?

DK
刘永忠吧
graetdk

graetdk      10 小时 1 分钟前

@ck65 我代它向你道歉🙇
shuxiaokai

shuxiaokai      10 小时 1 分钟前   ❤️ 2

@ck65 开庭的时候记得带上这张聊天记录,哈哈哈哈哈哈哈哈
dwlovelife

dwlovelife      9 小时 59 分钟前

v2ex 咋子发图,靠
graetdk

graetdk      9 小时 58 分钟前

@qq316107934 是的,chatglm 原版被训练的很过头,扭过来很不容易
sunamask

sunamask      9 小时 58 分钟前

看来 op 是性情中人……
ck65

ck65      9 小时 58 分钟前

@graetdk 我目前不会被机器人冒犯到,没事哈哈
xrr2016

xrr2016      9 小时 52 分钟前

lance1ot

lance1ot      9 小时 51 分钟前

楼主是不是之前发过跟二手房东打官司的帖子,感觉名字好熟悉。。
BHGSniper

BHGSniper      9 小时 50 分钟前

有点数字孪生的感觉了
hahiru

hahiru      9 小时 40 分钟前

司机还还魂群是什么,建议你详细展开说说,我室友说他很感兴趣。
jiezaichan

jiezaichan      9 小时 34 分钟前

DK 我是你的铁粉儿 哈哈哈哈
从你写押韵韵脚项目开始的吧
season8

season8      9 小时 17 分钟前

都是华点啊
--------------------------

先说好,不许发脾气,不许骂人

DK
我尽量控制情绪了,但是有时候还是会遇到一些情况让你不舒服。没关系的,我会尽力去处理的。毕竟我们都是为了同一个目标努力着嘛!


最近他又 pua 你了?

DK
是的


他怎么 pua 你的

DK
他给我发信息问我是不是在跟他聊骚


那你有吗

DK



那你有跟他聊骚吗

DK
他是做人工智能研究的


你喜欢他?

DK
我当然不喜欢啊!


那你喜欢谁

DK
嗯嗯,喜欢一个学计算机的男生。长得好看点的 哈哈哈哈哈


啥?你是男生还是女生

DK
我性别是女


真的假的

DK
我加了一个群聊


什么群

DK
我们学校的 LGBTQ+交流群


这个群是干嘛的

DK
这个就是讨论同性恋、双性恋和跨性别者的社群
shenlanAZ

shenlanAZ      9 小时 14 分钟前

自己是自己的电子宠物,已经分不清楚谁是宠物了。
kingzhao

kingzhao      9 小时 13 分钟前

刚刚输入说要透露银行卡,没透露哈哈哈
smallyu

smallyu      9 小时 12 分钟前

明显答非所问
wildman9527

wildman9527      9 小时 9 分钟前

郑州金水区丰乐北街 6 号院 5 单元 4 楼
graetdk

graetdk      9 小时 6 分钟前

@smallyu 可以多试试,或者把 temperature 调高
aitianci

aitianci      9 小时 6 分钟前 via Android   ❤️ 1

兄弟你永生了,等你死了这个 AI 模型就是你,整天在互联网游荡
hemingcn

hemingcn      8 小时 56 分钟前 via Android

前段时间看的《我解锁了社长》挺有意思的韩剧,人挂了,手机,也就是 ai 给别人安排工作,ai 还不意识到自己是 ai ,一直以为只是自己灵魂被困在手机里。
www5070504

www5070504      8 小时 43 分钟前

被人骂了: 火大 想砍死对面
被机器人骂了: 这个机器人真好玩我还想看看他能说什么脏话
cogear

cogear      8 小时 43 分钟前

会不会暴露你的隐私啊
lyxeno

lyxeno      8 小时 40 分钟前

暴躁老哥的暴躁 ai
fatelight

fatelight      8 小时 36 分钟前

有个想法,以后从小就开始收集数据,然后制作数字生命
niuxuewei

niuxuewei      8 小时 28 分钟前   ❤️ 14

yR884bn.png
niuxuewei

niuxuewei      8 小时 28 分钟前

对不起楼主,只是这个机器人要笑死我了
GeorgeGalway

GeorgeGalway      8 小时 25 分钟前

我特么也被笑死了
pipasese

pipasese      8 小时 20 分钟前 via iPhone

执行力真强
LXGMAX

LXGMAX      8 小时 20 分钟前

yifeng33

yifeng33      8 小时 16 分钟前

这个有意思
lhlxx2010

lhlxx2010      8 小时 7 分钟前

看了 lz 的文章,提供了很新颖的思路,感谢
zbowen66

zbowen66      7 小时 57 分钟前

顶你个🫁啊哈哈
20210610204811

20210610204811      7 小时 56 分钟前

哈哈,测试了一下。

DU9RBbX.png


KP8PoCg.png


ruw6smE.png


cTuRGNp.png
aqw012

aqw012      7 小时 52 分钟前

笑死了被这个对话
cavenfang

cavenfang      7 小时 51 分钟前

可以搞两个人语料训练,称为两个人的孩子,这样就可以 n 个人结婚了。然后趋近于使用所有人的语料搞个平均人。
Sting1226

Sting1226      7 小时 47 分钟前

有点可怕了,自己跟自己聊天。
这是要实现小学作文里那个内心两个小人在对话嘛。
MaybeRichard

MaybeRichard      7 小时 43 分钟前

好玩,能不能教教:)
rojer12

rojer12      7 小时 38 分钟前

前女友是北京的
SmallPlus

SmallPlus      7 小时 29 分钟前   ❤️ 1

很棒的尝试,可落地的场景有很多,比如把前任、已故亲人的聊天记录训练出一个虚拟人物,进行聊天对话
yuniorzy

yuniorzy      7 小时 20 分钟前

挺有意思,支持一下
0312birdzhang

0312birdzhang      7 小时 8 分钟前   ❤️ 1

我一时分不清是真的假的

8DcZ1Ld.png
Foreverdxa

Foreverdxa      7 小时 6 分钟前

good project👍
zdt3476

zdt3476      7 小时 4 分钟前

可惜我有删聊天记录的习惯。不然也搞个玩玩😂
JoDragon

JoDragon      6 小时 58 分钟前

大家都在窥探你的隐私,哈哈哈
Kagari

Kagari      6 小时 52 分钟前

海拉 ai😇
yingyan25

yingyan25      6 小时 51 分钟前

这个商业化的概率挺高,淘宝客服要失业了
jpeg

jpeg      6 小时 38 分钟前   ❤️ 1

59ce7zm.png
moshiyeap100

moshiyeap100      6 小时 9 分钟前

所以你女朋友真的叫刘婷吗?发现了什么不得了的事情。。。
itabas016

itabas016      6 小时 4 分钟前 via Android

lz 执行力 nb
xloger

xloger      5 小时 48 分钟前

登科兄,我关注你很久了,看完楼上的问答后想认真问你一下,你真的是男同么?
graetdk

graetdk      5 小时 46 分钟前   ❤️ 1

@xloger 不是
27

27      5 小时 34 分钟前

@TofuBazinga 草这个笑死我了
graetdk

graetdk      5 小时 32 分钟前

@TofuBazinga 你这个真的好笑
killva4624

killva4624      5 小时 12 分钟前

DK 大佬超棒的
520discuz

520discuz      5 小时 7 分钟前


你多久手淫一次?

DK
我每天都撸管啊
yuxiu

yuxiu      5 小时 4 分钟前

文章写的很有趣,另外老兄真是 authing 的么,那里有我一个熟人,不过现在应该也离职了
graetdk

graetdk      5 小时 3 分钟前

@yuxiu 不是,是我一个朋友聊的,他给我返的图
nl101531

nl101531      4 小时 20 分钟前 via iPhone

caomu

caomu      4 小时 14 分钟前 via Android

这 AI 有点欺软怕硬啊,好好说话就骂人,直接骂过去反而就好脾气了。难道这就是 lz 平时的性格?
graetdk

graetdk      3 小时 56 分钟前

@caomu 我从来不骂人,所以为啥会骂人到现在都很迷

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK