3

由“文身女孩”讨论帖想到的 Bayes 经验

 1 year ago
source link: https://www.v2ex.com/t/923074
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

V2EX  ›  生活

由“文身女孩”讨论帖想到的 Bayes 经验

  sixg0d · 16 小时 56 分钟前 · 4129 次点击

背景帖 https://www.v2ex.com/t/922618?p=1

我在这里不想讨论道德伦理,只是想分享一个有点意思的认知观点。假设女孩(被粗暴地)分为好女孩和坏女孩,那么一个文身的女孩更有可能是坏女孩还是好女孩呢?

请先在心里有答案了再看下面的分析。

假设社会上平均每 100 个女孩中有 10 个坏女孩,90 个好女孩。坏女孩中 50%有文身,所以有 5 个;好女孩只有 10%有文身,那就是 9 个。那么对于文身的女孩来说,只有 5/(5+9)≈35.7%的概率是坏女孩,也就是说文身的女孩更可能是好女孩。

其实这就是基本的 Bayes 概率。但我们的直觉 /刻板印象会倾向于认为文身的女孩是坏女孩,这方面心理学家、经济学家们已经有很多讨论了,比如 Kahneman 。我在这里抛砖引玉地分享下我的一些理解。

比如说其实这问题问的是坏女孩和好女孩哪个概率大,但我们脑中更直观的想法是坏女孩和好女孩文身的概率,而概率论告诉我们,P(文身|坏女孩)>P(文身|好女孩) 不代表 P(坏女孩|文身)>P(好女孩|文身)。

或者说人们比较的是相对的概率,并不是看坏女孩的概率是否大于 50%,而是看坏女孩的概率是否变大了。诚然,在文身的条件下,坏女孩的概率是增大了,但增加的幅度没有人们以为得那么大:在我们的例子中,概率只是从 10%增大到 35.7%,哪怕所有坏女孩都会文身,概率也就将将过 50%,远没有达到文身和坏女孩划等号的地步。

3Blue1Brown 有一个关于这个 Bayes 经验的科普视频 https://www.youtube.com/watch?v=HZGCoVF3YvM

再次声明,以上描述纯粹只是讨论数学 /概率,不代表现实观点。

59 条回复    2023-03-12 00:56:41 +08:00
gant

gant      16 小时 46 分钟前   ❤️ 16

假设社会上平均每 100 个女孩中有 20 个坏女孩,80 个好女孩。坏女孩中 20%有文身,所以有 4 个;好女孩只有 1%有文身,那就是 0.8 个。那么对于文身的女孩来说,只有 4/(4+0.8)≈83%的概率是坏女孩,也就是说文身的女孩更可能不是好女孩。
Donahue

Donahue      16 小时 40 分钟前   ❤️ 2

贝叶斯的前提: 假设待分类项的各个属性相互独立
spongeboBoy

spongeboBoy      16 小时 39 分钟前 via iPhone

我以前对于这种事情第一反应是概率问题,但也从来没有仔细思考具体的数学结果,这次学到了
Jim142857

Jim142857      16 小时 39 分钟前

base rate fallacy 啊
Donahue

Donahue      16 小时 38 分钟前

噢噢 不对,好坏是分类目标,文身是属性...
totoro625

totoro625      16 小时 33 分钟前   ❤️ 21

第一印象,文身的女孩更有可能是坏女孩
这句话的意思不是文身的女孩是坏女孩的概率比是好女孩的概率大;而是文身的女孩比不纹身的女孩更有可能是坏女孩

按你的例子来说,有纹身的一共 14 人,5 坏 9 好;没纹身的一共 86 人 5 坏 81 好;
你在有纹身的 14 人中遇到坏女孩的概率是 35.7%;
你在没纹身的 86 人中遇到坏女孩的概率是 5.8%;

人和人感情成本的投入,让你没有那么多的试错成本,明明有遇到好女孩概率更高的选择,何苦骗自己,把自己框死在纹身女孩的选择里赌概率呢

你需要跳出纹身女孩这个思想洼地,去看一下不纹身的女孩
cmdOptionKana

cmdOptionKana      16 小时 31 分钟前

> 假设社会上平均每 100 个女孩中有 10 个坏女孩,90 个好女孩,坏女孩中 50%有文身。

这个假设比例 50% 不合适。

一楼优化了比例:

> 假设社会上平均每 100 个女孩中有 20 个坏女孩,80 个好女孩,坏女孩中 20%有文身。

但这个假设比例 20% 还是不合适。

为什么坏女孩中 20% 有文身呢?这个其实需要调查数据,否则,如果没有调查数据,也不带偏见的话,那么应该相当于在 100 个女孩子中随机贴一个“纹身”标签,然后对这 100 人随机贴一个“坏”标签,然后看看同时带着这两个标签的人有多少个,我数学不好,但我根据逻辑分析,这样的结果应该是低于 20% 的,因为那两次随机应该不相关,而楼主和一楼采用了相关性很强的计算方法,恰好体现了有偏见的人潜意识里的错误计算方法。
gant

gant      16 小时 24 分钟前   ❤️ 1

@cmdOptionKana 我是用魔法对魔法。要得出目的结论,这个例子不合适,不合适中更不严谨。
zhang77555

zhang77555      16 小时 10 分钟前   ❤️ 1

具体这个事情考虑概率意义不大, 因为婚恋试错对男性来说成本可不低,
没有必要为了证明纹身和适婚属性无关而付出成本,
毕竟纹身的可是少数,直接摒弃掉这部分又无所谓
cmdOptionKana

cmdOptionKana      16 小时 9 分钟前

@gant 原来如此,那就对了。

我又想了一下,可以表达得更清楚一点。

楼主的计算方法:在 100 个女孩子中随机贴 10 个“坏”标签,然后对这 10 人随机贴 50 个“纹身”标签。

我认为正确的计算方法:在 100 个女孩子中随机贴 10 个“坏”标签,再对这 100 人随机贴 N 个“纹身”标签。

这样对比,应该很容易看出楼主那个是有偏见的算法。
cmdOptionKana

cmdOptionKana      16 小时 8 分钟前

写错了:50 个 -> 5 个
bigbrother

bigbrother      16 小时 6 分钟前

纹身女孩多少有点特立独行
普通人 hold 不住就说别人是坏女人
sillydaddy

sillydaddy      16 小时 2 分钟前

很有趣的主题。感谢楼主分享。贝叶斯概率在生活中,应该是挺常见的。

OP 特意提到:“以上描述纯粹只是讨论数学 /概率,不代表现实观点”。
我试着分析一下,要跟现实关联起来,还需要哪几步:

1. 现实中好坏女孩以及纹身比例的真实数据,并不能说服人们。因为人们可以辩解,他印象中的比例不是这样的。

2. 即使作统计抽样和问卷调查,询问人们印象中的比例,得出结果也不能说服。因为人们的直觉计算并不使用他们在问卷调查中填写的比例。

3. 最后如果追问他们做直觉计算时,到底怎么考虑的呢?他们大概率会说,对不住,我也不知道我怎么就直接产生这么一种直觉了。

死胡同了。
cmdOptionKana

cmdOptionKana      15 小时 59 分钟前

@totoro625

> 第一印象,文身的女孩更有可能是坏女孩
> 这句话的意思不是文身的女孩是坏女孩的概率比是好女孩的概率大;而是文身的女孩比不纹身的女孩更有可能是坏女孩

这楼竟然有两个赞,可见偏见对判断的影响有多大,这个逻辑错误简直像太阳一样巨大耀眼不可忽略。

A. 一个女孩子纹身,她是坏女孩的概率 不大于 她是好女孩的概率 => 可以推理出 一个女孩子纹身,不会增加她是坏女孩的概率

B. 文身的女孩比不纹身的女孩更有可能是坏女孩

楼主说 A 与 B 同时为真。
sillydaddy

sillydaddy      15 小时 58 分钟前

@totoro625 #6
你的说法其实跟 OP 主题说的「诚然,在文身的条件下,坏女孩的概率是增大了,但增加的幅度没有人们以为得那么大:在我们的例子中,概率只是从 10%增大到 35.7%」是一个意思。
cmdOptionKana

cmdOptionKana      15 小时 56 分钟前

抱歉,又写错字了: 层主说 A 与 B 同时为真。
kingjpa

kingjpa      15 小时 48 分钟前

文身只是显眼属性,人们认为文身不是好娃娃原因是,干坏事的 进号子的,吸药物的,其中一大部分带有文身这一共同属性。

所以才会这样认为,当然这也是事实。
cssk

cssk      15 小时 42 分钟前 via iPhone

我还以为是写熊猫此短信的八爷
clecho

clecho      15 小时 36 分钟前   ❤️ 2

本来对纹身人士没有偏见,看见这么多纹身人士为了证明自己是好女孩,把那么多未纹身人士拉下水就很恶心
kop1989smurf

kop1989smurf      15 小时 34 分钟前

“那么对于文身的女孩来说,只有 5/(5+9)≈35.7%的概率是坏女孩”
那么对于不纹身的女孩来说,只有 5 / (81 + 5)≈5.8%是坏女孩

楼主搞错了判断标的。普世价值需要的是“好女孩”,而不是“纹身”。
一个按钮 35%的概率中奖,另外一个按钮 5%的概率中奖,只能按一次,你按哪个?
wilderness

wilderness      15 小时 21 分钟前   ❤️ 12

说实话拿这种东西给人贴标签下定义是件细思极恐的事情,纹身、染发、死肥宅、二次元.....前阵子不是还网暴死了一个染发的姑娘吗?大清早就亡了,人们的思想反而上了一层层裹脚布,很难说下一个被攻击的不会是我们
Microi

Microi      15 小时 7 分钟前

坐得笔直、胳膊叠在桌子上的是好女孩,倚着靠背、腿不并拢的是坏女孩,手插口袋、翘二郎腿的十恶不赦。
ypw

ypw      15 小时 4 分钟前   ❤️ 1

> 那么对于文身的女孩来说,只有 5/(5+9)≈35.7%的概率是坏女孩,也就是说文身的女孩更可能是好女孩。

按照题目条件:
坏女孩文身 5 个,坏女孩不文身 5 个;
好女孩文身 9 个,好女孩不文身 81 个。

文身女孩有 9/(5+9)=64%的概率是好女孩
不文身的女孩有 81/(5+81)=94%的概率是好女孩

随机找一个女孩,好女孩的概率是 90%;
而找一个不文身的女孩,好女孩的概率是 94%。
cmdOptionKana

cmdOptionKana      14 小时 58 分钟前

@clecho

> 本来对纹身人士没有偏见,看见这么多纹身人士为了证明自己是好女孩,把那么多未纹身人士拉下水就很恶心

“拉下水”是什么意思呢?

我看上面的大家讨论,看了又看,没看到谁把未纹身人士拉下水。

我想了很久,猜测你的意思是:把纹身人士与未纹身人士并列讨论(或相提并论),就是把未纹身人士拉下水。是这样吗?
zooo

zooo      14 小时 52 分钟前

@wilderness #21 我倒觉得挺正常

我们每个人认识别人都是以各种标签的形式认识别人,我倒觉得只要自己仅仅在心里上觉得某类标签的人是坏人,从而不去接触,不去给别人传递这种思想就行。

或者说如果你认为这种纹身、染发、死肥宅、二次元不太好,自己不去接触就行,别管别人,就不会造成网暴了。

当然,以上的做法排除掉对待自己的子女。
adian

adian      14 小时 50 分钟前

我是男人,我觉得姑娘们不高兴了就该骂男人,你们可以打我了
saki22oimo

saki22oimo      14 小时 45 分钟前

完全可以用 AB 事件的说法来代替
whileFalse

whileFalse      14 小时 36 分钟前 via iPhone   ❤️ 1

@wilderness 给别人贴标签、用有色眼镜看人不是个人权利吗? 这和网暴特定人是两码事吧。
Kiriya

Kiriya      14 小时 22 分钟前

这就和 HR 筛选简历首先去除非 985 211 一样,就和普通大学也有人才一样,不是纹身的就是坏人,而是大部分人没有这个花费时间和精力的成本去筛选,纹身是他(她)的自由,而远离纹身的人也是其他人自由。
clecho

clecho      14 小时 19 分钟前

@cmdOptionKana 不是并列讨论,而是论点中直接给了个预设,不纹身也是坏女孩。世俗眼光中说纹身是坏女孩至少有纹身这个依据(虽然也不是啥好的行为)。但是部分人为了证明纹身跟好坏没关系,反过来去攻击那些未纹身人士,这就是事先给人立了个坏靶子。你想证明纹身和好坏没关系,ok ,你拿出对应的证据就可以了,而不是预设别人也有可能是坏的,以此来证明自己有可能是好的
retrocode

retrocode      14 小时 12 分钟前   ❤️ 2

我的评价是分的不够细, 得细化到具体纹身的部位, 纹身内容, 来历原因
你要纹个小猪佩奇, 这就是个小女生, 最多有点不成熟
你要纹个人名, 最多是个有故事的董小姐
你要纹个花纹, 倒不是不可以体验下
你要纹个黑桃 A, 有多远滚多远好吧
cmdOptionKana

cmdOptionKana      14 小时 4 分钟前

@clecho

> 部分人为了证明纹身跟好坏没关系,反过来去攻击那些未纹身人士,这就是事先给人立了个坏靶子。

我认为这里有一个重点,你说的这 “部分人”,有没有纹身。

如果这部分人没有纹身,那么,他们讨论纹身人士的好坏,未纹身人士的好坏,都是 “未纹身人士” 自己在讨论。

那么,显然,你说 “纹身人士为了证明自己是好女孩,把那么多未纹身人士拉下水” 不对,分明是未纹身人士自己把自己拉下水。

=========

你前面表达了 “把别人拉下水” 是恶心的,当时你说纹身人士恶心,现在,发现原来把别人拉下水的人是未纹身人士,那么,你现在会不会觉得未纹身人士是恶心的呢?
clecho

clecho      13 小时 54 分钟前

@cmdOptionKana 他发这个帖子本身是有偏向性的,跟是否有纹身没关系,所以不存在自己把自己拉下水(而是有偏向性的人把没有偏向性的人拉下水)。其次,纹不纹身跟我没什么关系,我只是指出大部分人看到这种话题会明显偏向未纹身人士的其中一小部分原因。不用在我这纠结,也不用浪费时间跟我辩论。感谢你浪费人生中宝贵的两分钟看完这段话,再讨论下去这帖又进水深火热了
wildman9527

wildman9527      13 小时 29 分钟前   ❤️ 1

恶臭贴。不迎合你们审美和价值观的就是坏女孩?你们以为你们是谁?我不违法犯罪,我就为自己而活,关你啥事?
charlie21

charlie21      13 小时 2 分钟前 via Android

一个人不会去接触社会人,一个人只能接触所有社会人的一个子集。他下判断的有效性只限于他所接触到的圈子,这有效性是仅对他有效的

一旦他扩大圈子,那么他变成了另一个人。他昨日的判断都不再对今日的他有效

“ 35.7% 的概率是坏女孩,64.3% 的概率是好女孩” 是对于一个三教九流都严格均匀接触的人的眼中的一个纹身女孩。

你自己有时间去均匀接触三教九流的人吗?
max1

max1      12 小时 47 分钟前   ❤️ 5

说一个简单的事情,基本国产探花看到的妹子都会纹身。( doge
HolaPz

HolaPz      12 小时 46 分钟前

@retrocode 纹黑桃 A 是什么意思呀
lance6716

lance6716      12 小时 27 分钟前 via Android

楼主这数值没啥意思,我来一个

一亿个人中有一个坏女孩,100%纹身。其他人是好女孩,百万分之一的概率纹身
所以纹身的人之中有 1 个坏女孩、约 100 个好女孩。所以可以基本认为纹身的人都是好女孩

可关键是,现在没纹身的 100%都是好女孩啊,为啥我要冒这个险
seres

seres      12 小时 10 分钟前

@HolaPz 媚黑
snw

snw      12 小时 3 分钟前 via Android

楼主对问题的定义错了。
对于大部分人来说,问题并不是“坏女孩和好女孩哪个概率大”,而是“纹身和不纹身的女孩中,哪个好女孩的概率大”。

以楼主的例子来说,纹身的女孩中 64%是好女孩,但不纹身的女孩中有 94%是好女孩。

一个人“喜欢”的人的数量是有限的,“交往”的数量就更有限了,所以这是个有总量约束的问题,选择一个可能意味着要舍弃另一个。在总量约束的前提下,自然会从好女孩概率更高的群体中去选择(除非喜欢或不介意坏女孩)。

同理可以解释为什么大部分人并不介意有纹身的人是普通同事 /同学,因为几乎没有总量约束。多数人也不介意和有纹身的人做普通朋友,因为普通朋友总量约束也比较宽松。
zhaogaz

zhaogaz      11 小时 43 分钟前

说不得,说不得。楼主碰了大忌了。
s642153378

s642153378      11 小时 9 分钟前 via Android

忽略了纹身的动机,应该区分纹身动机的“好”“坏”,而不是套用的性别上。男性纹身好坏概率应该跟女性统一对待
kalluwa

kalluwa      9 小时 52 分钟前   ❤️ 1

前提:
"假设社会上平均每 100 个女孩中有 10 个坏女孩,90 个好女孩"
这个没有数据支撑
Lao2tang

Lao2tang      9 小时 38 分钟前   ❤️ 1

我没有在粪坑里找金子的习惯
zhaoxin

zhaoxin      9 小时 20 分钟前   ❤️ 1

楼主不识数吗?按照你的计算,人数 100 ,好 90 ,坏 10 。坏的且纹身的占 50%,5 个;好的且纹身的占 10%,9 个。由此得出结论,纹身的里,坏的女孩站 5/( 5+9 )= 35.7%,并得出结论,纹身的里,好女孩儿更多。

可问题是,这能证明纹身的女孩儿好的更多吗?我们来看,正常人数中,好的占 90%,纹身中的,好的才 64.3%,那么是谁把 64.3%拉到 90%的,必然是不纹身中的好女孩。

不纹身的女孩 = 总人数-坏的且纹身-好的且纹身= 100 - 9 - 5 = 86 。
好的不纹身的女孩 = 不纹身的女孩 - 坏的且不纹身 = 86 - 5 = 81

所以不纹身中好女孩儿的比例为 81/ 86 = 94.1%。

结论:不纹身的女孩儿,好女孩儿更多。楼主只看到纹身的女孩儿有 64.3%是好女儿,超过 50%,就认为纹身中的好女儿数量更多。这个理解是错误的。纹身不纹身,都是好女孩数量多,但是不纹身的女孩里,好女孩数量更多。

当然,这个不是普遍意义上的。只是根据这道题的条件计算出来的。
WinG

WinG      8 小时 57 分钟前

第一: 数据明显不对,探花里 90%有纹身

这不是重点,重点是,贝叶斯角度你已经想过了,

但你没想过 "代价" 这个角度.

纹身或许交朋友没问题,一夜情没问题,因为代价足够低.

当择偶这种代价大的,当然希望发生的概率越低越好.

大多数人不介意一个有过案底的给你送外卖,

但大多数人不愿意跟留过案底的同一屋檐朝夕相处.
WinG

WinG      8 小时 53 分钟前

[概率只是从 10%增大到 35.7%, 哪怕所有坏女孩都会文身,概率也就将将过 50%,远没有达到文身和坏女孩划等号的地步。]


姚明身高比 150cm 只是多了 31%,所以 150cm 不属于矮子是吗?
ligo

ligo      7 小时 42 分钟前 via Android

按照楼主逻辑,纹身女孩找纹身男孩就好了,普通人单纯的不喜欢纹身而已
xiaocongcong

xiaocongcong      7 小时 11 分钟前 via iPhone

看文的什么吧,玫瑰蝴蝶之类十有八九,花臂艺术宗教一般都是特别有个性的,纹小猫小狗哈喽凯蒂也许是个有爱心的姑娘呢
learningman

learningman      6 小时 28 分钟前

@WinG 150 * 1.31 = 196.5 ,姚明身高 2.26m ,应该是 50.6%
alexleee

alexleee      6 小时 17 分钟前

看文的内容,腿上文黑桃的我不敢评价,因为我肯定打不过她老公
tpphha

tpphha      5 小时 56 分钟前 via iPhone

楼主得到的结论就是错的,例如 1000 个人,1%的概率是坏人,也要比,10 个人 50%概率是坏人的绝对值要大。前者 10 个坏人大于后者 5 个坏人,按照楼主的算法就是 5/(10+5)。
zxcslove

zxcslove      5 小时 45 分钟前

看年龄吧
不论性别,三十岁纹身和十三岁纹身的,是不是很不一样?
Detao

Detao      5 小时 13 分钟前

基于假设的数据得不到正确的分布, 就算 OP 想科普贝叶斯也请找一个真实的数据吧.
WuSiYu

WuSiYu      3 小时 33 分钟前

「 P(文身|坏女孩)>P(文身|好女孩) 不代表 P(坏女孩|文身)>P(好女孩|文身) 」
这虽然是正确的,但“ P(坏女孩|文身)相比 P(好女孩|文身) ”这件事没有任何意义,值得关心的是:

由于 P(文身|坏女孩)>P(文身|好女孩),可以推导出 P(好女孩|不文身) > P(好女孩|文身),也就是说,如果不接触纹身的女孩,遇到好女孩子的概率更高

证明如下( chatgpt )

首先,我们可以根据全概率公式知道:

P(纹身) = P(纹身|好女孩)P(好女孩) + P(纹身|坏女孩)P(坏女孩)

P(不纹身) = P(不纹身|好女孩)P(好女孩) + P(不纹身|坏女孩)P(坏女孩)

接着,根据贝叶斯定理:

P(好女孩|纹身) = [P(纹身|好女孩)P(好女孩)] / P(纹身)

P(好女孩|不纹身) = [P(不纹身|好女孩)P(好女孩)] / P(不纹身)

我们要证明 P(好女孩|不纹身) > P(好女孩|纹身)

即:[P(不纹身|好女孩)P(好女孩)] / P(不纹身) > [P(纹身|好女孩)P(好女孩)] / P(纹身)

两边同时乘以 P(不纹身) * P(纹身):

P(不纹身|好女孩)P(好女孩) * P(纹身) > P(纹身|好女孩)P(好女孩) * P(不纹身)

将全概率公式代入上式得到:

[P(不纹身|好女孩)P(好女孩)P(纹身|坏女孩)P(坏女孩)] > [P(纹身|好女孩)P(好女孩)P(不纹身|坏女孩)P(坏女孩)]

化简后即得:

P(不纹身|好女孩)P(纹身|坏女孩) > P(纹身|好女孩)P(不纹身|坏女孩)

因为 P(纹身|坏女孩)>P(纹身|好女孩) ,所以 P(不纹身|好女孩) > P(不纹身|坏女孩) 成立
swulling

swulling      3 小时 30 分钟前 via iPhone

没有任何统计数据,随便拍一个前提,然后开始争论结果。

这种不实事求是的作风是怎么学来的。
Nasei

Nasei      2 小时 31 分钟前

女性可以光明正大的对男性的各种属性提要求,比如身高多高,打不打游戏之类的,男的对女的属性筛选一个值还费半天劲论证合理性.....
cmdOptionKana

cmdOptionKana      1 小时 54 分钟前

@Nasei 两个帖子共一百多条评论,没有一条说男人择偶时不能只喜欢无纹身的女性。在择偶时女性可以提出各种要求,男性也可以提出各种要求,没人反对这点。
samuel

samuel      46 分钟前

楼主的分析有一个明显的漏洞:既然是讨论纹身和女孩好坏在概率上的分布,我们不能光看 P(坏女孩|纹身),还要看 P(坏女孩|不纹身)。先不说楼主假设的数据是否合理,以那个数据为例,P(坏女孩|不纹身)仅有 5.8%,对比各种不同择偶标准,遇到坏女孩的概率,见如下表格:

|择偶标准 |坏女孩概率|
|只找有纹身的| 35.7% |
|只找没纹身的| 5.8% |
|都可 | 10% |

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK