一种基于信号检测的“海王”甄别与剔除机制

2022-05-29 星期日


在时下的恋爱中,最难过的恐怕就是在动真心的时候,发现自己其实只是“海王”池塘里的一条鱼…


小知识


“海王”是一个网络用语,指经常以“广撒网”为中心指导思想,与众多异性发展暖昧关系的渣男/女。“海王”并不限制性别,有男性“海王”,也有女性“海王”。


不主动不拒绝不负责,“海王”态度实在让人气愤。那么今天,笔者就根据信号检测理论提出一种鉴别“海王”的科学方法。


本文仅供大家参考,如有雷同,纯属巧合


你是不是真的爱我?——假设检验


表面上看,判断一个人是否是“海王”其实包含了多个小问题:TA为什么说那么暧昧的话?TA和我的肢体接触真的是无意的么?我到底做了什么让TA这两天变冷淡了?我究竟敢不敢继续付出……


(两个人之间总是充斥各种问题,而且李白加强以后确实厉害)


若对“海王”问题进行深入分析,则可将其归纳为一个根本问题——TA是否真的爱我?如果TA真的爱我,那么一切付出都不是问题。如果TA不爱我,那么自己即将或已经成为了TA池塘里的一条鱼。


进一步对“TA是否真的爱我?”这个问题进行数学建模,可得到一个假设检验(Hypothesis Test)问题,也就是从多个假设中进行决策的问题。在本文,就是从“TA不爱你”和“TA爱你”这两个假设中进行决策。


(一切都可归结于一个根本问题)


不同假设之间必须相互独立,不能有重合的部分。所以在此问题中,要么TA爱你,要么TA不爱你。不存在“我既爱你也不爱你”、“我以为咱们之间的关系早已超越了爱与不爱”或者“这就要看你表现得乖不乖”等混合状态。


(“海王”经典套路1:不接受,不拒绝)


另外,根据假设的数量,假设检验还可分为二元假设检验多元假设检验。由于本文只有“爱/不爱”两个假设,因此属于二元假设检验。如果问题变为“TA池塘里有几条鱼”,假设为“0条/1条/多条”,那就是多元假设检验


为什么我总遇到“海王”?——4种概率


我们不会无缘无故地判断一个人爱自己,或者不爱自己,而是根据TA的一些行为来判断,例如说各种情话。


这并不是说,TA说了情话就一定爱我,不说就一定不爱我。而是TA说的情话越多,爱我的概率就越大,情话越少,爱我的概率就越小。


根据中心极限定理(Central Limit Theorem),情话数和爱你的概率通常呈现高斯分布(Gaussian Distribution),也叫正态分布。


这就是说,情话的量也要合适,过多过少都不好。例如,一个刚认识十分钟的人,说爱你爱得死心塌地,那TA一定有问题。


(情话数-爱你概率)


不同假设对应不同曲线。不难理解,如果TA不爱你,说的情话自然少(偏左);如果TA爱你,自然情话多(偏右)。


(爱一个人,自然会说更多的情话)


由于假设和决策各有两种结果,则可以分出2×2=4种情况,分别对应4种概率:


(1)检测概率

假设为真,决策为真的概率。本文中,就是实际上TA爱你,你也判定TA爱你的概率,也就是遇到真爱的概率。

(2)虚警概率

假设为假,决策为真的概率。本文中,就是实际上TA不爱你,但你却判定TA爱你的概率,也就是你被骗,成了“海王”池塘里一条鱼的概率。

(3)漏检概率

假设为真,决策为假的概率。本文中,就是实际上TA爱你,但你却判定TA不爱你的概率,也就是你错过真爱的概率。

(4)第4种概率

假设为假,决策也为假的概率。本文中,就是实际上TA不爱你,你也判定TA不爱你的概率,也就是你没有被骗,看出TA是“海王”的概率。


由于检测概率与漏检概率之和为1、虚警概率与第4种概率之和为1,故考虑一半即可。通常只考察检测概率虚警概率


所谓“总遇到’海王’”,从数学的角度来讲,就是虚警概率太高,即TA实际并不爱你,却用种种方法,总是让你误判为TA爱你。


可以证明,虚警概率是下图中蓝色曲线右侧的面积,检测概率是下图中红色曲线右侧的面积。


(能否遇到真爱与门限有关)


检测概率和虚警概率与门限有关,而这个门限就是你的“眼光”、“眼界”、“要求”等。眼光低的人怕错过,眼光高的人不将就。


不被“海王”骗就要错过真爱?——ROC曲线


(门限左右移动->两种概率同时增大/减小)


上节说到,你对另一半的要求越低,越可能遇到真爱,但同时越可能遇到“海王”;而你对另一半的要求越高,越可能规避“海王”,同时也越可能错过真爱。


所以,你永远不可能既降低被“海王”骗的可能性,又提高遇到真爱的可能性。降低被“海王”骗的概率,遇到真爱的概率也一定降低。通俗来讲,就是“好的异性缘往往伴随着烂桃花”。


难道我们对此就只能认命?只能祈祷早点遇真爱?不对,虽然每个人都逃不过两种概率同增同减的规律,但是有些人明显既能鉴渣,又遇真爱,差别到底在哪里?


原来,差别在于两种概率曲线的远近不同。有些人的两种概率相距更远,那么在检测概率相同的条件下,这些人的虚警概率就更小。或者说在虚警概率相同的条件下,这些人的检测概率更大。


(当然是第二组概率曲线更好,被骗的概率更小)


检测概率和虚警概率的关系被称为接受者操作特征(Receiver Operating Characteristic, ROC)曲线。我们希望ROC曲线尽可能上凸,即相同的虚警概率下,检测概率尽可能高。


(“鉴渣能力”的数学表达)


不难推断,我们希望两种概率相距越远越好,也就是虚警概率分布左移,红色的检测概率右移。


如何提高“鉴渣”能力?——Bayes公式


那么,究竟该如何优化我们的ROC曲线,从而提高“海王”鉴别力呢?


这里就要用到数学上的Bayes公式(Bayes Formula)。一言蔽之,Bayes公式就是“靠努力改变命运”的公式。 

 在当下,你内心认为TA爱你的概率是确定的,但这个概率只考虑了TA说的情话。如果将TA陪你的时间也考虑在内,那么就可以改变TA爱你的概率。很明显,如果TA既对你说很大情话,又愿意花时间陪你,那么TA爱你的概率会更大。


原本只与TA说的情话有关的、爱你的概率被称为先验概率(Prior Probability),也就是我们事先知道,却无法改变的概率(原本的命运)。


TA陪你的时间与爱你的相关性被称为似然函数(Likelihood),也就是某两个事件或一种动作与另一个结论之间的相似程度(努力)。


将TA陪你的时间考虑进来后,TA爱你的概率被称为后验概率(Posterior Probability),也就是我们用某一动作或事件对先验概率进行修正的结果(改变后的命运)。


(曲线左移,虚警概率减小)


(曲线右移,检测概率增大)


根据贝叶斯公式,我们就可以将TA陪你的时间考虑进来,从而改变两种概率:让蓝色概率曲线左移,让红色概率曲线右移,进而让ROC曲线变得上凸,也就是提高了鉴渣能力。


“海王”骗术的本质是什么?——联合似然


既然多考虑一项“TA陪你的时间”,就能够提高“鉴渣”能力,那将更多因素考虑进来,同时修正概率曲线,是否能够进一步提高“鉴渣”能力呢?答案是肯定的!


如果我们不仅考虑TA说的情话、TA陪你的时间,还考虑TA为你花的钱……,那么就能让你的ROC曲线更加上凸,从而“鉴渣”能力更强。


(小孩子才做单选题,成年人只做全选题)


单个事件与TA爱你的相关性叫似然函数,多个事件与TA爱你的相关性就叫联合似然(Joint Likelihood)。联合似然常常能够比单一的似然函数得到更好的鉴渣能力。


现在再来分析“海王”最常用的骗术,可将其归纳为:TA让你只重视某一个事件的似然函数,而这个事件对TA而言成本是很低的。


例如,TA很擅长说甜言蜜语,但TA不愿花时间陪你,不愿给你花钱。再比如,TA很富裕,但对你的付出只有金钱……


而一旦你起了疑心,感觉你们之间的关系不太正常,TA总是用对TA而言成本很低的事件来迷惑你,说更多情话,花更多的钱……让你只看得见那一个事件。


(“海王”经典套路2:永远只强调TA擅长的事)


总结


在鉴别“海王”这个问题上,每个人都会面临检测概率和虚警概率同增同减的问题,但考虑更多因素的似然函数,能够优化我们的ROC曲线,提高我们的“鉴渣”能力。


(你的小池塘容不下本小姐/本小爷这条大鱼)


最后必须指出的是,情话、时间、金钱等似然函数只是在修正。感情中最重要的还是先验概率,也就是两个人之间的真心相对。


本文图片均为作者提供


参考文献:

[1] 赵树杰, 赵建勋. 信号检测与估计理论[M]. 北京: 清华大学出版社.

[2] 梁红, 张效民. 信号检测与估值[M]. 西安: 西北工业大学出版社.

作者单位:西北工业大学 航海学院




版权说明:未经授权严禁任何形式的媒体转载和摘编,并且严禁转载至微信以外的平台!



文章首发于科学大院,仅代表作者观点,不代表科学大院立场。转载请联系[email protected]

推荐阅读

《海王》里,从头打到尾的反派居然是它 >>

数学究竟能有多牛?>>

《追狗,从入门到精通》 >>

“社交牛X症”发病原因的数学分析 >>


科学大院推荐搜索


科学大院是中科院官方科普微平台,由中科院科学传播局主办、中国科普博览团队运营,致力于最新科研成果的深度解读、社会热点事件的科学发声。


转载授权、合作、投稿事宜请联系[email protected]


大院er拍了拍你:不要忘记 

点亮这里的 赞 和 在看 噢~ 


原文地址:点击