万物皆可“贝叶斯”:不确定性时代的知识哲学

频道:生活应用 日期: 浏览:48

出版社: 图灵|人民邮电出版社

译者: 方弦

出版时间: 2021-3

十八世纪英国一位哲学家提出过他的怀疑主义看法,认为人类无法确定因果之间的必然联系,只能观察到某些现象总是伴随出现。这种观念,在1748年他撰写的一篇题为《论神迹》的文章里有所反映,他提出目击者的证词永远不能证实神迹(即基督复活),这一观点可能引起了当时身为加尔文宗教会牧师的托马斯?贝叶斯(ThomasBayes)的注意,他开始思考一个问题:我们真的没有办法根据看到的结局,去推断导致这个结局的真正起因吗?形成某种看法后,要看到多少依据才能断定其准确无误?

贝叶斯在文章里设想自己面朝一个平面,上面有一个白色球体,然后让助手随意在平面上放置黑色球体,每放置一个就询问白色球体与黑色球体的相对位置。白色球体所在的位置,就是导致黑色球体处于某个特定相对位置的原因,这个在已知黑色球体相对白色球体位置的情况下,推断白色球体可能所在位置的过程开yun体育app官网网页登录入口,就是回应休谟质疑的一个典型逆向概率计算实例。贝叶斯认为,只要黑球的数量足够大,对于白球绝对位置的归纳性推断就能无限接近精确,所以,由结果推究原因的归纳性思考方式,不仅实用,而且并非像休谟所言,是不合逻辑的。

贝叶斯原本从事神学研究,他对于自己提出的概率理论并不自信,因此没有大胆地公开这一理论,尽管这一理论在逻辑上与他的宗教信仰并不冲突,也就是说,神迹可以通过充分的证据进行逆向论证,在他去世后,数学界对这一理论进行了长期的讨论,但随后进入了沉寂状态,直到两个世纪之后,计算机技术刚刚兴起,这一理论才重新焕发生机,在人类越来越擅长处理海量信息的社会背景下,以他名字命名的定理被广泛应用于医学检测、人工智能、脑科学研究等前沿领域。这个最初草率的构想,经过许多智者不断改进和传播,现在被当作一种学说,一种认知学说,甚至能够描述人类思维运作的笼统框架。

《贝叶斯的博弈:数学、思维与人工智能》是一部阐述贝叶斯定理“普适性”的书籍。该书法语标题为《知识的公式:以贝叶斯定理为基础的统一知识哲学》

这个公式揭示了一种知识统一的理论,该理论以贝叶斯定理为基础,其提出者是年轻的亚裔法国数学家黄黎原,他毕业于巴黎综合理工学院,目前是瑞士洛桑联邦理工学院的研究人员。

黄黎原持续研究人工智能的伦理议题,并且是颇具人气的科普视频创作者,他运营的法语频道“Science4All”涵盖了数学、计算机科学、物理学等诸多学科。他在著作中热情讴歌了贝叶斯公式的实际用途和哲学价值,称其为“智慧方程式”。这本书阐明,源自贝叶斯公式的贝叶斯方法与贝叶斯知识哲学,堪称通晓各领域的思想钥匙,我们甚至有理由相信,世间万物无不适用“贝叶斯”。

贝叶斯定理用于说明在特定已知情况中某个事件出现的可能性,其公式形式为P(A|B)=P(A)P(B|A)/P(B)。这个定理可以看作是一种计算方法,通过运用当前可信的依据(例如各种观测结果、统计数据、资讯资料),来评估原有看法(诸如某些假设、观点或论断)的合理性,通俗地说就是,初始判断加上新获得的信息,就能得出修正后的最终看法。其中P代表概率,A表示原本的信念,B代表新证据或新条件。P(A)代表事件A成立的几率,这个数值又叫做初始概率,是贝叶斯学派人员看重的“个人判断”,同时被贝叶斯理论的批评者当作质疑其科学依据的“缺陷”;P(B)指的是事件B发生的可能性,这个指标也称作边界概率或总概率,是公式里最不容易求得的数值;P(B|A)说明在事件A已经发生的前提下B的成立概率,这个值又被称为关联度或需要丰富联想才能理解的概念。这个公式源自法国数学家皮埃尔-西蒙·拉普拉斯,他重新发现了贝叶斯的概率理念,因此被视为贝叶斯学派的奠基人,这个公式应该冠以“贝叶斯-拉普拉斯”之名,就像微积分公式被称为“牛顿-莱布尼茨公式”一样。

贝叶斯定理在医学中如何运用?以医疗检测为例。此类检测往往通过呈现阳性或呈现阴性来初步判断个体是否感染疾病。然而,现实中的检测很少能完全精准,时常会发生错误判断的情况,即出现虚报和漏报的现象。设想一位年届七十五岁之公民,接受某种癌症的筛查,该癌症在同龄人群中的患病概率为百分之一,此时他的化验报告显示异常,他或许会深感焦虑,认为自己的余生已所剩无几。然而此类检测手段并非百分之百精确,假设其诊断准确率高达百分之九十九,具体表现为一百名实际罹患癌症者中,有九十九人会被检测出阳性,同时在一百名健康个体里,也有九十九人会被判定为阴性。若检测结果显示为阳性,那么罹患癌症的真实几率究竟有多少?根据贝叶斯定理,单次检测获得阳性结果的情况下,其患有癌症的可能性仅为半数。

贝叶斯公式怎样得出50%这个比较高的可能性呢?先验概率P(A)是75岁人群得癌症的比率,为1%。条件概率P(B|A)是已患癌症者检测出阳性的几率,为99%。因此 P(A)与 P(B|A)相乘,等于0.01乘以0.99,结果是0.0099。分母P(B)代表所有检测呈阳性情况的总概率,涵盖真阳性与假阳性,计算较为繁琐,得出的数值是0.0198。接下来,根据公式P(A|B)=P(A)P(B|A)/P(B)进行计算,最终求得检测呈阳性且确实患癌的概率P(A|B),这个概率为0.5,也就是50%。要是再次接受检测结果显示依然呈阳性,就再次运用贝叶斯公式来计算,那么患有癌症的可能性就会从五十个百分点上升至九十九个百分点。我们可以发现,初次检测的结果会对再次检测的结果产生影响,这就表明反复使用贝叶斯定理能够逐步获得更加准确的信息,这也启示我们,任何医学诊断都必须经过多次检测,以避免错误诊断。

但是,这样一个蕴含巨大可能性的方法,也承受过学术专家的忽视和排斥的起伏历程。在统计学领域,主张频率观念的人将贝叶斯理论视为有力的竞争者。形成于1920年代的一种主张频率的统计学理论,实际上就是我们在数学教材上接触到的最基础的统计方法论。这种理论认为概率是频率的体现,主张当观察值数目足够多时,偏差会慢慢减弱。频率学派的关键在于借助概率值来衡量某个假设的可靠性进行数据分析,只有经过大量新信息的反复验证,该假设才具备科学依据。

频率主义在遗传学领域成效显著,更加坚信客观性是至高无上的准则,对引入先验概率的贝叶斯主义极为排斥,认为这等于在未检测前就给某个学说附加了主观的信任值,他们将这种主观性(在著作中被作者称作是“成见”)看作是极大的祸害,觉得带有主观成分的统计手段完全不属于科学范畴。

埃贡·皮尔逊、罗纳德·费希尔等信奉频率论统计学的人,在20世纪中叶占据了主导地位,当时统计学界将诸如主观性、先验性以及贝叶斯等概念彻底排挤在外。有医学研究者借助贝叶斯理论揭示了吸烟与罹患肺癌的关联性,不过,得到烟草公司资助的频率派权威费希尔kaiyun全站网页版登录,却批评该研究者在实验设计上违背了频率主义所强调的对照机制和重复验证原则,更指责其错误地调换了因果关系,声称可能是肺癌先出现,进而使人更可能去吸烟。

但频率学派存在难以克服的缺陷。其一,检验统计量之值易于通过重复操作加以影响,加之诸如地震这类低概率现象,我们往往难以获取充分的观测资料和实验条件。相较而言,贝叶斯方法的优势在于,即便信息有限,也能更接近真实估计值。因此,在信息获取变得极为困难且处理起来非常繁琐的时期,贝叶斯方法依然能够作为人们探索罕见现象不确定性的一种有效手段加以运用。运用贝叶斯方法可以推断出《联邦党人文集》的隐秘撰稿人,也能锁定深海里天蝎潜艇的具体方位,这些事例都广为流传,此外,该算法还用于推算核反应堆发生灾难性故障的可能性,也用于预估航天器发射时遭遇严重问题的几率。

贝叶斯主义探讨概率的本质,它质疑概率的含义是什么,频率主义主张通过事件反复出现的次数来衡量概率,然而当重复次数不够kaiyun.ccm,也就是信息不充分的情况下,我们很难依据既有模式准确预判后续情况,举例来说,如果将先前事件的发生视为一串数字“1,2,4,8,16”,那么按照常规逻辑推断,下次出现的情况很可能是32。然而当数值体现为圆周上由两三点构成的多条线段所划分的区数,当节点数量达到六时,紧随其后的那个区数,即所求情形,应为三十一个,而非三十二个。

贝叶斯定理 应用 机器学习_生活应用方面的知识

贝叶斯公式

我们难以断定自己熟知的法则会在哪个环节遭遇挫败,多数时候人们都回避这个议题。人类天生追求确定和掌控,这种倾向深植于本能。远古时期的巫术活动,正是对确定性的极致渴求。譬如阿赞德人在传统观念里,会将小概率的灾祸归咎于仇人施行的巫术,这种解释指向一个明确的、可追溯的外部原因。而科学,特别是概率思维,与巫术相比最显著的差异,就是承认不确定性客观存在,并逐步学会一套应对不确定性的灵活策略。一个可靠的预测,需要估算前面一系列数据中后续各项所有可能数值的发生几率,并且这种几率应当反映对各种可能性的信任程度。这就是贝叶斯定理想要实现的目标。

书本指出,我们认识外界、增长见闻的思考方式,大体上能够用贝叶斯法则来囊括。举例来说,如果见到的乌鸦全都是黑色的,就会猜想天下所有乌鸦都是黑色的,形成猜想并依据观察情形调整这些猜想,这种调整或是提升这个推论的准确度,或是降低它。贝叶斯学派的代表人物拉普拉斯表示,概率学说的核心就是将日常道理转化为可以进行运算的形式。它能够精确地衡量那些通常的头脑借助某种直觉感知到的事物,而这类直觉感知往往难以被察觉。

归根结底,贝叶斯公式体现了一种认识论思想,作者甚至断言:“理性”根本上是贝叶斯公式运作的结果,因此,倡导这种思想的人可以被称为贝叶斯主义者。贝叶斯思想认为世间万物,包括各种理论学说,本质上都是主观看法,并非客观真实,并且所有这些理论都有缺陷;面对真实情况,收集到的信息会促使我们修正对各个理论的看法程度,也就是它们的可信度;核心要求是,这种修正过程必须严格依照贝叶斯方法进行;相比波普尔的可证伪性原则,贝叶斯方法为科学活动提供了更精确的规范。

贝叶斯方法当前意义非凡,因为机器运算能力增强,资料采集及加工手段已远非人类思维所能及,商业活动与政策制定无不更加倚重海量数据解析的结论,技术进步促使我们再度思考贝叶斯定理,以及它在学问体系中的地位。

贝叶斯方法在处理大量数据时表现出色,能够化繁为简,聚焦重点。这种技术在多个领域都有广泛应用,例如天文学、航空探索,以及生物学中的基因分析、蛋白质探索。在医疗方面,它可用于癌症的病因分析、病毒的检测,在计算机科学领域则有助于图像的辨识、信息的保护。商业活动中,如保险业务、广告投放、物流管理,也能见到它的身影。此外,在社会政治层面,它对选举策略、资源调配也发挥着重要作用。可以说,贝叶斯方法的应用范围非常广泛。

脱离了纯粹的数学体系,以及尖端科技的应用范畴,贝叶斯思想非常适宜当作个人在当今飞速变化时代的思考向导。贝叶斯思想揭示了人们对未知状况的担忧,也为处理不确定性给出了一种思路,就是承认不确定性的存在,在避免自大情绪的情况下,敢于提出初步看法,并且利用新的信息来持续修正自己的判断,从而让自己不断接近真相。费曼这位诺贝尔物理学奖得主曾这样讲过,他能够带着疑惑、迷茫以及未知的状态生活下去,他对于一些问题拥有大致的答案,对于不同疑问也持有程度不一的合理想法,但他从不绝对相信任何事。

贝叶斯方法并非毫无不足之处。尽管它承认主观判断的合理性,然而,一旦主观判断基于错误观念或虚假信息,那么后续推理过程就可能采纳不可靠的论据来维护甚至加剧这种偏颇的认知。不过贝叶斯理论最突出的优势在于其哲学层面的开放态度,主张由多个相互排斥的假设构成的体系,其整体智慧要超过任何单一假设所能达到的认知深度。

书中指出,依照贝叶斯定理,没有任何理论是完备的,而应当看作是一项持续改进的课题,它永远需要在反复斟酌和检验中前行。贝叶斯状态体现了一种介于深信与迟疑之间的境界,在这种境界里,人们不容易轻信无稽之谈,能够坦然面对厄运,也敢于为不公现象进行抗争。贝叶斯定理或许存在不足,但贝叶斯思想,可能是当前充满变数的时代的最佳认知理念。

网友留言(0)

评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。