批判性思维和论证逻辑归纳论证

admin/2022-01-07/ 分类:气体收集/阅读:
《批判性思维和论证逻辑归纳论证》由会员分享,可在线阅读,更多相关《批判性思维和论证逻辑归纳论证(54页珍藏版)》请在人人文库网上搜索。1、第七章归纳论证古文献内经针刺 ...

《批判性思维和论证逻辑归纳论证》由会员分享,可在线阅读,更多相关《批判性思维和论证逻辑归纳论证(54页珍藏版)》请在人人文库网上搜索。

1、第七章 归纳论证古文献内经针刺篇记载了这样一个故事:一个患头痛病的樵夫,上山砍柴时不慎碰破足趾,出了点血,但头部不疼了。他并未在意。后来,头疼复发,又偶然碰破原处,头疼又好了。这引起他的注意。后来再头疼时,他就有意刺破该处,结果都有相同的效应。在针灸学中,这个樵夫所碰的地方,称作“大敦穴”。樵夫根据自己经历的多次个别经验,得出了“碰破足趾能治好头痛”的一般结论。他所运用的推理就是归纳推理的“简单枚举”推理。 第一节 归纳论证概述 除了数学等少数几个领域之外,几乎所有其他人类活动的领域,如自然科学、社会科学、历史、文学批评、伦理判断以及关于日常事务的实际知识,都要仰仗归纳论证。一、归纳推理的特征

2、归纳论证是运用归纳推理的论证。归纳推理是那种其前提仅仅给予结论某种概率等级的而非必然支持的推理。例如,某幸运抽奖在10000 张彩票中设一张中大奖彩票甲买了x 张这种彩票所以,甲可能会中大奖 也许甲中大奖的可能性微乎其微,也许报有较大的期待是合理的,也许甲敢夸下海口,他中大奖十拿九稳。正常情况下,“可能”究竟多可能,这取决于x的数量。随着x在量上的增加,甲获奖的机会也会增加。如果他买了9999张这样的彩票,他夸海口也不为过。演绎推理具有保真性,即在使用它时,我们相信,前提真时结论不可能假。如果我们接受前提而否认结论,那么,一个有效的演绎推理将使我们陷入矛盾。但使用归纳推理时,我们只是期待,当所

3、有前提真时,结论较大可能真。但是,即使我们接受前提而否认结论,也不会陷入矛盾。这就是说,一个好的归纳推理并不排除其结论为假的可能性。即使甲买了9999张彩票,也不能保证他一定中奖,空手而返仍是可能的。演绎推理结论所涉及的内容实际上并没有超出其前提的内容,其结论只是前提中所包含的信息的彰显化。但归纳推理的结论却显然超出其前提的内容,因而具有某种扩展性。它能扩展我们的实际知识,结论包括新信息。谁能从前提中读出“甲会中大奖”的信息?所有有效演绎推理的前提对结论的支持力量或强度完全相同,即结论和前提一样真,所有有效的演绎推理的有效性不存在程度的区别。一个演绎推理只能是,要么有效,要么无效。但归纳推理的

4、前提对结论的支持强度可以有所不同,论证的强弱,可以有程度上的区别。当x的值由1一直增加至 9999 时,“甲会中大奖”得到的支持越来越大,即论证的强度不断增高。对于一个有效的演绎推理,添加新的前提之后,对其有效性毫无影响。即使加上一个与原前提矛盾的前提,也不会因此使其变成无效的。但归纳推理的强度则有可能因新增的信息或前提而变化。当x为9999 时,彩票论证十分强,但若我们得到新信息:此抽奖有人作弊,论证的强度自然下跌。二、归纳推理的类型和评估古典意义上的归纳推理包括完全归纳推理、简单枚举推理和求因果方法(弥尔式的),有时人们还把类比推理也归于其中。现代意义上的归纳逻辑包括概率推理、统计推理、条

5、件因果推理以及归纳决策。从现代观点来看,完全归纳推理和其他归纳推理有完全不同的性质,因而可排除出去;弥尔式的求因果方法难以确定不同性质条件下的因果关系,可用新的条件因果推理取代。本书讨论的归纳推理的类型共有4种:简单枚举推理、统计推理、归纳决策和条件因果推理。从演绎论证的评估标准来看,所有归纳论证都是无效的。因为,满足有效性标准必须使得一个论证的形式没有反例,或者肯定论证的前提而同时否定其结论会导致矛盾。然而,我们使用归纳论证的意图并不在于使自己的主张或决策得到完全正确的担保。我们只是想得到某种程度的担保,如果这种担保程度较高则正中下怀。归纳论证的评估面对的是不同的结论指示词。就如图尔敏所要求

6、的,结论应该有某种模态限定。有了这种限定,就等于做出某种退却,即达不到无可置疑的境界,转而追求不太可疑的局面。这就如同选择终身伴侣一样,既然我们不可能挑选出才貌双全的天仙般的公主,那么,五官端正也是可以接受的选择。无效但有支持力的论证,只要满足特定语境对充分支持所要求的标准,仍是令人满意的论证。我们将用“强的”或“合理的”来刻画一个归纳论证的逻辑特征。一个归纳论证是强的,仅当其前提为真时,结论为真是很可能的。这也等于说,一个强的归纳论证,其前提真而结论假是不大可能的。这种“可能”也许能用数值来表示,也许不能。需要注意的是,归纳论证的强与弱,不只是由论证的形式来决定。事实上,归纳论证的形式由两部

7、分组成。一部分是显示论证结构的,这是某一类归纳论证的所有实例都具备的,如所有简单枚举归纳的结构都是:“S1是P,S2是PSn是P,没有反例(即不是P的S),S1Sn只是S类的部分对象,所以,可能所有S是P”。但是,具有这种结构的枚举推理并非都是同等强的。有另外一些因素制约这种结构所产生的支持力。例如,同样具有枚举归纳这种结构的两个论证,它们的强度可能有很大差异,甚至一个是合理论证,另一个却是谬误。这就要看是否满足诸如此类的条件:考察了各种条件下的、大量的S,在最有可能存在反例的地方努力寻找反例而未果等等。这些条件也可以反映为一系列批判性问题,对这些批判性问题予以满意回答的论证是合理的,否则是谬

8、误的。 第二节 枚举推理 枚举推理是根据在各种条件下对大量S的观察发现S无例外地具有性质P,得出所有S很可能有P性质的结论。例如,游览桂林的人,到七星岩、芦笛岩看到了仙境般的洞府,到伏波山又看到了布满石刻的还珠洞,到叠彩山又看到了清风徐来的风洞。于是,游客很自然地产生了一种想法:桂林的山是不是个个都有洞?有的游客则干脆说:桂林的山都是有洞的。郭沫若游桂林时就写了“请看无山不有洞,可知山水贵虚心”的诗句。游客从有限的单称观察陈述,推导出或猜想一个普遍规律。推理的形式是:S1是(或不是)PS2是(或不是)PS3是(或不是)P Sn是(或不是)PS1 Sn为S类部分对象所以,可能所有S是(或不是)P

9、如果某些条件被满足,利用这种推理从有限的单称观察陈述中概括出普遍性定律是合理的。例如,可以合理地从涉及石蕊试纸浸在酸中变红的一系列有限观察陈述中概括出普遍性定律“酸使石蕊变红”,或者从一系列受热金属的观察中概括出定律“金属受热膨胀”。但合理的概括必须满足若干条件: (1)形成概括基础的观察陈述的数目必须要大。 (2)观察必须在各种各样的条件下予以重复。 (3)没有任何公认的观察陈述和推导出的普遍性结论发生冲突。只在观察一根或少数几根金属棒膨胀的基础上就做出所有金属受热膨胀的结论,显然是不合理的,正如在观察一两个酒醉的陕北人的基础上就做出所有的陕北人都是酒徒的结论是不合理的一样。要证明这两个概括

10、是正确的,必须有大量独立的观察。就我们所提到的那些例子而言,增加观察数目的一个方法可以是,反复地加热一根金属棒或连续地观察某一个陕北人夜夜醉归。显然,用这种方法得到的一系列观察陈述,不能为相应的概括形成一个令人满意的基础。这就是为什么条件(2)是必要的。“所有的金属受热时膨胀”,只有在它所根据的膨胀现象的观察涉及各种各样的条件时才是合理的概括。应该加热各种各样的金属,长铁棒、短铁棒、银棒、铜棒等等。应该在高压和低压、高温和低温下加热,如此等等。如果在所有这些情况下,所有受热的金属样品都膨胀,那时,也只有在那时,从所得的一系列观察陈述中概括出普遍性结论才是合理的。而且,很显然,如果观察到一个特定

11、的金属样品受热后不膨胀,那么,这个普遍性概括就失败了。所以,条件(3)更是必不可少的。对于枚举归纳来说,条件(3)即没有发现反例(不具有性质P的S)是攸关的。正是这一点既构成枚举归纳的合理基础,也成为它始终面临威胁的源泉。因为,没有发现反例,不等于反例不存在;现在不存在反例,并不等于将来不产生反例。因此,我们的正确策略是,应该在最可能有反例存在的地方去努力寻找反例,如果经过这种锲而不舍的努力,仍然没有发现反例,那么,我们所得出的普遍概括就得到更大的支持。违反这三个条件的枚举归纳,将犯“仓促概括”、“偏倚概括”和“躲避反例”的谬误。但是,即使在满足这三个条件时,错误结论的危险依然存在。这可从一个

12、有趣又颇令人怜悯的例子看出。伯特兰罗素在论说“归纳主义者”时描述了一只火鸡的故事。这只火鸡发现,在火鸡饲养场的第一天上午九点钟给它喂食。然而,作为一个卓越的归纳主义者,它并不马上做出结论。它一直等到已收集了有关上午九点给它喂食这事实的大量观察。而且,它是在各种情况下进行这些观察的:在星期三和星期四,在热天和冷天,在雨天和晴天。它每天都在它的表中加进另一个观察陈述。最后,它的归纳主义的良心感到满意,它进行归纳推理,得出结论:“总是在上午九点给我喂食。”哎呀,在圣诞节前夕,当没有给它喂食,而是把它宰杀时就毫不含糊地证明这个结论是错误的。 第三节 统计推理反例的出现使枚举归纳寿终正寝。但这并不能阻止

13、我们推理的步伐。因为还有其他类型的归纳推理可以在有反例的情况下得出对我们有用的结论。这时,统计推理成为我们的有力工具。试看以“男性,健康的弱者”为题的一个报道,如何通过统计数据来证明它的观点:男女寿命差距从20世纪20年代的1岁,扩大到今天的5岁;美国15种最主要致命疾病中都是男性死亡人数比女性多;死于交通事故或谋杀的概率是女性的2倍多;诊断出艾滋病的概率是女性的3倍多;自杀的概率是女性的4倍多;女性更易接受医疗保健,更愿意寻求社会和感情上的支持;男性从受精一刻起就十分脆弱,在怀孕期间和童年,当我们还不能控制自己的健康时,男孩的死亡数字就比女孩多,即便有了最精心的照顾和喂养,男人早死的机会也更

14、大;美国男性26%抽烟;酗酒的概率几乎是女性的2倍;在美国从事30种高危活动的机会男人比女人高;男人占美国入狱犯的94%统计推理已渗透到我们的全部日常生活。一、统计概括 当我们的概率推理以频率理论为基础时,就可以从总体中抽取一部分对象作为样本,考察样本中的每一对象,得出样本中某一性质出现的概率,然后再根据样本的概率推测总体的概率。这种概率预测推理就是统计推理。例如,为了解男女出生率,对不同时代、不同地区、不同民族的婴儿出生情况进行抽样调查,结果发现,男女出生比均在105100上下波动。于是,得出结论:男孩的出生率约占2243。统计概括的一般形式是随机样本中有N(百分数)的S是(或不是)P所以,

15、可能总体P中有(M) N的S是(或不是)P这种推理实际就是所谓的“抽样统计”。当有限的人力、时间及财力等资源不允许我们对研究对象的每一个分子进行考察时,采用抽样统计方法便成为必要。一个准确和可靠的抽样统计,就是要保证从对样本搜集的数据的分析结果必须能够推广到总体(整个研究对象的集合)上。然而,怎样的抽样统计才能保证达到这个目标呢? 基本条件是:样本有代表性;考虑抽样误差;正确理解数据的意义。(一)样本的代表性也即样本是否典型,能否代表总体。无代表性的样本是偏颇的或有偏见的。总体是由人还是其他对象构成,要考虑不同的因素来确定样本是否典型。一般要考虑三个因素:1.样本是否被随机选出;2.样本的大小

16、;3.心理因素。随机抽样可以保证总体中的每一个分子都有同等机会进入样本。反之,非随机抽样得到的样本是偏颇的,即总体中的某些分子比其他分子有较大机会被抽中,因此所得的数据未必能够推广到总体本身。例如,假设天文台只在香港岛装置雨量器作为收集香港降雨量的资料,则这个抽样方法就有偏差,因为香港岛只是香港其中一个主要地域,所以香港岛的降雨量(样本)未能代表香港的降雨量(总体)。假若现在香港岛、新界、九龙和大屿山各区都装置了雨量器以收集雨水,这样的抽样是否就免于偏差呢?若果雨量器所处的地方有些在野外空地、有些在树荫下、有些在瀑布或溪涧旁边等等,那么在某些地点落下的雨水被雨量器收集的概率会比其他地点的高(位

17、于某些地点的雨量器甚至连并非来自降雨的水也收集下来)。样本被随机选出的要求适用于所有的样本,不过,有时它被认为是理所当然。例如,当医生为检验血糖而抽取血样本时,不必要从被检测者的手指、胳膊和腿分别抽取一点。因为血是循环流动的,能够假定它与血糖的关系是同质的。但是,当总体由离散的单元组成时,必须更多地注意随机性要求。例如,一个机械公司的质量控制工程师需要确定某个特定的传送带上的零件符合规格。如果该工程师每次都取第10个进行测量。假若零件并不是随机地安排在传送带上,用这样的程序获得的样本并不是随机的。因为有这样一种可能:由于机械过程的某个故障,每到第10个零件就产出优等品,其余均为非优等品。如果工

18、程师碰巧选择的只是那些优等的,该样本就是偏颇的。更可能确保挑选随机样本的程序是,抛掷一对骰子,每当出现10点时就对应选取一个零件。由于掷骰子的结果是随机的,因此这种挑选也是随机的。 在考虑到难度和经济代价时,分层抽样作为纯随机抽样的替代品。这是按照事先知道的优势比例将总体划分为不同的组,再在每一层内部进行随机抽样。例如,按经济收入的多少,将全国或某一区域的居民家庭分为四层:月收入在5000元以上的;在3000元到4999元的;1000元到2999元的以及1000元以下的。然后在于每一层中进行随机抽样。但分层抽样可能遇到分组比例的信息的正确性问题。例如,在收入分组时就可能遇到麻烦。即便这样,这种

19、方法在实际运用中仍然留给调查人员随意性。例如,如果采用这种方法进行市民安全感调查,访问员往往不去肮脏的老城区,往往也只愿意在白天进行访问,这样一来,他们就可能系统地排除了经济地位低下的居民、上夜班的居民等。因此,调查结果的准确性就可能因忽略了这部分群体的意见而受到影响。样本的大小在决定样本是否有代表性上也是一个重要因素。在样本随机选出的情况下,越是大的样本,越接近于复制总体。在统计学中,这种接近性的程度用“抽样误差”来表示。抽样误差是样本中某性质出现的频率与总体中该性质出现频率之间的差距。样本越大,抽样误差越小。人们根据实践经验总结出了在95的置信水平上样本大小和误差范围及置信区间的关系,即在

20、有代表性的样本的大小确定的情况下,考虑到抽样误差所得到的关于总体的结论可以有95的概率为真。样本大小和抽样误差考察数量 误差范围(百分点)4000 21500 31000 4750 4600 5400 6200 8100 11 当样本是由人所构成的时,随机性要件可能更多地出现问题。一个较少偏颇的样本似乎可能通过从电话簿随机选择电话号码而获得。但该程序也不会产生完全随机的样本。打电话的时间影响所获得的回答的种类。那些上全班的大多数人在白天无法接听电话;即使电话在晚上打,未列入的号码也大约占总体的30。调查表随杂志的某一期发出,回收后得到的样本也有局限性,得出的统计数据很难推广到比该杂志读者更大的

21、群体上。通过互联网主页点击进行的投票也存在类似的问题,需处处小心。 当总体是人组成的时,心理因素可能有重大作用。首先,如果构成样本的人们认为由于他们提供的回答而获得或损失某些东西时,可以想像,他们的受牵连的事务将影响回答结果。例如,如果一项研究需要调查居民的收入,以便决定能否承担得起提高的所得税,那么,人们会低估收入。其次,对所要回答的问题也可能有心理负担。像“你多长时间刷一次牙?”“一年内你读多少书?”可以期望得到高估的回答。而“你被灌醉过多少次?”“你有过多少婚外情?”将可能得到低估的回答。类似的夸大也可能是一个提问的措词的后果。比如,“你赞成减少福利作为对猖狂欺骗的回应吗?”比直接问“你

22、赞成减少福利吗?”期望得到更为肯定的回答。第三,另一个产生心理影响的来源是调查者和回答者之间的个人互动。显然,许多人宁愿回答令人喜欢(愉快)的人提出的问题。美国1988年大选,报纸曾对杰西杰克逊作过一次民意测验。统计数据表明,他最多能获得黑人中约50的选票。可投票时发现,有90的黑人支持他。原来,在民意测验中,黑人不愿意把自己真正的想法告诉那些白人调查员。 我们在日常经验中遇到的大多数统计证据并不提及诸如随机性、抽样误差以及样本是在何种条件下获得的等因素。缺少这样的信息,面临评估这种证据的人必须使用他的最好判断。数字和科学术语并不是无偏颇样本的代用品。(二)区间估计抽样误差本质上并非错误,因为

23、只有对总体的每一个分子都进行调查(然而这就不是抽样统计)才会得到与总体完全相等的数据,所以再完善的抽样统计程序和方法都无法避免有抽样误差。一般说来,一个随机样本中的频率同总体中的百分比恰恰相当的概率是很低的,但样本频率同总体的百分比靠近的概率却可以是很高的。由上述讨论可知,统计推理得出的结论不是一个和样本频率相等的数值,而是一个和样本频率相靠近的区间。由于这个缘故,人们常把对总体百分比的估计叫“区间估计”。这个区间通常叫置信区间,其大小与样本的容量N的大小有关。N小时,误差范围便大,置信区间也就大;N大时,误差范围便小,置信区间也就小。如果某选举候选人支持率统计调查有3%的误差幅度,如果该调查

24、的结果是选民对候选人甲的支持率为52%,则具有95%可靠性的置信区间等于52 3%,即4955,换句话说,选民中49到55的人支持甲,这一结论的概率达到95%。所以,我们可以说,所有统计推理得到的结论,都应是以两个数为边际数的区间。假若一个统计推理的结论不是一个区间估计,而是一个孤零零的数字,那么,我们得小心思量一番。(三)数据的意义统计推理中最常提及到的统计数字是平均数。例如,本公司职员月平均收入是2500元我们杂志读者的平均年龄是34岁这个居民区中家庭的年均收入为2万元但是,“平均数”有三个不同的意义:均数(算术平均数mean)、中位数(median)和众数(mode)。在评估依赖平均数的

25、论证时,知道被使用的“平均数”一词的精确意义常常是重要的。一个拥有N个数字的集合的均数就是该集合全部数字的总和除以N。例如,列出某个班级一组学生的年龄,人数 年龄 1 18 4 19 1 202 213 22所有人的年龄相加除以人数就得到该组人的平均年龄(均数),也即算术平均数。平均年龄20.2把集合中的数字由小到大排列出来,而位于正中间的那个数字便是该集合的中位数。上列年龄表的数字集合可写为18,19,19,19,19,20,21,21,22,22,22,一共有11个数,第6个便是中位数,即20。如果N是偶数的话,中位数便等于正中间那两个数字的平均数,例如2, 5, 5, 8, 10, 12

26、的中位数就是 (58)2=6.5。一个中位数比平均数优胜的地方是前者不会受因某些异常情况而出现的极端数值(它对于所要研究的对象不具代表性)的不必要影响。譬如,由于一些不寻常的情况,数据2, 5, 5, 8, 10改变成2, 5, 5, 8, 100,这个数据的均数会由6增加到24,但中位数就不受这个异常情况所影响而维持在5不变。 众数是以最大频率出现的那个值。例如,上表中出现次数最多(4次)的年龄是19岁。而在2, 5, 5, 8, 10, 12中,众数是5,因为它出现的频率最高。在年龄例子中,均数、中位数和众数相互不同,但很接近。但是,当在这些不同的平均数值之间存在重大差距时,归纳的问题

27、就出现了。例如,关于薪水问题的平均数。职 位 人 数 年 薪 (人民币元)经理 1 高级主管 2 主管 2 80000高级工程师 1 65000 (均数)工程师 4 55000高级绘图员 1 45000 (中位数)绘图员 10 30000 (众数)该公司有21个职员,年总薪酬额为元,均数是/21,即65000元;年薪中位数为45000元,因为有10个职员的年薪比这多,10个比这少;由于挣30000元的人数最多,所以该数值是众数。这三个数值都表示该公司的平均年薪酬,但是在不同的意义上。平均数使用的目的不同,不同的数字可能被引证作为一个论证的基础。比如,高级工程师要求提高薪水,经理可能回答说,他的

28、薪水早已超过平均水平(在中位数和众数的意义上),因此不能再高了。如果绘图员提出同样的要求,经理也许回应说,他们现在已挣到公司的平均薪水(在众数的意义),而对于绘图员来说,挣到平均薪水就是很不错的了。假如公司之外的人认为,该公司付的只是维持生活的工资,那么经理可以回应说,本公司的平均工资是非常高的65000元。经理的所有回答都是真的,但如果读者或听者不能熟练地区别“平均数”的各种意义,那么,他或许被经理的论证所说服。这就表明,三种平均数有不同的功用。当然有可能存在三种平均数是同数值的情况。这就是对应于随机现象的数据组。例如,成年男女的高度,某个区域的风速,某种照明灯泡或汽车轮胎的使用寿命,某种牙

29、膏或洗发精的周销售量等随机样本的结果。那些对应于这些现象的数据通常接近正态分布,它在图表上的曲线呈钟形。统计推理是一种有力而常用的论证方法。但不谈取样方法,不言样本容量,不考虑误差范围,不澄清数字含义,都可能使推理变成谬误或失去意义。二、统计谬误 数字和图表本身不会说谎,但人们有可能利用它们说谎。面对统计资料和论证,我们应该经常提出5个批判性问题:1.谁说的?验证资料来源的正当性和权威性;2.如何知道的?检验样本;3.遗漏了什么?揭示相关因素和比较基础;4.是否有人偷换了概念?洞察概念的不同解释对得出结论的关键影响;5.这个资料有意义吗?揭露统计数据赖以建立的未经证实的假设。(一)忽略相关变量

30、美国与西班牙交战期间,纽约曾出现这样的宣传口号:“离开纽约,去参加军队,因为在军队比呆在纽约更安全!”原来,证明这样的结论有统计上的根据:美国海军的死亡率是9,而纽约市居民的死亡率是16。这两个数据的对比实际上没有意义,因为忽略了决定死亡率的很多变量。海军由那些体格健壮的年轻人组成,而纽约居民中包括了婴儿、老人和病人。后者在哪里都有较高的死亡率。因此,两个数据根本不能相比,更不用说符合参军标准的人在海军会比在其他地方有更高的存活机会。(二)遗漏信息的数字 我们的计算机销售市场份额增加了50,而我们的对手只增加了25。本市凶杀案比去年增长了67。这两个例子,都使用了正确的百分比。然而,它们却遗漏

31、了一件重要的信息即百分比所基于的绝对数字。如果想暗示隐含结论:我们的业绩更好或犯罪浪潮席卷本市,那是不适当的。也许我们的计算机销售是从原来所占市场份额的2提高到了3,而对手是从原来所占的60提高到了75。孰优孰劣?假如我们知道所谓凶杀案的增长只不过是从3件增加到5件,你心中的石头准会落回到地上了。所以,在遇到百分比的时候,应该仔细想一想,该百分比所凭借的数字是什么?一旦对手拿百分比进行比较,你更要对此当心。 利用百分比眩人耳目,还有另一种常见的方式:选取便利合用的基础数据。如果想使数据大得骇人,只需把它表现成某个小数字的百分数;反之,如果想让数据微不足道,只需把它变成某个大数字的百分数。表面的

32、庞大和微小都是有奥秘在里边的: 假若有785名心理医生都对精神失常的被告表示支持,便有充分的理由让我们也对其表示支持。今年有1.05万多人来买汽车,我们汽车公司最好的年头到底来了。拳击并不如其他体育项目危险。这是因为一项与体育有关的死亡统计显示,该市棒球的死亡人数为43人,在死亡率方面领先于足球(22人)和拳击(21人)。 这些数字,有的尽力求大,有的着力求小,有的努力求准,目的都不外让你印象深刻。但是实际上,我们可以发现许多疑点。难道不需要知道有多少心理医生接到了调查表,多少名做出了回答,他们的合格程度怎样?增长用万的百分数会不会更有意义?很可能销售量不过是从1.04万增长到1.05万,而其

33、他汽车的销售量比它不知要大出多少倍。不了解参加这些体育项目的运动员人数便去计算百分数,谁知道拳击手的总数是否比棒球手的总数低出许多?(三)样本偏颇在统计推理中,违反抽取随机性标准和应具有代表性要求的样本是偏颇的。一个为人们所津津乐道的、闻名全世界的例子是1936年文学文摘(Literary Digest)因一个统计推理谬误的惨败。该刊成功地预测了1924年、1928年和1932年美国总统的选举结果,使其名声大振。文学文摘的方法创新在于将局部性民意测验推广到全国。其抽样调查的样本框来源于电话号码簿和汽车登记记录。1936年,拥有1000万订阅者的文学文摘共发出2000多万张选票,回收237万张选

34、票,预测兰登与罗斯福的票数比是370:161,该刊根据统计结果宣布:兰登将击败罗斯福!但投票结果是,罗斯福以2775万票赢得了46个州,比对手兰登多1107万张选票,选举人票是523票对8票。这次预测的失败使文学文摘的信誉一落千丈,并因耗费当时来说数目不小的近百万美元而最终关门大吉。后来的大学论文和报社评论员发现,1936年有能力购买电话和订阅杂志的人并不能真正代表选民,样本偏向了与一般人相比具有高收入、受过良好教育、信息来源广、灵敏度更高、举止优雅、行为保守、更多固定习惯等特点的群体。后来还证实,他们中的许多人是共和党的选民。所以,人们不无讽刺地说,该样本选择了兰登,而选民心理却想着罗斯福。

35、我们由此得到的教益是,依据通过杂志甚至互联网得到的统计数据进行推理时,一定要反复思考样本的代表性,以得到一个与样本代表的范围相称的结论。(四)样本太小来看一看被从事社会学专业的评论者认为是“弱智的一塌糊涂的一则新闻”。记者昨日从天津市心理卫生协会获悉,本市对高中学生性心理进行的最新调查显示,34.7%以上的“学生情侣”存在拥抱、接吻现象,4.1%以上存在同居现象!负责此次调查的天津市心理咨询职业技能培训中心教务主任李军表示,学校性教育存在的不足是引发青少年出现性心理、性生理问题的主要原因,而家长和学校联手就能取得事半功倍的效果。据称,此次调查了本市某高中两个班级共89人,其中男生53人,女生3

36、6人,年龄在1617岁。评论者指出,不过一所学校的调查,不过89个样本,竟然也敢拿来说事,别的不说,不同学校的情况千差万别,光是那些好的学校和差的学校就有明显的差别,这个调查抽取的高中是什么性质的,办学质量如何,校风如何,这些都会直接影响调查的结果,而且调查的结果根本就不能用来推论总体,说天津高中生如何如何的。其实,那么小的样本量,用来做推论性的论断,只有两个字评价“垃圾”,我相信任何学过统计,学过抽样的人都会和我有同感。(五)赌徒谬误根据一个事件在最近的过去不如期望的那样经常出现,推断最近的将来它出现的概率将会增加。一个赌徒在输掉几次之后,加大赌注,以期在“应该”要发生的事件到来时大捞一把。

37、然而,赌徒可能输得更惨。赌徒的错误在于误解了“大数定律”或“平均定律”。前述关于概率的频率解释告诉我们,随机事件的发生频率具有稳定性。在大量重复进行同一试验时,这种频率总是接近于某个常数。当试验次数足够时,随机事件发生的频率与它们的概率将无限接近。但是,这种概率只是一个长的过程或趋势的性质。赌徒没有理解,比如,抛掷硬币出现正面是一个独立事件,即上一次发生的事件对下一次事件毫无影响。即使硬币正面朝下出现了6次,再抛掷时硬币正面朝上的概率仍是1/2。当一个医生接待一个病人时,经过检查程序之后,医生对其家属说,病人的病很严重,10有9死。当病人的家属被吓得够呛时,医生又不紧不慢地说,但您们很幸运,因

38、为您们遇到了我,我之前所看过的这种病人已有9个死掉了。但是,病人的家属有理由得到宽慰吗?(六)令人误解的平均数使用平均数有很大的玄机。当人们希望数据较大时,就可能使用算术平均数。而不希望这样时,可能使用中位数或众数。美国时代杂志(1954年)在描述该杂志的新订阅者时写道,“他们的平均年龄(中位数)为34岁,家庭平均年收入为7270美元”。之前对旧时代读者的调查发现,“平均年龄(中位数)为41岁平均收入为9535美元”。令人疑惑的是,两次谈到年龄时,都明言指的是中位数,而关于收入却不指出是哪种平均数。也许这里使用的是均值,以便利用高收入读者群来达到吸引广告商的目的。当你有一天打算应聘某一公司时,

39、看到招聘宣传材料上关于该机构员工的平均工资不低的信息时,可不要急于眼热心跳。如果这个数是中位数,你可以获得有用的信息:一半员工赚得比它多,一半比它少。如果是均值,则根本没有什么意义。它可能既掩盖了多数员工的低收入,又隐瞒了所有者以巨额薪金形式抽取的利润。(七)精确度谬误 根据抽样误差理论,一个统计推论的结论一定是一个区间估计。如果你发现一个统计推论所得出的结论是一个孤立的百分数,而非以两个数为边际数的区间估计,那么,你完全有理由对其保持审慎态度。假如结论是一个靠近50%的数值,那你得小心诸如“过半数的人如何如何”的可靠性。纽约时报民意测验的数据中,有一项显示出54的黑人应答者说希望环境保护继续

40、改进,不管经济上有多大损失。人们也许被诱使做出结论:“过半数黑人支持这一立场”。要是容许3的误差,这个结论便得到支持,但事实上误差不只3。这就要看样本中黑人的数量。我们可以设想:样本中黑人所占的百分比,同全美国人中黑人所占的百分比是相当的。美国黑人约占美国人口的15。这就等于说,1479人的样本中有222人是黑人,姑且算作250人。这样大的样本容量对应的误差范围是6。这样一来,民意测验资料中所提到的54就变成了4860了,而48是不可以说超过半数的。而且,黑人数还不是250,这就决定了区间的下边际不是48,而是48以下,因此,就更无理由说“过半数黑人支持这一立场”,只能说“4860的黑人支持这

41、一立场”。(八)误人的图表统计报告中经常使用图表。这种手段将会使资料分布的特征更加明显,使人们直观地理解统计结果。好的图表把重点放在数据的某一方面或明显表现出数据在某段时间上的趋势,使人立刻观察到单从数字上往往难以明显察觉到一个数据的特征。而差的图表也能令人很快得出“表”里不一的错误结论。 下图描述了在1994到1998年间香港人每1000人口中拥有移动电话的增长情况。由于数字上(1994年的“71”到1998年的“420”)是增加了6倍,所以右图的高度为左图的6倍是正确的绘图方式,但同时右图的宽度为左图的6倍,这便易于产生误导,因为右图的面积最终等于左图的6 6=36倍,导致视觉上会令人

42、误解为有36倍的增长。 在用坐标图表示某种趋势时,统计图表经常出现的误导是在某一轴上以不均匀的间隔标记数值,或在两个轴上采用间隔不匹配的标记点;有时还在标记点不密集的情况下轻易将标记点连结起来。(九)片面理解对一个统计数据予以片面理解而得出一个具有片面性的结论。2004年12月14日新华社消息报道,在当天的全国安全生产电视电话会议上,国家安全生产监督管理局局长通报今年以来全国安全生产情况时说,2004年,全国国有重点煤矿、国有地方煤矿和乡镇煤矿的百万吨死亡率均创造了历史最好水平。如果我们只是从纵向来理解,对这“令人鼓舞”的结论沾沾自喜,那么,从横向比较,这样的进步仍令我们汗颜。据香港大学教授的

43、研究,与过去相比,我国每百万吨死亡率一直呈下降趋势,上世纪80年代是8.7人,现在是4.64人。但是,美国50年代是1.27人,现在为0.03人。中国是美国的121倍,是印度的10倍。第四节 归纳决策决策就是选择能最有效地实现决策者意图或目的行动方案。人生在世几乎每天要做决策或决定。早上跑步锻炼还是睡懒觉?该与A君还是与B君交朋友?就业还是呆在家里复习考研?这些都是我们要面对的决策问题。有些决策的对错无关宏旨。比方说,你选了部烂片观看而白白浪费了整个下午,这也许会令你很气愤,但却不会对你的人生有多大损失。然而,在某些事情上做错了决策却可能会令你抱憾终生。譬如说,没有好好学习逻辑课,又在考前未认

44、真复习,于是决定带些小抄想侥幸过关,结果被逮个正着,按作弊论处,受了处分,丢了学位,就业市场上已失去很多竞争力。一些决策依习惯而行即可,另一些则需要算计权衡。如何做作理性的决策构成决策论的中心课题。决策论是一门研究决策者在不同处境下该如何选择才最为理性的学问。决策论讨论的决策问题主要有两大类型。一类是归纳决策问题,即策略选择的成败一方面取决于策略选择本身,另一方面也取决于客观自然状态的概率(可能结果的概率)。归纳决策中只有一个决策者(一个人或一个团体)。另一类决策问题涉及两个或两个以上的决策者,决策的结果一方面取决于其中一个决策者的选择,另一方面也取决于其他决策者的选择。例如,“田忌赛马”。这

45、类决策问题叫对策,相应的理论就是对策论或博弈论。但决策论只能告诉你怎样做决策最理性,并不能担保你每次也能获得满意结果。最理性的决策未必会导致最好的结果。最好的结果也不一定来自最理性的决策。简言之,理性的决策与结果的好坏并无必然联系。毕竟,结果的好坏往往还得凭些运气。 一个决策的基本要素包括决策者(独立的有决策能力的个人或团体)、决策的目的、行动方案集(策略集,可供选择的行动方案或策略的集合,至少包含两个方案)、可能结果集(每一行动方案对应的可能结果的集合)、每种可能结果的概率和效用(期望值,相对于目的而言的可能结果的利害及其大小)。效用可以用金钱来衡量,但并不尽然。不过,在决策过程中进行的概率

46、计算需要尽量给效用指派一个数值。因为我们的任务就是通过计算某种结果的期望值来判断对应方案的价值。典型的决策情境涉及决策者面对两个或以上的相互排斥的选择。按决策情境划分,决策有三类:风险情境下的决策;确定情境下的决策和不确定情境下的决策。一、风险下的决策当决策者能够对与其行动相关的世界状态指派概率时,他就身处风险下的决策情境。此时,我们的知识被说成是局部的或不完全的。让我们从用金钱衡量的效用计算来说明问题。假设一次抽彩给奖活动中,每张彩票为1元,每张为一组,每组设一等奖1个,奖10000元;二等奖两个,各奖1000元,三等奖10个,各奖200元,末等奖3000个,各奖2元。现在你有1元钱,买不买

47、?有两种方案可以选择:买(A)和不买。如果选择不买,你在金钱上无所得也无所失,金钱效用(报酬)或期望效用值为0。如果决定买,你的报酬是多少?可能得到某等级的奖金,也可能一无所获。因此,买彩票有5种可能结果:O1:得奖金10000元; O2:得奖金1000元;O3:得奖金200元;O4:得奖金2元;O5:得奖金0元。出现以上各种结果的可能性是不同的,即P(O1)1/;P(O2)2/;P(O3)10/;P(O4)3000/;P(O5)/(1+2+10+3000)/ 3013/96987/。以上结果是互斥且穷举事件,令概率分配为X1,Xn,按照概率推理,买一张彩票的期望值(金钱)就是:EX1O1X2

48、O2XnOn然后再减去买彩票花去的1元,因此为(A)(1/100002/100010/2003000/296987/0)10.80对这个结果的另一个解释是,如果你花元把一组彩票全部买下来,那么你就囊括了全部奖金,即20000元,但你损失了80000元,平均每1元损失0.80元。 但是,在某些情况下,效用不能用金钱来度量。这时,我们可以指派“效用单位”。例如,被医生告知做一个耳手术的某个病人就面临一个风险下的决策。如果他决定做这个手术,那么三个不同的世界状态或情形是相关的,它们每一个有某个概率。例如,听力改善非常好的概率是0.85,不改善是0.1,变得更坏是0.05。显然,第一种结果有最大的效用

49、,并且有高概率;第二种结果有低效用(听力问题未改善,而且病人要忍受疼痛和手术费用);第三个结果有最低的效用。如果病人拒绝手术,几乎可以肯定他的听力状况既不改善也不变坏。这个结果的效用等级高于不成功的手术(无改善和变得更糟),但低于导致听力改善的手术的结果的效用等级。病人应该做手术吗?这个决策问题表示如下,其中表达了两个行动下的世界状态以及它们的概率: 行 动 世界状态(行 动 的 可 能 后 果)听力有很好改善听力维持现状听力更坏1.做手术0.850.100.052.不做手术(几乎)0(几乎)1(几乎)0但是,可能结果的效用不能用金钱数来表示。不过,我们可以根据主观的感受用“效用单位”给每一种

50、可能结果指派一个相对值。这样,加法、减法乘法和除法运算都可以在此效用单位的基础上进行。尽管该单位不必,也许不可能换算为金钱数。我们尝试给实施耳手术的三种可能结果的效用单位赋值如下:听力有很好改善:10;听力维持现状:2;听力更坏:10 这样,手术期望值或期望效用为(当然三种可能结果是互斥且穷举的,概率和为1): E(100.85)(20.10)(100.05)7.80而不做手术的期望效用为0。所以,病人应选择手术。这种决策基于一种叫做“最大化期望效用原则”:决策者应选取能给予他最大期望值的行动决策论者认为该规则虽非毫无瑕疵,但在一般情形下提供我们合理的指示。假设决策者面前有N个行动选择,根据此

51、原则,决策者应计算每个行动分别对应的期望值,然后选择期望值最高的行动加以实施。二、确定性下的决策在某些情况下,决策者能选择的每个行动也只有一个可能后果。这种情况称作确定性下的决策情境。例如,你决定在家里还是在图书馆复习准备考试?如果你决定在家里学习,那你就采取在家学习的行动;如果你决定在图书馆学习,那你就采取在图书馆学习的行动。通常,仅有一个状态与确定性下的一个决策相关联。但是,严格说来,世上根本不存在这种决策情境。在你做出决策那刻起到实施行动之间,世事已可能以你难以预料的方式改变了。你决定到图书馆去为通过那令人担忧的考试而学习。然而,到达图书馆之时却发现因停电而闭馆。一般说来,我们谈论确定性

52、下的决策时,简单地忽略了这种不经常的可能性。确定性下的决策并不需要任何概率计算。与相关行动的单一事态相联系的概率总是接近于1或可被当作1。进行这种决策适用的规则是简单的:选择有最高效用的行动你正考虑该购买A区还是B区的楼房。你该如何比较两者的效用?比较首付款数及月付款数固然应列入考虑因素。然而,除此之外,你也许需考虑其他与金钱无关之事。例如,哪区的治安较佳?交通是否较方便?小学质量如何?购物困难大否?比较效用往往因要考虑这些因素而变得复杂棘手。在许多情况下,附加因素的考虑可能使得一个确定性下的决策变成一个风险下的决策。 三、不确定性下的决策在不确定性下的决策就像在风险下的决策一样,我们的知识是

53、不完备的。但在风险下决策中,我们至少能对世界的不同状态的概率做出判断。在不确定性下的决策中,我们也注意到不同的状态与我们的决策相关,但我们不能评估各种状态的概率。我们甚至都不能说,是否一个相关的状态更可能,更不可能或与另一状态同等可能发生。如此的情形也许并不常见;在大多数情况下,我们有充分的知识,至少以过去的经验或从其他资源收集到的信息为基础,大致指派概率。如果我们能够形成哪怕是粗糙的概率判断,我们也将遵循风险下决策的规则,即选择最大化期望效用的行动。当我们在不确定性下决策时,我们没有关于概率的信息,我们的选择完全基于对那些和不同事态相联系的效用的考虑。正如在确定性下决策那样,在不确定性下决策

54、的大多数情况下,效用的等级顺序是足够的。亳无疑问,这种情况甚为罕见。在大多数情况下,我们也能粗略评估不同可能后果发生的机率。股票投资也许为最符合这种不确定情境,至少就非专业的投资者而言。我们不妨以此投资对不确定性情境加以说明。假设股坛新秀王某欲在股场一试身手。他正盘算着四种投资策略:(1)投资8000,(2)投资4000, (3)投资2000,(4)投资1000。他虽能预计各个投资策略的可能结果,却无法评估它们发生的可能性。下面回报表表示他的决策情境:行动(投资)行动的可能后果(回报)牛市普通市熊市1. 80008002004002. 40004001002003. 2000200501004

55、. 10001002550王先生应选择何种投资策略?既然王先生对可能结果发生的概率完全无知,最大化期望值原则显然派不上用场。因此,只能求助其他原则。在此情况下有至少两条原则可助王先生作理性决策,而选取哪一个则视其个性而定。若王某生性审慎保守,那他应遵循以下“最大最小化原则”:决策者应先比较可供选择的每个行动的最坏可能后果,然后选择引起最坏后果之中的最佳后果之行动。 在上表中,我们看到行动14的最坏后果分别为 400,200,100,和50。行动4引发的最坏后果比其余行动的后果较佳(即“最坏之中的最佳”),因此,王先生应选择行动4,即投资1000元炒股为好。假若王先生富有冒险精神,那么,以下“最

56、大最大化原则”较适合他:决策者应先比较可供选择的每个行动的最佳可能后果,然后选择引起最佳后果之中的最佳后果之行动。行动14的最佳后果分别为800,400,200及100。可看出,行动1为引起最佳之中的最佳的行动。因此,王先生应选择行动1。 第五节确认因果关系的推理因果联系在我们的现实生活中扮演重要的角色。对历史和现实的理解需要追溯它们的原因,对未来的预见要求我们把握现实的可能发展结果。日常语言中的“原因”是有歧义的。有时,它指的是充分条件原因,有时指的是必要条件原因,而在另一些场合下,可能指的是充分且必要条件原因。我们可以运用系统的方法,来探求不同条件意义上的原因。这就构成了以一个因果陈述为结

57、论的论证。一、条件逻辑“原因”可能是三种不同意义之一:充分条件、必要条件或充分且必要条件(简称充要条件)(一)充分条件当满足下列条件时,X是Y的充分条件(X、Y代表事件或属性):X出现时,Y也出现;X不出现时,Y可出现,也可不出现;从未有X出现时,Y却不出现例如,“一个人患肺炎,他就发烧”。当肺炎出现时,发烧也出现;肺炎不出现时,发烧可能出现(感冒发烧),也可能不出现(没有任何病症);我们从来不会遇到一个患肺炎而不发烧的人。因此,患肺炎就是发烧的充分条件。简言之,X是Y的充分条件:如果X出现,Y一定出现。充分条件的意义在于,当我们期待一个现象出现时,通常就要探求这一现象的充分条件原因。通过干预

58、,使得这个充分条件出现,则会使我们所期待的现象也出现。(二)必要条件当满足下列条件时,X是Y的必要条件:X出现时,Y可出现,也可不出现;X不出现时,Y不出现;从未有X不出现时,Y却出现例如,“只有存在氧气,物质才能燃烧”。当氧气出现时,燃烧可能出现,也可能不出现(温度不够);氧气不出现时,燃烧必定不出现;我们从来不会遇到没有氧气而燃烧的情况。因此,有氧气就是燃烧的必要条件。简言之,X是Y的必要条件:如果X不出现,Y一定不出现。必要条件的意义在于,当我们想阻止一个现象出现时,通常就要探求这一现象的必要条件原因。通过干预,使得这个必要条件不出现,则会使我们欲阻止的那个现象也不出现。充分条件和必要条

59、件是有关系的。一个事件出现,至少有其一个充分条件出现或其所有必要条件出现。所有必要条件的齐备就是产生那个事件的充分条件。(三)充分且必要条件当满足下列条件时,X是Y的充分且必要条件:X出现时,Y一定出现;X不出现时,Y一定不出现;从未有X出现时,Y却不出现;X不出现时,Y却出现例如,“当且仅当一个数能被2整除,它是偶数”。当一个数能被2整除时,它一定是偶数;当一个数不能被2整除时,它一定不是偶数;当一个数是偶数时,它一定能被2整除;当一个数不是偶数时,它一定不能被2整除。我们从来不会遇到:能被2整除的非偶数和不能被2整除的偶数。因此,能被2整除是偶数的充分且必要条件。简言之,X是Y的充分且必要

60、条件:如果X出现,Y一定出现;如果X不出现,则Y一定不出现。充分且必要条件的意义在于,当我们想阻止一个现象出现或期待它出现时,掌握了它的充分且必要条件,我们就有了强有力的手段。但是,很显然,充分且必要条件的获得是以充分条件和必要条件的获得为基础的。(四)条件关系规律若以X、Y代表一个事件或属性的出现,X、Y代表一个事件或属性不出现,则可得到以下条件关系的规律性陈述:(1)X是Y的充分条件Y是X的必要条件 X是Y的必要条件 Y是X的充分条件 (2)X是Y的必要条件Y是X的充分条件 X是Y的充分条件 Y是X的必要条件 (3)X是Y的充要条件Y是X的充要条件 X是Y的充要条件 Y是X的充要条件 (4

61、)X不是Y的充分条件X且Y (5)X不是Y的必要条件X且Y (6)X不是Y的充要条件X且Y或者X且Y 二、确认因果关系的推理方法掌握了条件关系规律,就可以通过考察现象或属性之间的相关伴随情况,运用若干消除方法,剔除不太可能的原因,进而确定最可能的充分条件原因、必要条件原因或充要条件原因。以下求因果推理方法源于英国哲学家弥尔,后经当代哲学家改进。(一)直接契合法验证一个事件或属性与其必要条件之间因果联系的方法。某个单一的因素在被考察现象出现的每一场合始终伴随出现,则可推断这个因素是被考察现象的必要条件。据报,在同一饭店吃过午饭的5个人都得了肝炎。卫生部门的督察员获知,这5人吃的是不同的食物,但在

62、他们都食用过的蔬菜色拉中均有番茄。这是5人食用过的唯一相同的东西。督察员得出结论,他们的疾病由番茄所传染。以A,B,C表示不同的食物,其中B代表番茄,5个场合代表5个人,+表示因素的出现,表示因素的不出现。上例可列为下表进行分析。可能的必要条件被研究现象场合A B C D E F G (肝炎)1+ + - + + - + +2 + + - + + - +3 + + + - + + +4-+ + + + - + +5 + + - + + + - +这表明,场合1(第一个人)吃了食物A,B,D,E和G,没有吃C和F。场合2(第二个人)吃了A,B,C,E和F,没有吃D和G,如此等等。当肝炎出现时,A,C,D,E,F,G这些因素都存在这样的情况:其中的一个在某个场合不出现,根据前述关系规律(4),肝炎不是他们中的任何一个的充分条件,根据(1),它们中的

TAG:
阅读:
扩展阅读:
下一篇:没有了 上一篇:描写医生医术高超的句子
初一课文 http://www.gisyemen.com
二维码
意见反馈 二维码