回归现象的意义不亚于万有引力【知识管理】第39天【关键词】回归现象、相关性个人订阅号:jqnote(专注打造爱智慧、爱学习、不急功近利的小圈子)咱们上一次也提及了回归现象,再次以相对比较典型的案例来让大家理解这种现象:(1)也许由于惧怕让众人失望,所以他的第二次面试没有第一次那样令人印象深刻,他第一次的表现太优秀了。(2)她说经验教会她一个道理,批评比赞扬更有用。不过她不明白这是回归平均值在发挥效用。其实无论是没有察觉还是解读错误,这种回归现象对人类而言总是很陌生的。就像万有引力定律和微积分理论都有被被人发现,这种回归的现象也是被应该最伟大的科学家高尔顿经过艰苦卓绝的努力才探索出这一重要规律的。在1886年,他发表了《在遗传的身长中向中等身长的回归》,其中涉及对连续子代的种子大小的测量以及对子代株高和母本株高的比较。在对种子的研究中,他写下了如下的话:实验结果看上去十分值得关注。从这些实验可以看出,子代的高度和母本高度似乎并不相关。但似乎前者比后者更趋于平均。如果母本较高,那么子代就会变矮。如果母本较矮,则子代就会变高。实验显示,子代向平均值的回归与母本高矮的差异是成比例的。其实这样的统计规律不过是像我们呼吸的空气一样稀松平常。回归效应随处可见但是我们却无法识别它们的真面目。高尔顿以子代高度的回归现象为起点,逐渐发现当两个测量值之间的关联不是那么完美时,此时也会出现这种回归。他接住了当时最杰出的几位统计学家的帮助,且历时多年才得出这一结论。我们再来看一个概念:相关系数,即两个值之间的“相关系数”指的是两个值共有因素的相对比重。这个值在0和1之间浮动。我们拥有父母各一半的基因,对于像身高这种受环境因素影响很小的特征来讲,父母和子女的相关系数在0.5左右下面的例子能够帮助我们更好地了解相关系数:(1)美国人收入和教育程度的相关系数约为0.4(2)家庭收入和他们电话号码后4位之间的相关系数为0高尔顿用了好几年的时间才确定相关性和回归性并非两个概念——它们只是从不同视角对同一个概念作出的阐释。这个概念的原则很简单,但是影响却很深远只要两个数值之间的相关度不高,就会出现回归平均值的情况。当然对于一般人可能理解“回归”的概念存在很多的困难。其根本原因皆源自两个系统:系统1和系统2。在相当数量的案例中,即便提供了一些统计数据,若无特殊说明,“相关”与“回归”的关系还是相当模糊的。因此,系统2认为理解这种关系很难。...