之所以贴为主贴是因为baidu博客报告回复超长,不允许发。原帖子见deadwind学习笔记博客。
—
这篇文献(Tversky & Kahneman, 1971)我只是大致概览,但发在science的那篇综述也说到了这类问题(Tversky & Kahneman, 1974)。代表性的偏见被他们认为是本能。对比有限理性的其它心理学研究,我猜想代表性的偏见是由人类现实的思维方式决定,而统计的估计基于无限理性的理想假设。
我感觉读文献引发思考有两大类。有一类属于技术层面的问题:这个文献通过什么实验设计支持一个什么样的idea,作者如何有这个idea而别人却没有。这类问题关注文献的思路与科研技巧,学习到的东西比较实在,容易取得学术共识。另一类思考关注文献的研究对象和思考论题本身,以及相关联的各种背景。这类思考能对文献的阅读提供很强的兴奋感激励,也容易激起讨论气氛,不过学习到的东西不够实在和直接。我上面的猜想属于第二类的问题。抽象地说,第一类问题是认识论问题,第二类问题是宇宙论问题。在认识论问题上,有可能进行说服——用听者的逻辑和立场去说服听者;而宇宙论问题,太容易变成说教–用讲者的逻辑和立场去说服听者。
言归正传,解释脚注(在pdf原文里是脚注2):20个样本,z值是2.23,.05一类错误双尾z检验显著了;如果再新抽10次样本,问卷请研究者主观估计这十个样本0.05一类错误的单尾z检验显著的可能性。
因为是z检验,所以总体的标准差已知。因为这个问题和计量尺度没有关系,变换尺度,就能让。只有均值被检验。按频率学派的观点,不给定就不能知道检验显著的(频率学派)概率(Gigerenzer, Krauss, & Vitouch, 2004)。但研究者必须回答一个主观的可能性。有一类研究者就会把这个主观的可能性等同于某种中立情况下的频率学派概率,他们把这种中立情况选为的真值恰好是第一次20个样本对的无偏估计值。
用Excel计算,第一次无偏估计值的绝对值;我们的问题和的正负方向无关,不妨认为第一次估计值为正数。单尾.05的z值=NORMINV(1-0.05,0,1)。十个样本单尾显著的判决区域是:十个样本的均值/对应的标准差真值 >NORMINV(0.95,0,1)。十个样本均值是个统计量,这个统计量的分布方差真值是 ,标准差真值则是,这个统计量分布的均值真值就是。
P(十个样本的均值 >(1/SQRT(10))*NORMINV(0.95,0,1) | 真值=,十个样本的均值抽样分布标准差真值=,用Excel算=1-NORMDIST(NORMINV(1-0.05,0,1)/sqrt(10),2.23/SQRT(20),1/sqrt(10),TRUE)
从这个脚注的案例,可以体味一下所谓的Power Analysis对真分布的知识的依赖,而在标准的频率学派框架里,真分布是永远不知道的,连真分布满足某种特定范围的概率也不知道。Gigerenzer, Krauss, & Vitouch的Chapter(2004)值得细读,打算列为第二次(一共十六次)课的必读文献。
–
Gigerenzer, G., Krauss, S., & Vitouch, O., (2004). The null ritual: What you always wanted to know about significance testing but were afraid to ask. In D. Kaplan, (ed.), The Sage handbook of quantitative methodology for [...]