Skip to content

{ Monthly Archives } September 2007

惊喜:wordpress.com缺省支持latex

本来还打算全部转移到yo2.cnhttp://lixiaoxu.lxxm.com,现在不用了:)
试一下效果


有位同学反馈看我的 lixiaoxu.wordpress.com 很久不出公式的图片。另一位不在深圳的同学干脆连看都看不到。从这种情况看来,使用wordpress.com的同学很可能都是费了牛劲才把笔记贴上去 的,要上传什么文件更艰难。我暂不在境内,没有体验到这么痛苦的连国外网速,给大家作了不恰当的推荐,非常抱歉。
为了方便境内的访问,我的学习笔记转移到了lixiaoxu.yo2.cn这里
yo2.cn如果要显示公式需要在后台启用安装插件。大家可以看我启用后的效果,用先写公式然后copy的。
lxxm.com基于wordpress mu平台,可以定制缺省启用的插件。这个wordpress mu插件基于John Forkosh的mimetex cgi。

Tagged

回复:关于“伪小数定律”的脚注2

之所以贴为主贴是因为baidu博客报告回复超长,不允许发。原帖子见deadwind学习笔记博客。

这篇文献(Tversky & Kahneman, 1971)我只是大致概览,但发在science的那篇综述也说到了这类问题(Tversky & Kahneman, 1974)。代表性的偏见被他们认为是本能。对比有限理性的其它心理学研究,我猜想代表性的偏见是由人类现实的思维方式决定,而统计的估计基于无限理性的理想假设。
我感觉读文献引发思考有两大类。有一类属于技术层面的问题:这个文献通过什么实验设计支持一个什么样的idea,作者如何有这个idea而别人却没有。这类问题关注文献的思路与科研技巧,学习到的东西比较实在,容易取得学术共识。另一类思考关注文献的研究对象和思考论题本身,以及相关联的各种背景。这类思考能对文献的阅读提供很强的兴奋感激励,也容易激起讨论气氛,不过学习到的东西不够实在和直接。我上面的猜想属于第二类的问题。抽象地说,第一类问题是认识论问题,第二类问题是宇宙论问题。在认识论问题上,有可能进行说服——用听者的逻辑和立场去说服听者;而宇宙论问题,太容易变成说教–用讲者的逻辑和立场去说服听者。
言归正传,解释脚注(在pdf原文里是脚注2):20个样本,z值是2.23,.05一类错误双尾z检验显著了;如果再新抽10次样本,问卷请研究者主观估计这十个样本0.05一类错误的单尾z检验显著的可能性。
因为是z检验,所以总体的标准差已知。因为这个问题和计量尺度没有关系,变换尺度,就能让。只有均值被检验。按频率学派的观点,不给定就不能知道检验显著的(频率学派)概率(Gigerenzer, Krauss, & Vitouch, 2004)。但研究者必须回答一个主观的可能性。有一类研究者就会把这个主观的可能性等同于某种中立情况下的频率学派概率,他们把这种中立情况选为的真值恰好是第一次20个样本对的无偏估计值。
用Excel计算,第一次无偏估计值的绝对值;我们的问题和的正负方向无关,不妨认为第一次估计值为正数。单尾.05的z值=NORMINV(1-0.05,0,1)。十个样本单尾显著的判决区域是:十个样本的均值/对应的标准差真值 >NORMINV(0.95,0,1)。十个样本均值是个统计量,这个统计量的分布方差真值是 ,标准差真值则是,这个统计量分布的均值真值就是。
P(十个样本的均值 >(1/SQRT(10))*NORMINV(0.95,0,1) | 真值=,十个样本的均值抽样分布标准差真值=,用Excel算=1-NORMDIST(NORMINV(1-0.05,0,1)/sqrt(10),2.23/SQRT(20),1/sqrt(10),TRUE)
从这个脚注的案例,可以体味一下所谓的Power Analysis对真分布的知识的依赖,而在标准的频率学派框架里,真分布是永远不知道的,连真分布满足某种特定范围的概率也不知道。Gigerenzer, Krauss, & Vitouch的Chapter(2004)值得细读,打算列为第二次(一共十六次)课的必读文献。

Gigerenzer, G., Krauss, S., & Vitouch, O., (2004). The null ritual: What you always wanted to know about significance testing but were afraid to ask. In D. Kaplan, (ed.), The Sage handbook of quantitative methodology for [...]

“不争论”的智慧

昨日备课去读Neapolitan&Morris(2004)的关于贝叶斯统计的文章,读到其中一句, …used (physical probability) as if they exist but without philosophical commitment…,忽然发现自己在教案中准备了很多关于统计和概率的通识(或所谓哲学)背景,却忘了强调概率统计学者的智慧恰恰在于规避哲学争论、专注于精深的技术共识创新。
“不争论” 不只是学术智慧,也是政治智慧。下图是“不争论是我的一个发明”的语录作者–

图相关的原文《邓小平为什么提倡不争论》见于

Neapolitan, R, E., & Morris, S. (2004). Probabilistic modeling with Bayesian networks. In D. Kaplan (Ed.), The Sage Handbook of Quantitative Methodology for the Social Sciences (pp. 371-390). Thousand Oaks, CA: Sage.

Tagged

RTMA背后的认知偏执

[横轴是预测变量,纵轴是被预测变量;已知预测变量截于蓝线红线绿线位置。蓝线红线相加等于绿线,红箭嘴是被预测变量统计无偏估计;红箭起点是本能偏执预测,红箭表示趋中回归程度。图摘自2006/10北师大讲座PPT]
去年在准备10月北师大讲座的ppt时发现自己过去对于Regression Toward the Mean Artifact (RTMA) 的概念有很多暧昧之处。比如,曾经以为把模型改进后能作无偏估计就是消除了RTMA(Li, Hau, & Marsh, 2006),而老生常谈却是:RTM无处不在。后来恍然大悟,其中问题在于有没有Artifact的主观解读。在之后另一次讲座的准备工作中,我企图澄清两种不同的“RTMA”,一种是经典的RTMA:主观认知直觉地认为预测变量的标准化z值就是被预测变量估计值的标准化z值(Galton, 1886; Kahneman & Tversky, 1973);另一种不知道是否还合适叫RTMA:研究者得到观测值正确的趋中回归描述,却错误地将这个结果推论到作为潜变量的真值,认为原因在于真值的substantial趋中偏移 (Pedhazur & Schmelkin, 1991, p. 226; Marsh & Hau, 2002)。当时隐约觉得,要解决Artifact,只要让观测者脑筋想通了就可以,并不需要特意修正模型去让观测者有问题的脑筋和模型估计结果吻合。
前月读一篇论文讨论Gain Score(Gain)模型和Covariance Adjustment Residual(Cov.Adj.)模型分别何时在因果分析时不适用(Maris, 1998),发现第二种”RTMA”在学校增值分析的场合可以解读成Gain模型和Cov.Adj.模型的选择问题。有Artifact幻觉的情形只是因为应当用 Cov.Adj.而不应当用Gain。而这种应当不应当也可以从数据和模型的是非以逻辑跷跷板的方式变成统计结果解读(Interpretation)的是非,同样的模型和数据,同样的估计结果,可能被用于恰当的解读和不恰当的解读。比如,学生入学后的Gain Score和学校录取线负相关,被解读成高录取线学校的好学生成绩回归总体均值,这种解读就和Gain模型匹配;如果解读成同样入学成绩的两个学生在不同学校成绩变动会不同,这种解读就和Gain Score模型冲突。这个Interpretation的微妙处,还是从新版Educational Measurement手册开篇的Validation章节读出来的心得(Kane, 2006)。那篇文章强调,Validation的对象是Interpretation而不是测量结果。但是翻查Marsh & Hau(2002)论文对Lord Paradox的引用部分,会发现这个心得其实早已是老生常谈。
这两周备课,想讲一些有限理性在量化方法本身的心理学原理,读到Suppes, P. 1974年回应Tversky提出的五点量表式俭约概率的公理化模型(Salsburg, [...]

Tagged