Skip to content

{ Category Archives } Chinese

可改进翻译的统计术语歧义

a sample: 一个样本(a case?) > 一组抽样
two sample t test: 两样本t检验(two cases ...?) > 两组样本t检验
sample size: 样本大小(case scale?) > 样本组容量
central tendency: 集中趋势(non-dispersion?) > 中心趋势
dispersion: 离散(discrete?)趋势 > 分散趋势
SD=standard deviation: 标准方差(..variance?) > 标准离差
df=degrees of freedom: 自由度(size of freedom?) > 自由维度(dimensions of freedom)

转载:公益广告一枚(已更新)

转载声明:
1. 授权72pines.com的管理员在判断有必要的情况下将本文转为private.
2. 我还没有试用文中推荐的技术,转载不表示对该技术的适用性背书[update]试用体验甚好,速度优于我目前所用的中文大学vpn,自动切换效果尤佳。
SSH-D服务已终止,详见提供方的说明,下文过期部分已更改文本为灰色。下文推荐的替代品是Puff圣诞版,支持IE、更支持Firefox+Autoproxy。
3.题图T恤亦为转载广告,链接指向淘宝卖家,是否公益待考。图为男款,亦有女款。卖家声称断货,疑为淘宝和谐。有意购买宜直接询问卖家。
 

 

转自:http://docs.google.com/View?id=ddtsdhbg_1frwvsrgg
翻墙组合Firefox+Autoproxy+Puff的使用
 
一、准备工作
1、  下载最新版的Firefox浏览器,猛击此处;
2、  Autoproxy可在安装完Firefox后在组件中心找到;
3、  下载最新版的Puff(当前最新版为圣诞版),猛击此处;
二、开始安装
   1、Firefox的安装:双击下载好的程序,出现安装页面,直接下一步,如图

到此步单击“安装”后程序开始安装,请在安装完成后运行firefox浏览器。
2、安装autoproxy
   运行firefox浏览器后,在工具栏选择“工具”—“附加组件”,如下图
 

在出现的附加组件对话框的搜索栏输入“autoproxy”并单击搜索栏右侧放大镜图标

然后单击上图的“查看全部结果”。
回到firefox浏览器查看自动打开的搜索结果页面,如下图

先选中“让我安装这个试验性附加组件”,然后单击“添加到Firefox”。

安装结束后请单击下图中的“重新启动Firefox”按钮。

Firefox重新启动后,浏览器将自动弹出两个页面:Autoproxy的设置页面及附加组件的设置页面,如下图

选中上图的“gfwList”并确定。附加组件的设置如下图

至此,Autoproxy安装配置完成。
4、  安装Puff,一直Next,期间可选择在桌面建立图标及安装完成后运行程序,如图

运行Puff后点击“connect”,如下图
 

到此步,Firefox已经能通过Puff代理,在Autoproxy的指引下,识别你输入的网址是否需要翻墙了。如果Firefox在这种情况下依然无法打开你需要的网页,那么你可能需要在Autoproxy的gfwList里添加新的规则,具体操作如下:

全文完
 
 
 
本文将提供一种一劳永逸的翻墙方式(ssh -D),实施之后,那道墙——对你来说——将从此透明。
本文面向的用户:使用Windows作为操作系统并且使用Firefox作为常用浏览器。
第一步:免费获取拥有SSH权限的帐号和密码。
默认的免费获取方式:将本文转载到你自己的博客上,将转载后的文章网址发送到。
注意:转载前请先确认自己是(或曾是)一名blogger(博客),否则将会浪费彼此的时间。
转载方式:拷贝文章代码至博客后台HTML编辑器中,直接发布即可,文章标题自拟,可在前后文插入自己的评论。
经过人工审核,你将收到一封附有五个拥有SSH权限的帐号和密码的电子邮件,你可以将它们赠与你信任的人。
更多获取方式将在今后陆续激活,请关注我们的最新更新:https://friendfeed.com/fuckgfw
第二步:配置MyEnTunnel软件
下载并安装MyEnTunnel,该软件全名为My Encrypted Tunnel。
一键下载:https://dl.getdropbox.com/u/873345/download/myentunnel.exe

按照上图将第一步收到的帐号信息填写到相应的地方后,点击按钮,再点击按钮。
第一次连接过程中会出现一个认证对话框,按照提示确认即可。以后的自动连接中将不再出现此认证对话框。
最后点击按钮,使对话框隐藏到系统任务栏中。
提示:
为MyEntunnel创建一个快捷方式,将其复制到系统的【启动】(C:\Documents and Settings\当前用户名(需要修改成你自己的)\「开始」菜单\程序\启动)文件夹中,今后开机便可自动启动软件,并自动连接服务器。

绿色代表连接成功且稳定;黄色代表正在连接或重新连接;红色代表连接失败。
第三步:配置Firefox浏览器
假设你正使用Firefox浏览器阅读本文。
一键安装:http://autoproxy.mozdev.org/latest.xpi

点击立即安装,安装后,重新启动Firefox。然后你会看到如下对话框,选择gfwlist (P.R.China)后,点击确定。

接着你会看到Firefox主界面右上角出现有一个“福”字图案,点击“福”。

点击“代理服务器——编辑代理服务器”。

随即出现如下画面,你会看到如GAppProxy、Tor和Your Freedom这样一系列代理服务器名称。

将GAppProxy一栏的参数修改为如下图所示。

修改完毕后,点击确定。至此配置已全部就绪。
获取更多帮助,请关注反馈中心:https://friendfeed.com/fuckgfw-feedback

第四步:支持fuckGFW

如果您翻墙成功,请大笑一声并用充满磁性地低音说出:Hello, world!
如果由于线路原因,始终翻墙不成,不要气馁,给我们发Email,咱们一起解决问题。
假如哪天突然无法正常连接,请先到反馈中心汇报,我们会及时做出反应。
目前您有如下几种方式及时获取我们的最新动态:FriendFeed | Twitter | Blog。
保持默契,我们相信您一定可以做到。

版权信息:您可以自由复制、传播、演绎本作品且无需署名、无需注明原始出处。

《结构方程模型及其应用》(侯, 温, & 成,2004)部分章节R代码

用John FOX教授的sem包试写了这本教材的几个例子,结果都与LISREL8报告的Minimum Fit Function Chi-Square吻合。不过LISREL其它拟合指标用的是Normal Theory Weighted Least Squares Chi-Square ,所以看上去比Minimum Fit Function Chi-Square报告的结果要好那么一些些。LISREL历史上推的GFI/AGFI曾因为经常将差报好被批评,圈内朋友私下嘲笑这样LISREL就更好卖了,买软件的用户也高兴将差报好,只有读Paper的人上当。
目前只写了chap3_1..到Chap3_2_...,一共5(或6)个例子。尺有所短,寸有所长--sem包不会自动报告所有修正指数,不能做样本量不一样多的多组模型,对复杂的模型要写的代码太多。不过,在已经尝试的几个例子里,有一个是LISREL跑不出来但sem包能跑出结果的。目前sem包还没有达到结构方程众多商业软件的成熟水准,但R庞大的义工武器库已经使sem包至少已经在Missing Data Multiple Imputation、Bootstrapping等等应用上胜出一筹。所以例子中还附带了缺失数据一讲Multiple Impuation的R示范代码。
欢迎各位有兴趣作类似尝试的同学将结果email我, 可以陆续更新到下面的GPL版权代码集合中。
代码下载:lixiaoxu.googlepages.com (中大镜像)
[update] AMos, Mplus 与 SAS/STAT CALIS 缺省报告与使用的都是 Minimum Fit Function Chi-Square,可通过各种软件(Albright & Park, 2009)的结果对比查验。Normal Theory Weighted Least Squares Chi-Square并非总是比Minimum Fit Function Chi-Square报告更“好”的拟合结果(虽然常常如此)。Olsson, Foss, 和 Breivik (2004) 用模拟数据对比了二者,确证Minimum Fit Function Chi-Square计算得到的拟合指标在小样本之外的情形都比Normal Theory Weighted Least Squares Chi-Square的指标更适用。
R的sem包目前在迭代初值的计算上还做得不够好。我遇到的几个缺省初值下迭代不收敛案例,将参数设定合理范围的任意初值(比如TX,TY都设成0-1之间的正实数)之后都收敛了。
--
Albright, J. J., [...]

Tagged ,

Paper for 1st Chinese useR! Conference: Web Powered by R, or R Powered by Web

欢迎在本部的同学明天上午到现场看李崇亮同学演示,地点见会议主页
论文下载(Googlepages, 中文大学镜像)
RWebFriend for Wordpress 在线示例(yo2.cn上的示例,  奇想录上的临时示例)
Google Presentation 在线演示

[update2009.07.11]文中MediaWiki与R集成的实验平台已不再开放编辑权限,原例转到另一个平台上(界面是西班牙语,找不到英语界面的平台)。希望能有帮手提供linux服务器自建一个平台。

Tagged ,

气泡图击败Data Snoop

转自:泡网
Data Snoop, 民科的神奇直线(google 始作俑者):

气泡图,数据击败Data Snoop:

R tip:
n=20;plot(rnorm(n),rnorm(n),cex=sqrt(abs(rnorm(n)))*10,pch=1,col=1:n);

Tagged ,

R: str(…) 与 getS3method(…,…)

感谢R专家XIE Yihui同学在线答疑

me: 请教两个R的技术:1.R中有没有对象浏览器之类的工具?一举看完一个对象的子子孙孙 2.怎么看深入的源代码> prcomp
function (x, ...)
UseMethod("prcomp")
<environment: namespace:stats>
Yihui: 1. str()是很常用的一个函数,它可以充分查看对象的子子孙孙 2. 很多函数要么是S3 method,要么是调用C code,所以一般不能直接看源代码
S3 method可以用getS3method()去查看,比如prcomp就是S3方法,那么可以看它的default方法是什么:
> getS3method('prcomp','default')
function (x, retx = TRUE, center = TRUE, scale. = FALSE, tol = NULL,
...)
{
x <- as.matrix(x)
x <- scale(x, center = center, scale = scale.)
cen <- attr(x, "scaled:center")
sc <- attr(x, "scaled:scale")
if (any(sc == 0))
stop("cannot rescale a constant/zero [...]

Tagged ,

[二度更新并推荐]愉快地发现SciTE和LyX在WinXP下都支持中文

愉快地发现我在WinXP上最常用的编辑工具SciTE(当前版本1.75) 和 LyX(当前版本1.5.3) 都支持unicode(也就是说,支持中文)。之前不了解,只因为缺省设置不支持中文。需要手工操作修改设置。
SciTE的设置是Options->Open Global Options File,编辑SciTEGlobal.properties,找到如下段落
# Unicode
#code.page=65001
code.page=0
#character.set=204
# Required for Unicode to work on GTK+:
#LC_CTYPE=en_US.UTF-8
#output.code.page=65001
修改为
# Unicode
code.page=65001
#code.page=0
character.set=204
# Required for Unicode to work on GTK+:
LC_CTYPE=en_US.UTF-8
output.code.page=65001
保存。然后关闭再打开SciTE,就会发现不再出现中文被切一半的现象。如果编辑的文档格式不是utf-8而是ucs-2 ,还可以在File->Encoding 里临时选。
[update] 除了utf-8, SciTE 还支持国内更常用的GBK码,设置如下:
code.page=936
output.code.page=936
character.set=134
此外,我还推荐把SciTEGlobal.properties文件中的line.margin.visible=1 和 wrap=1 两处的注释#号去掉,效果是缺省显示行号,并使超长的行折行显示。SciTE的优点太多了--开源免费;轻巧,启动快;支持Ctrl+鼠标中轮滚动无级缩放;支持Ctrl+回车 前文已出现过的拼写自动补齐选项;支持Alt键方形选段;...
LyX(版本>=1.5.1)在winXP已经可以在.lyx文件正文和公式框中录入中文。麻烦的是输出中文的pdf。[UPDATED update]LyX的最新版本(1.6.2)捆绑MikTeX的安装包已经对中文(unicode)支持得很好了。感谢楼下joomlagate先生email给我的情报:http://cohomo.blogbus.com/logs/31361739.html 的后半篇介绍了通过XeTeX输出pdf的简单设置。我今天试了一下,效果非常理想。
[update]公式框中的中文只需要再ctrl-M一次即可。例如,\frac{\mbox{分子}}{\mbox{分母}}可以输出,而\frac{分子}{分母}不行。
新版本LyX已经引入了文档版本控制,相当于word中的revision功能,有待深入试用。目前LyX仍不[update]已经支持Ctrl+鼠标中轮滚动无级缩放,如果公式显得太小,需要在菜单设置中修改显示缩放比例:Tools->Preferences->Look and feel->Screen fonts->Zoom %。这可能是比较容易在后续版本中实现的功能。
相关网址:
SciTE主页 http://www.scintilla.org/SciTE.html
LyX主页 http://lyx.org/
南开MiKTeX中文插件 http://miktex.math.nankai.edu.cn/

LyX中设置XeTeX中文支持的介绍: http://cohomo.blogbus.com/logs/31361739.html
我为Wordpress / Wordpress MU 系列平台制作的支持暗背景LaTeX小插件 http://lixiaoxu.lxxm.com/latex_math_cgi

Tagged , ,

自由度的几何:对截距项投影残差向量的长度平方

这是《相关系数的几何:对截距投影的残差向量之间交角余弦》示意图,恰好可以用于解释为什么满足的分布df是n-1而不是n。
其中且 是n维空间中的标准正态随机向量。那么,容易知道有。这个表达式就是向量长度的平方。我们已经知道,就是在截距向量(日晷指针)上的投影。自然,就是对截距项投影残差向量,也就是在日晷盘上的投影。
日晷所处空间的n是3。如果我们对抽样许多次,就会看到三维空间中各个方向对称的标准正态分布散点图。这些散点图在日晷盘上的投影就是二维空间标准正态分布散点图。日晷盘中这些点对应向量的长度平方自然是的抽样。

Tagged ,

习题:一类错误的注水

一个研究者每次都先看一下计算出的统计量再决定对零假设做单尾检验还是双尾检验。如果统计量,就设对立假设为;如果统计量,就设对立假设为。假如他的请问他真实的一类错误率是多少?具体说,有许多次的实验,真实情形都是,他能检验出显著拒绝的比例会趋近于多少?

Tagged

读汪丁丁《为中国股民找一个理由》所想到与读到

汪文注明首发《IT经理世界》,我读于CCER新闻。特别摘出部分:
...当代中国人生活在千年未有之变局之内,经历着三重转型同时发生的阶段,所以,每一中国人的未来,充满着奈特意义上的不确定性。这种不确定性是不可预期且不可重复的,当代实验经济学家称之为“ambiguity”,以区分于“risk(风险)”。
股票市场固然风险很高,可是,我们综观股市之外的种种生活,风险何尝不高呢?与其走出股市得一人生之幻灭,为何不走入股市搏一幻灭之人生?或者,用经济学的术语再说一遍:股市之外的高风险人生,却并不带来相应的高回报。大众纷纷进入股市,是因为他们知道在那里承担风险至少有带来相应回报的可能性。也就是说,与其终生储蓄在银行里并希望渺茫地预期不断上涨的养老、医疗、住房、教育和日常生活的费用不至于完全侵蚀了他们微不足道的储蓄,不如以这微不足道的储蓄充当投资股市的本钱,反而是更富理性的选择。
...
这涉及到我备课过程中原先没意识到也许密切关联的两个论题。第一是奈特/Knight(1921)的可测度的Risk和不可测度的Uncertainty的区分。汪文第二段中的“风险”显然是Uncertainty而不是Risk。有意思的是,不可测度的Uncertainty却是可比较高低的(这不是汪的创见,而是Knight原著的意见)。用心理计量学术语,Uncertainty不是scale变量,但却是ordinal变量,而且很可能还是连续的ordinal变量。
Knight原著并不易读。甚至只是翻查《新帕尔格雷夫经济学大辞典》1987版1996中译本的Uncertainty和Knight辞条,就已经令人云里雾里。其中Knight辞条执笔者是G. J. Stigler,他对Knight在Uncertainty上的“贡献”略有微词。Knight原著第7章注解1也小心的指出他打算规避认识论/知识论的讨论。这给我的感觉就好比:讨论一个被定义为“本质上不可讨论的对象”的对象。须知Uncertainty在Knight原著中唯一的内涵就是不可测度,于是所有对它的减少(eliminate)都是对它的否定。一旦比较它有多么地“不可测度”,就是在否定“不可测度”的本质。从罗素悖论的经验,我实在怀疑“不可测度性”程度的比较注定要引出悖论。
这便引出与之相联系的第二个论题:“主观概率”。在Uncertainty辞条中Knight的角色只是一笔带过,而主观概率才是更实质的关键词。似乎很根本的一个问题是:如果我们“完全地、本质地”不知道一个随机分布,在何种程度上能或者不能建立起一个有普遍意义的主观概率分布?--也许读懂辞条后,初学者的问题会自然消解。
--
Knight, F. H. (1921). Risk, Uncertainty, and Profit. Boston, MA: Hart, Schaffner & Marx.

Tagged