台湾高校2018陆生报考心得——附文史类校系录取分排序

撰文 & 制表:知乎@熊爸

月初某亲友高考报志愿,深度参与全程。其中,「陆联招(台湾高校面向浙、闽、辽、粤、沪、苏、鄂、京八省市联合招生)」基本可以理解为「比提前批更提前的提前批」。报考复盘,笔记若干心得,推算了文史类招生单位的录取分大致排序,希望对这八个省市考生和家长有所帮助。

  • 招生单位是院系(专业、班级)而不是学校

大陆高考志愿先报学校,学校里再定专业。台湾高校招生却只以具体专业(院系、班级)为招生单位。比如:可以报第一志愿台大国际企业系、第二志愿清华「学士班」(大二开学再决定院系的招生班级)、第三志愿台大图书资讯系。学校并不是招生的单位。大陆高考的校内专业调剂是个很大的坑,陆联招完全没有校内调剂概念。

陆联招严格以语数外三科加权分为序,文综理综成绩权重为零。文史与理工的招生计划严格分开,相比理工类,文史类的总人数和专业选择明显受限。录取线靠前名次的院系往往在文史类只招一名——不是每个省市一名,是八个省市总共只招一名。

同一学校不同系(专业、班级),各科算分权重并不相同。两个考生可能在不同系的加权分名次交错。下表是2018年陆联招文史类院系录取线的大致排序,第三列是某有代表性的考生计算出的加权分除以该院系的加权录取线。这位考生总分大致在最差几所211高校录取线和最好几所非211高校录取线的重叠地带。如果这位考生在语数外三科的成绩此消彼长,可能导致下表顺序局部变化。

截图只列到前66个院系招生单位,完整表格(2018陆联招文史类录取难度参考)包含234个院系招生单位。

  • 录取程序

平行志愿保证了招生院系不知道学生的志愿顺序信息。考生和家长有两个报考决策点,在第一个决策点,要决定院系意向的偏好顺序,还要考虑放弃哪些比较确信没希望的靠前院系。虽然总的志愿位置非常多,但国立大学院系志愿只限报十个。如果你乐意入读的国立大学院系超过十个,可以把明确没有希望的靠前院系放弃,还可以把中间段个人偏好顺序与历史经验顺序明确交错的院系放弃。任何一个院系如果列你为正取,将导致你的志愿列表其后所有项目自动失效。比如,某考生如果想与台南恋人团聚第一志愿选成功大学经济系,ta就不应该再把台大国际企业系报在第二志愿浪费一个宝贵的国立大学志愿位置。

在正取/备取/未取的结果出来后,考生通常将看到若干备取信息,如果运气好,还会有一个押后结尾的正取。此时考生与家长面对第二个决策点:接受哪些正取、备取项目。未接受的项目等同于之前没报。考生可以在前一个决策点不必考虑自己能接受的最不理想院系,而在第二个决策点专注于这个抉择。如果接受的项目最终录取,考生的档案不再进入当年的大陆高考招生系统。如果所有接受的项目都未录取,考生的档案自动进入当年的大陆高考招生系统,等同于未参加陆联招。

第二个决策点不免有一些考生放弃正取项目,于是带来递补的变动,紧跟后面的备取学生在这个变动中升为正取,升迁的考生原先更靠后的正取(以及备取)志愿自动失效,引发多米诺骨牌的递推效果。这个报考决策点能作的决策不多,却面对大量的信息披露。所有院系都会公布正取、备取全序列的考生学号成绩信息(只匿姓名)。只要愿意去推敲,可以整理出所有考生正取、备取的全部项目。比如,今年台师大教育学正取的考生,出现在台大国际企业第九备取和清华学士班第六备取,未出现在其它校系的备取列表。其他考生也许可以从中推测自己从备取升迁的机会,然而这个信息对陆联招这个系统内的决策并没有任何助益,除非考生和家长需要在这个阶段面对陆、台高考招生之外(比如英美高校)的 Offer Deadline。

最后会统一披露所有院系录取的加权最低分。因为不同院系三科权重不同,这个最低分在权重相同的招生单位之间可以严格比序,权重不同的招生单位只能大致比较。

  • 背景与盲区

台湾传统强校有所谓四大(台成清交)四中(中央中兴中山中正),与985对标的「五年五百亿」对前7所大学的资助比例最初为30:17:10:8 : 6:4:6。中正大学偏重教学而非科研,初未入选,不过仍然入选了「五年五百亿」的后继「高教深耕计划」。近年8校资助比例变为180:110:100:100 : 41.5 : 35.2 : 25.3 : 16.3。主打文科的政治大学虽然经费、科研不显于主要排名,但文科生源历年紧追台大稳居第二,所以台企招聘应届生有「台-政成清交」的说法,犹如大陆之「清北-复交」。台北的台湾科大、台湾师大、阳明大学也不错,生源看齐桃园的中央大学,可能还稍胜一筹。新竹清交二校校园比邻,几度筹议合并未遂,近年与中央大学、阳明大学四校共组「台湾联合大学系统」,打通招生选课、辅修转系、校车后勤,以「台联大(系统)」的名义组建若干新研究所,还设有单一的系统总校长职位。与台联大系统类似,台南的成功大学与台中的中兴大学、高雄的中山大学、嘉义的中正大学组建了「台湾综合大学系统」;这两个系统的共同假想敌台湾大学也与校园比邻的台师大、台科大组建大学系统,直接冠名「台大联盟」。不过,远在猫空山脚的政治大学在2016年横刀夺爱,与图右的台科大发布了婚约(合并愿景联合声明),娱乐媒体报道标题曰「台大校长『不care』」。

以上这段点评就落入大陆家长最常见的盲区:脱离专业谈学校。具体到了专业,学校竞争顺序就有变化。专业之间的生源落差不亚于学校之间,即使一家独大如台大也不能象北大清华那样地成批掐尖靠前名次考生。大类的专业比较,文史类生源无疑商科法科最受欢迎,其次外语,再次则中文社科。台师大的教育学系历年都比同校的英文系更易考取,今年是唯一的例外。政大的传播学院(大一大二不分系)有商科成份,包含政大全台第一的广告学系。新竹清华学士班有两个悬疑未作书面披露:大二分系是否文理打通?是否可能落到近年新合并的师范学院(原新竹教育大学)?我个人怀疑前者肯定,后者否定。如果后者不方便书面说明,其实应该披露往届文史类陆生的大二分系记录。

大陆家长第二个可能的盲区是「选城市」。台湾作为发达地区,其城乡之别不同于幅员辽阔不平衡发展中的大陆。比如,若对比嘉义和高雄,两个城市本身如何并不重要,真正要考量的是它们到台北市区的通勤时间。又比如,台湾南边的高雄医科大学到北边的台湾大学,包括步行的点对点公共交通通勤时间是2小时50分,而上海交通大学闵行主校区到复旦大学邯郸主校区包括步行的点对点公共交通通勤时间也是2小时50分。如果大台北都市圈(台北、新北、基隆、桃园、新竹)对标整个上海,新竹可对标闵行,而大台北都市圈以外的台湾城乡可对标上海之外的长三角包邮国。台湾也不存在大陆的应届生户口问题,台南的成功大学毕业生仍然以大台北都市圈为毕业工作的第一选择,留在台北的机会与同一档的大学(政、清、交)没有差别。具体到陆生,毕业后并不能申请台湾工作签证,除非因为婚姻入籍本地。

大陆家长的第三个盲区或许是国立私立之别。最好的私立大学即使王牌专业,生源也只能看齐第二梯队国立大学的弱势专业。大多数私立大学都有一些差专业,本地生源类似大陆本二、本三,所以私立大学的陆生与国立大学的陆生对台湾同学的观感反差很大。前述表格中,前十名校系无一私立,紧随其后最好的两所私校东吴、辅仁都是教会大学,民国时代就已声教远播。东吴大学商、法学科所在的城中校区地段优越,正对台湾高等法院和「最高法院」,距离「总统府」不到100米。辅仁大学名义直属梵蒂冈教廷,校区在新北市(原台北县)临近新庄地铁站,或可对标上海宝山区临近杨浦区的长江南路站。除了生源落差,国立与私立比较明显的落差还有师资,私立大学的教师比国立大学少了一整块退休金。

今年的陆联招文史类校系靠前排名还出现了几个艺术类专业,比如(实践大学)服装设计、(中原大学)室内设计、(国立台湾艺术大学、国立台北艺术大学)电影创作。台湾的文化创意产业社会声望与大陆不可同日而语。许多大陆家长对文创从业者有负面的刻板印象,觉得写程序脚本才是学霸,写电影脚本就不是,拍电影的就更是文化课的学渣,担心孩子如果去这些校系念书会坏了名声。不过,大陆一二线城市的一些考生观念已经有所不同,在他们眼中,艺大(国立台湾艺术大学)电影系校友侯孝贤、李安的文化光环比台大电机系校友傅京孙、洪小文更为耀眼。就我私见,电影系的剧本专业毕业去向至少不亚于通常的国文系,还可以进入市场蓬勃发展的游戏设计产业。未来几届,最好的电影系生源应该向最好的新闻传播院系看齐。

  • 延伸阅读

此前写过三个与高考招生有关的回答,鼓吹三个观点:1. 科学测评自身人格优势选专业;2. 采集毕业去向基础数据、求教具体专业老司机避免望文生义想象脱离现实; 3. 长期发展锁定首位城市

10^6 digits of π & e vs quantum random numbers

Photo from Wikipedia: Pi/Pie

10^6 digits of π & e : pi&e.csv



If you prefer quantum randomness to pseudo-randomness, run the following code powered by ANU Quantum Random Numbers Server.



2015/05/02 Fu Jen Univ. Talk

PPT for Fu Jen Univ. Talk:  20150502.FJU
Screen Shot 2015-05-02 at 12.52.04

Related materials:

 

Abstract

In his seminal book Flow, Csikszentmihalyi described the experience of close interaction with some Other. Its Chinese translator interpreted it as Big Self, which is a Buddhist term too.  This early concept finally developed into cosmic self / quantum self in Csikszentmihalyi’s following volume The Evolving Self. Inspired by it, Flow can be understood as the lasting self beyond the short-term memory period. Daniel Dennett’s Multiple Drafts Model regarded self as the derivative on the gravity center of parallel narrative contents. This talk tried to extend the model to deliberate the stable and lasting gravity center of lengthy narratives and the conscious contents themselves exceeding body limits. Furthermore, the three selves defined on current / flow / eternity are found isomorphic to Seligman’s triple happy lives of pleasure / engagement / meaningfulness in positive psychology.

張定綺之 Flow 中譯本「當下的幸福」以佛教詞匯「大我」意譯原文之  (close interaction with)  some Other,註意到原著此概念雖未明文而呼之欲出,終以 cosmic self / quantum self 二詞見於原作者後出之著作 The Evolving Self。此概念啟發將 Flow 體驗主體解讀為跨越短時記憶時間限度穩定延續之意識自我。如依據 Daniel Dennett 之 Multiple Drafts Model,意識自我派生于多重並行第一人稱敘述內容重心。筆者嘗試將該模型之短時記憶時間限度擴展,以延續時間多重並行敘述內容之高度一致性解讀心流。推而廣之,以敘述內容重心超越日常生活身體限度解讀「大我」。進而,以短時記憶時間限度、持續時間、超越時間限度之三種意識自我解讀Seligman積極心理學之愉悅、沈浸 (engagement) 、意義三重幸福框架。

 

Coerce RStudio to output plots in a new window

Update: It is easier. Credit: John K. Kruschke

PC:

windows()

 

Mac:

quartz()

* Powered by XQuartz (dmg). X11() on Mac does not support BetterTouchTool.

Linux:

X11()

==The following is obsolete==
The trick is to use Rcmdr to create the new diagram window.
library(Rcmdr);plot(1,type='n');
Then the following plots by r codes in rstudio will be coerced to output in the new window.
Both rstudio for Mac and for Windows support the trick.

sem::cfa(…) is elegant

Prof. John Fox's sem package provided an elegant interface to define CFA and general SEM models. The following is an example given by Dr. K-T Hau's SEM course at coursera and his textbook (chap1_2).

library(sem) #R v322; sem v3.1-6
options(fit.indices=c("RMSEA","CFI","SRMR","AIC","BIC"))

# First of all, do not forget to provide the sample size
N=100 
# Then correlation matrix
cor.Item <-readMoments()
1.00
0.12 	1.00
0.08 	0.08 	1.00
0.50 	0.11 	0.08 	1.00
0.48 	0.03 	0.12 	0.45 	1.00
0.07 	0.46 	0.15 	0.08 	0.11 	1.00
0.05 	0.44 	0.15 	0.12 	0.12 	0.44 	1.00
0.14 	0.17 	0.53 	0.14 	0.08 	0.10 	0.06 	1.00
0.16 	0.05 	0.43 	0.10 	0.06 	0.08 	0.10 	0.54 	1.00


# Fixed factor variances with reference.indicators=F
model.cfa <- cfa(reference.indicators=F)
F1: X1, X4, X5
F2: X2, X6, X7
F3: X3, X8, X9

# Results
sem.cfa <- sem(model.cfa,cor.Item,N=N)
summary(sem.cfa)

# More details
## The model and the data
model.cfa
print.table(cor.Item)

## Histogram &amp;amp; density of the correlation values
hist(cor.lower <- cor.Item[row(cor.Item) > col(cor.Item)],freq=F,breaks=10,
     xlab='Correlation',col='grey');
rug(jitter(cor.lower),col='red')
lines(density(cor.lower),col='blue',lty=2)

## Highlight those  > 0.4 correlations
library(ellipse)
plotcorr(cor.Item,col=grey(1-abs(cor.Item)),type='lower',diag=T);

## In a grouped order
idx <- c(1,4,5,2,6,7,3,8,9)
plotcorr(cor.Item[idx,idx],col=grey(1-abs(cor.Item[idx,idx])),diag=T);

One more example (Chap3_1_2 Model A, B, & C), to demo usage of modification indices and GraphViz --

library(sem) #R v322; sem v3.1-6
options(fit.indices=c("RMSEA","CFI","SRMR","AIC","BIC"))


cor.17 <-readMoments(text="
1
.34 1
.38 .35 1
.02 .03 .04  1
.15 .19 .14 .02  1
.17 .15 .20 .01 .42  1
.20 .13 .12 .00 .40 .21  1
.32 .32 .21 .03 .10 .10 .07 1
.10 .17 .12 .02 .15 .18 .23 .13  1
.14 .16 .15 .03 .14 .19 .18 .18 .37  1
.14 .15 .19 .01 .18 .30 .13 .08 .38 .38  1
.18 .16 .24 .02 .14 .21 .21 .22 .06 .23 .18  1
.19 .20 .15 .01 .14 .24 .09 .24 .15 .21 .21 .45  1
.18 .21 .18 .03 .25 .18 .18 .18 .22 .12 .24 .28 .35  1
.08 .18 .16 .01 .22 .20 .22 .12 .12 .16 .21 .25 .20 .26  1
.12 .16 .25 .02 .15 .12 .20 .14 .17 .20 .14 .20 .15 .20 .50  1
.20 .16 .18 .04 .25 .14 .21 .17 .21 .21 .23 .15 .21 .22 .29 .41  1
")

# Fixed factor variances with reference.indicators=F
# Fixed the 1st loading with reference.indicators=T

Chap.3_1_2_A <- cfa(reference.indicators=T,text="
eta1:X1,X2,X3,X4
eta2:X5,X6,X7,X8
eta3:X9,X10,X11
eta4:X12,X13,X14
eta5:X15,X16,X17
")
Chap.3_1_2_A #检查模型是否固定负荷放开方差
# 
(sem.3_1_2_A <- sem(Chap.3_1_2_A,cor.17,N=350))
# sem.3_1_2_A 对象都有哪些属性?
(sum.3_1_2_A <- summary(sem.3_1_2_A))
# sum.3_1_2_A 对象都有哪些属性?

# modification indices
modIndices(sem.3_1_2_A)
summary(modIndices(sem.3_1_2_A))

# Find the small parameters
sum.3_1_2_A$coeff[order(abs(sum.3_1_2_A$coeff[,1])),]
sdc.3_1_2_A <- standardizedCoefficients(sem.3_1_2_A)
sdc.3_1_2_A[order(abs(sdc.3_1_2_A$`Std. Estimate`)),]
# Highlight the non-significant parameters
sum.3_1_2_A$coeff[sum.3_1_2_A$coeff[,4] >=.05,]


# The alternative models, delete X4 and load X8 from eta1 rather than from eta2
Chap.3_1_2_B <- cfa(reference.indicators=T,text="
eta1: X1, X2, X3, X8
eta2: X5, X6, X7
eta3: X9, X10,X11
eta4: X12,X13,X14
eta5: X15,X16,X17
")

Chap.3_1_2_C <- cfa(reference.indicators=T, text="
eta1: X1, X2, X3, X8
eta2: X5, X6, X7, X8
eta3: X9, X10,X11
eta4: X12,X13,X14
eta5: X15,X16,X17
")
cor.16 <- cor.17[rownames(cor.17)!='X4',colnames(cor.17)!='X4']

# Results
sem.3_1_2_B <- sem(Chap.3_1_2_B,cor.16,N=350)
(sum.3_1_2_B <- summary(sem.3_1_2_B))

modIndices(sem.3_1_2_B)

sem.3_1_2_C <- sem(Chap.3_1_2_C,cor.16,N=350)
(sum.3_1_2_C <- summary(sem.3_1_2_C))
modIndices(sem.3_1_2_C)

# Model Comparision
## Embedded models
anova(sem.3_1_2_B,sem.3_1_2_C)
## Non-embedded models
AIC(sem.3_1_2_B) - AIC(sem.3_1_2_A)
sum.3_1_2_B$AIC - sum.3_1_2_A$AIC

# Path Diagram, ignoring dual-headed arrows 
# View the diagram in RStudio Viewer 
pathDiagram(sem.3_1_2_B,ignore.double=T)

# RMSEA 
sum.3_1_2_B <- summary(sem.3_1_2_B)
sum.3_1_2_B$RMSEA
(I.16 <- diag(diag(cor.16)))
summary(sem(Chap.3_1_2_B,cor.16+0.02*I.16,350))$RMSEA


## Histogram & density of the correlation values
hist(cor.lower <- cor.17[row(cor.17) > col(cor.17)],freq=F,breaks=10,
     xlab='Correlation',col='grey');
rug(jitter(cor.lower),col='red')
lines(density(cor.lower),col='blue',lty=2)

## Fixed Var vs Fixed Weight
(Chap.3_1_2_B.V <-cfa(reference.indicators=F,text="
  eta1: X1, X2, X3, X8
  eta2: X5, X6, X7
  eta3: X9, X10,X11
  eta4: X12,X13,X14
  eta5: X15,X16,X17
"))
sem.3_1_2_B.V <- sem(Chap.3_1_2_B.V,cor.16,350)
sum.3_1_2_B.V <- summary(sem.3_1_2_B.V)
sum.3_1_2_B.V$chisq
sum.3_1_2_B$chisq

## Highlight those  > = 0.3 correlations
library(ellipse)
plotcorr(cor.17,col=grey((cor.17<.3)),type='lower',diag=T);

## In a grouped order,in darker colors
idx <- c(c(1,2,3,8),5:7,9:17,4)
cor.17.FU <- (cor.17-diag(diag(cor.17))+t(cor.17))[idx,idx]
plotcorr(cor.17.FU,col=grey((1-abs(cor.17.FU))^2),diag=T);
abline(v=(vh <- c(4,7,10,13,16)+.5),lty=2,col='red')
abline(h=18-vh,lty=2,col='red')

#####################
#####################

cor.5 <- readMoments(diag = F,text="
  0.418			
  0.407	0.48		
  0.547	0.469	0.481	
  0.422	0.458	0.443	0.496
")
(pc.5 <- princomp(covmat =cor.5 ))
screeplot(pc.5)
abline(h=1,lty=2)


(Chap.3_4_2<- cfa(reference.indicators=T,covs = paste('eta',1:5,sep = ''),text="
eta1: X1, X2, X3, X8
eta2: X5, X6, X7
eta3: X9, X10,X11
eta4: X12,X13,X14
eta5: X15,X16,X17
xi:eta1,eta2,eta3,eta4,eta5
"))

summary(sem.3_4_2 <- sem(Chap.3_4_2,cor.16,N = 350))
pathDiagram(sem.3_4_2,edge.labels = 'v')
anova(sem.3_4_2,sem.3_1_2_B)

###############
###############

cor.18 <- readMoments(names = c(paste("y",1:9,sep=""),paste("x",1:9,sep = "")),diag = F,text = "
0.68																
0.60	0.58															
0.01	0.10	0.07														
0.12	0.04	0.06	0.29													
0.06	0.06	0.01	0.35	0.24												
0.09	0.13	0.10	0.05	0.03	0.07											
0.04	0.08	0.16	0.10	0.12	0.06	0.25										
0.06	0.09	0.02	0.02	0.09	0.16	0.29	0.36									
0.23	0.26	0.19	0.05	0.04	0.04	0.08	0.09	0.09
0.11	0.13	0.12	0.03	0.05	0.03	0.02	0.06	0.06	0.40
0.16	0.09	0.09	0.10	0.10	0.02	0.04	0.12	0.15	0.29	0.20
0.24	0.26	0.22	0.14	0.06	0.10	0.06	0.07	0.08	0.03	0.04	0.02
0.21	0.22	0.29	0.07	0.05	0.17	0.12	0.06	0.06	0.03	0.12	0.04	0.55
0.29	0.28	0.26	0.06	0.07	0.05	0.06	0.15	0.2	0.1	0.03	0.12	0.64	0.61
0.15	0.16	0.19	0.18	0.08	0.07	0.08	0.1	0.06	0.15	0.16	0.07	0.25	0.25	0.16		
0.24	0.20	0.16	0.13	0.15	0.18	0.19	0.18	0.14	0.11	0.07	0.16	0.19	0.21	0.22	0.35
0.14	0.25	0.12	0.09	0.11	0.09	0.09	0.11	0.21	0.17	0.09	0.05	0.21	0.23	0.18	0.39	0.48
")
str(cor.18)
library(ellipse)
plotcorr(cor.18,type = 'l',col=grey(1-abs(cor.18)))

# Without intial values, there will be some trouble 
(M0 <- cfa(reference.indicators = T,text = "
  eta1:y1,y2,y3
  eta2:y4,y5,y6
  eta3:y7,y8,y9
  xi1:x1,x2,x3
  xi2:x4,x5,x6
  xi3:x7,x8,x9
"))
(sem.0 <- sem(M0,cor.18,500))
# (sum.0 <- summary(sem.0))
# Error in summary.objectiveML(sem.0) : 
#   coefficient covariances cannot be computed

# With initial values, M0 is OK
(M0 <- cfa(reference.indicators = T,text = "
  eta1:y1,y2(1),y3(1)
  eta2:y4,y5(1),y6(1)
  eta3:y7,y8(1),y9(1)
  xi1:x1,x2(1),x3(1)
  xi2:x4,x5(1),x6(1)
  xi3:x7,x8(1),x9(1)
"))
sem.0 <- sem(M0,S = cor.18,N = 500)
(sum.0 <- summary(sem.0))

(M1 <- cfa(covs = c("xi1,xi2,xi3","eta2,eta3"),reference.indicators = T,text = "
  eta1:y1,y2(1),y3(1),eta2
  eta2:y4,y5(1),y6(1)
  eta3:y7,y8(1),y9(1)
  xi1:x1,x2(1),x3(1),eta1,eta3
  xi2:x4,x5(1),x6(1),eta1
  xi3:x7,x8(1),x9(1),eta1,eta2
"))
sem.1 <- sem(M1,S = cor.18,N = 500)
(sum.1 <- summary(sem.1))
anova(sem.1,sem.0)
sum.1$RMSEA
sum.0$RMSEA

pathDiagram(sem.1)
modIndices(sem.1)
(M5 <- update(M1,text="
  add,xi3 -> eta3,gamma33
  delete,eta1 -> eta2
  delete,xi1 -> eta3
  delete,eta2 <-> eta3"))
sem.5 <- sem(M5,S = cor.18,N = 500)
(sum.5 <- summary(sem.5))
sum.5$RMSEA
standardizedCoefficients(sem.5)

Quiz: Correlation of dummy variables

One-way ANOVA with a balanced K-group design is equivalent to a regression on the intercept and K-1 dummy variables. The quiz is on the correlation between any two dummy variable——positive, zero, or negative? One may think it is zero for any two dummy variables are orthogonal with one another. The answer will emerges after your click.



Understanding Tukey’s q & p

For a planned SINGLE comparison, the CI of \mu_2-\mu_1 can be interpreted as (M_2-M_1)\pm qt_{1-\frac{\alpha}{2},df}\times SE , in which SE=s\times \sqrt{\frac{1}{n_1}+\frac{1}{n_2}}. The df and s should be defined according to the denominator of F.

For post hoc multiple comparisons, the CI of \mu_2-\mu_1 can still be interpreted as (M_2-M_1)\pm \frac{qtukey_{1-\alpha,nmeans,df}}{\sqrt{2}}\times SE , wherein nmeans indicates the number of sub-groups whose means are compared. Note that qtukey(...) and ptukey(...) is defined with a two-tailed probability while qt(...) and pt(...) with a single-tailed one.

To verify it with a single click



Mann-Whitney-Wilcoxon Test vs. Z-test, for non-normal samples

Control group includes 150 Poisson (\lambda=2.3) cases;
Experiment group includes 200 cases, with fixed effect +1 which is unknown but interested in.

Researcher A chose Z test, considering the big sample sizes.
Researcher B chose Mann-Whitney-Wilcoxon Test, considering the non-normal distributions.
Whose confidence interval will beat?



Researcher A might complain: "Your CI width is actually from Poisson distribution. Most time it is actually zero. Let's try \chi^2_{df=1}. It would be fairer for Z-Test to use a continual distribution."

Mann-Whitney-Wilcoxon plays better than his expectation even in the continual case.



泰坦尼克号的社会阶层分析

R预装数据集Titanic提供了当年这艘巨轮上男女、长幼、头等二等三等乘客及船员的生死计数。



感兴趣头等舱、二等舱、与三等经济舱的成年男客是否在生死比率上有阶层之分,采用简单粗暴的Bonferroni多重比较校正法,alpha_adjust = 0.05/3。



点击运行R代码可看到三个双尾检验都显著(Odds Ratio 置信区间都不含1)。
生/死比率,头等舱 > 三等舱 > 二等舱。
二等舱的哥们既没能先走又没有三等舱的体格。

来自头等舱的女主角与三等舱的男主角,生死Odds之Ratio: