距离5月的AP考试还有一个月左右的时间,相信各位同学都已经为考试做足了准备,在进行最后的冲刺之前,我们可以对考试的考点内容进行系统梳理、识别重点,并从考试得分点的角度进行分析简答题的答题技巧。
来源:新东方 徐晨
考试介绍
AP统计考试与其他科目一样,分为Multiple Choice选择题和Free Response简答题两部分,考试时间各为90分钟,全程可以使用计算器(推荐使用TI-84 plus CE或N’Spire)。其中Multiple Choice部分会包含40道选择题,统计考试与其他理科不同,题干的阅读量很大,因此平均2.25分钟完成一道选择题时间较为紧张,考试时要注意控制做题速度。
Free Response分为5道普通题以及一道Investigative Task探究问题共六题,其中前五道的建议完成时间为60分钟,Investigative Task则建议留30分钟来完成,要求解答要有完整的文字论述,因此对于学生的英语写作能力也有较高的要求。
容错率方面,AP统计5分需要67%、4分需要53%左右的卷面成绩,具体百分值根据每年考试难度会略有浮动,但是整体位置在一个相对稳定的水平。2018年统计考试的5分率在14%左右,从比例上来看不高,但是统计学作为报考人数最多的学课,实际拿到5分的人数也有17万左右,因此考取5分实际上也并不是一件十分困难的事情。
考试内容梳理及重点分析
Exploring data: observing patterns and departures from patterns (20-30%)
Exploring Data考察的是学生观察数据、表达数据以及分析数据的能力,考点大体可以划分为Expressing Data、Describing Data、Comparing Data和Exploring Bivariate Data四个部分:
1)Expressing Data数据表达:数据表达主要考点是几类统计图像,本身难度不高但是是之后所有知识点的基础,其重要程度不言而喻。几种统计图对应的适应范围以及能够表示的信息是需要重点关注的内容。
2)Describing Data数据描述:对于数据的描述要从Center、Shape、Spread和Outlier四个角度入手,同时Center、Spread两个维度又分别有多种参数可以选择,要根据数据的特点选择合适的参量进行描述。
3)Comparing Data数据比较:数据比较涉及的维度与数据描述一致,但是要注意在两组数据描述的基础上加上比较级的词语来完成比较。
4)Exploring Bivariate Data双变量数据:双变量数据的重要考点是Least-square regression line与Residual Plot,对应的correlation coefficient、coefficient of determination的含义以及Residual Plot在Linear Model的情况下的该有的形式也要重点弄清楚,这部分是之后Slope的Confidence Interval以及Significance Test的基础,一定要在这里就巩固扎实。
Sampling and experimentation: planning and conducting a study (10-15%)
1)Sampling Survey抽样调查:Sampling Survey的重点考点是Simple Random Sample实现的方法、其他的Sampling Method以及Bias的分析,其中Sampling Method不要求自行设计但是要能够通过题目内容来进行判断,Bias则需要熟悉几种Bias 的类别以及来源,在题目的设计方案中判断可能出现的Bias类型。
2)Experiment实验研究:实验部分在考试当中必考实验设计题,在进行实验设计时需要根据实验需求来判断是否需要Blocking、Blinding,同时实验当中的进行分组时的Randomization也一定要明确描述对应的随机方法。
Anticipating patterns: producing models using probability theory and simulation (20-30%)
1)Probability概率:概率部分首先要熟记几种组合事件(and、or、given)对应的概率计算公式以及特殊条件对应的适用公式(Independent、Mutually Exclusive),其次要能够根据题干内容来判断概率数值对应的事件,这部分内容对于读题能力的要求很高,要求学生有较好的英语理解能力。
2)Distribution Models分布:AP统计当中分布主要涉及Binomial、Geometric和Normal三种模型,每一种模型对应的Expected Value(Mean)、Standard Deviation的公式计算以及计算器的pdf、cdf概率函数使用要熟练,其中的Normal Distribution是之后Statistical Inference的重要工具,要能够重点熟练掌握。
3)Sampling Distribution抽样分布:抽样分布相比之后的Statistical Inference较为简单,但是对应的概念是之后通过Statistic统计量来推测Parameter的基础,因此公式和条件都是相通的。其中公式都能够在Formula Sheet当中找到,而对于Proportion、Mean两种抽样分布进行计算时对应的Condition Check就需要学生自己牢记了。
Statistical inference: estimating population parameters and testing hypotheses (30-40%)
1)Confidence Interval置信区间:Confidence Interval的核心在于通过样本情况来对整体情况进行推测,是统计考试当中第二复杂的内容,对应的概念也较为复杂难以理解。置信区间对应Proportion、Mean的Difference以及Mean当中的t、z两种分布一共六种情况,因此难点在于根据所给的条件正确选择计算器函数,其中Mean和Proportion的公式要注意区分现在已经分得十分清楚了,针对t、z的区别主要看题目给出的Standard Deviation标准差所属类别,如果给的是样本标准差那就是t分布,而给的如果是全体标准差的话那就对应z分布;
而Slope的Confidence Interval则需要结合之前Bivariate的内容,其中Condition Check条件检验会比Proportion和Mean对应的情况更加复杂,需要从Linearity、Independence、Normality、Equal Variance以及Randomness五个维度来进行检验(可以通过首字母LINER来帮助记忆),对应的计算公式也与另外两种完全不同,对分析结果的解读要能够重点练习。
2)Significance Test统计检验:统计检验的内容从过程上来讲与Confidence Interval相似,但是本质上在进行的计算是完全不同的。Confidence Interval是在有统计量的基础上通过统计量对于整体参数进行一个推测,而Significance Test则是通过现有统计量对于原有对于整体参数的假设进行检验,因此在这部分假设的概念十分重要,假设分为H0 Null Hypothesis和Ha Alternative Hypothesis,其中Null必须是以等式形式给出的,而Alternative则会以不等式的形式包括大于、小于、不等于的形式给出,而具体的不等号方向则需要根据题干当中的怀疑方向来进行判断。在经过统计计算以后,将p-value与题目要求的significance level α进行比较就能够得出是否需要reject null hypothesis的结论。同时检验当中的Type I、Type II Error也是考试常考的内容,要重点理解分析两种Error出现的情况以及出现概率大小与Significance Level和Sample Size之间的关系。
简答题技巧
对于考试当中的简答题,很多同学可能会对其中的得分点比较疑惑,到底什么样的答案能够拿到满分,而什么样的答案只能得到一部分的分数呢?要探究这个问题我们需要来看一下简答题的评分标准,简答题根据学生的回答会给出三个不同的分数级别,分别为Essentially Correct(E)、Partially Correct(P)以及Incorrect(I)。
其中Essentially Correct即为全对标准,不仅要求最终的结果正确、过程完整并且回答句清晰合理,同时对应过程当中的所有变量来源、条件检验都必须完整正确,对于目标5分的同学来说这也应该是大部分简答题当中应该能够拿到的评分。
Partially Correct为部分正确标准,如果最终结果正确但是过程书写不完整或者是整体思路正确但是计算过程有细节错误,那么最终拿到的就是P的评分,这个评分是大部分学得不错但是对于细节知识点掌握不够扎实的同学会拿到的结果。
Incorrect即为不正确,如果题目思路完全错误或者是思路过程涵盖的得分点过少,就会拿到I的评分。
可以看出来,Essentially Correct的答题标准是很高的,因此要在大部分题目当中拿到E的评分是一件很难的事情。要拿到E需要注意的主要有以下几点:
1)对于分析类的题目,论述一定要完整合理,同时在进行结果判断时要结合统计学概念进行答题,而不是仅仅给出自己根据常识得到的结论。
2)研究设计类题目的步骤过程一定要完整,以Subject-Blocking-Randomization-Treatment-Blinding-Measuring和Comparing的顺序来进行论述,同时其中Randomization的具体方法一定要清楚描述。
3)Confidence Interval以及Significance Test两类问题首先一定要明确写出进行计算的Parameter,随后再进行条件检验(Randomness、Independence、Normality),根据条件检验的结果明确写出对应的Interval或者Test的类型,加上完整的计算过程以及标准的答句(We are __% confident that/ There is sufficient / insufficient evidence that),没有计算错误就能够拿到E的评分。