Companion to the 7-Chaser Practice Set冲 7 强化练习卷的解析配套
Syllabus 4.1 – 4.4考纲 4.1 – 4.4AA HL
v2.0 · companion to Unit_D1_Univariate_Data_Practice.html v2.0 · 10 Qs · 85 marks · IB-style mark-by-mark withUnit_D1_Univariate_Data_Practice.html v2.0 配套 · 10 题 · 85 分 · 按 IB 风格逐分点给出,附 M1 / A1 / R1 callouts分点标注
$y_i = 3x_i - 7$ gives $\bar{y} = 50$, $\sigma_y = 9$. (a) Find $\bar{x}$, $\sigma_x$. (b) Append a value $= \bar{x}$ to the original data; new mean, and does SD rise/fall/stay?$y_i = 3x_i - 7$ 给出 $\bar{y} = 50$、$\sigma_y = 9$。(a) 求 $\bar{x}$、$\sigma_x$。(b) 向原始数据追加一个等于 $\bar{x}$ 的值;新均值如何,标准差升/降/不变?
For the SD, write the (population) variance as $\sigma^2 = \dfrac{\sum (x_i - \bar{x})^2}{n}$. The appended point has deviation $19 - 19 = 0$, so the numerator $\sum (x_i - \bar{x})^2$ is unchanged, while the denominator grows from $n$ to $n+1$. A fixed positive numerator over a larger denominator gives a smaller variance, so the standard deviation decreases.
就标准差而言,把(总体)方差写成 $\sigma^2 = \dfrac{\sum (x_i - \bar{x})^2}{n}$。新追加点的离差为 $19 - 19 = 0$,因此分子 $\sum (x_i - \bar{x})^2$ 不变,而分母由 $n$ 增大到 $n+1$。固定的正分子除以更大的分母,方差变小,故标准差减小。
A: $12$ values, mean $15$. B: $8$ values, mean $m$. Combined mean $= 18$. (a) Find $m$. (b) A "9" in A should be "39"; corrected combined mean. (c) Why $\ne$ average of $15$ and $m$.A:$12$ 值,均值 $15$。B:$8$ 值,均值 $m$。合并均值 $= 18$。(a) 求 $m$。(b) A 中一个"9"应为"39";改正后的合并均值。(c) 为何 $\ne$ $15$ 与 $m$ 的平均。
Five positive integers: median $3$, unique mode $3$, mean $4$, range $8$. (a) Find all such datasets. (b) Justify completeness.五个正整数:中位数 $3$、唯一众数 $3$、均值 $4$、极差 $8$。(a) 求所有这样的数据集。(b) 论证完整性。
| $a$ | $b + d$ | candidates ($b\le 3\le d$) | valid? |
|---|---|---|---|
| $1$ | $7$ | $(1,6),(2,5),(3,4)$ | only $(3,4)$ |
| $2$ | $5$ | $(2,3)$ [need $b\ge 2,\,d\ge3$] | none |
| $3$ | $3$ | $b\ge3,d\ge3\Rightarrow b+d\ge6>3$ | none |
For $a=1$: with $(b,d)=(3,4)$, the set is $\{1,3,3,4,9\}$ — value $3$ appears twice, every other value once, so mode $3$ is unique. ✓ The pairs $(1,6)$ and $(2,5)$ give $\{1,1,3,6,9\}$ and $\{1,2,3,5,9\}$, in which $3$ appears only once, so $3$ is not the mode. ✗ For $a=2$, the only split $(b,d)=(2,3)$ gives $\{2,2,3,3,10\}$, where $2$ and $3$ each appear twice — mode not unique. ✗
So the unique answer is $\boxed{\{1, 3, 3, 4, 9\}}$ (check: sum $=20$, mean $4$; sorted middle $=3$; mode $3$; range $9-1=8$). ✓
| $a$ | $b + d$ | 候选($b\le 3\le d$) | 有效? |
|---|---|---|---|
| $1$ | $7$ | $(1,6),(2,5),(3,4)$ | 仅 $(3,4)$ |
| $2$ | $5$ | $(2,3)$ [需 $b\ge 2,\,d\ge3$] | 无 |
| $3$ | $3$ | $b\ge3,d\ge3\Rightarrow b+d\ge6>3$ | 无 |
当 $a=1$:取 $(b,d)=(3,4)$,得 $\{1,3,3,4,9\}$ —— 值 $3$ 出现两次,其余各值各一次,故众数 $3$ 唯一。✓ 而 $(1,6)$、$(2,5)$ 给出 $\{1,1,3,6,9\}$ 与 $\{1,2,3,5,9\}$,其中 $3$ 只出现一次,故 $3$ 不是众数。✗ 当 $a=2$ 时,唯一的拆分 $(b,d)=(2,3)$ 给出 $\{2,2,3,3,10\}$,其中 $2$ 与 $3$ 各出现两次 —— 众数不唯一。✗
因此唯一答案为 $\boxed{\{1, 3, 3, 4, 9\}}$ (验证:和 $=20$,均值 $4$;排序中间 $=3$;众数 $3$;极差 $9-1=8$)。✓
$x = 1,2,3,4,5$; $y = 2,3,5,4,6$. (a) Show $\bar{x}=3,\bar{y}=4$. (b) $S_{xx},S_{yy},S_{xy}$. (c) Both regression lines. (d) Product of gradients $= r^2$; find $r$. (e) Intersection & why they differ.$x = 1,2,3,4,5$;$y = 2,3,5,4,6$。(a) 证 $\bar{x}=3,\bar{y}=4$。(b) $S_{xx},S_{yy},S_{xy}$。(c) 两条回归直线。(d) 斜率之积 $= r^2$;求 $r$。(e) 交点及两线为何不同。
| $x_i$ | $y_i$ | $x_i-\bar{x}$ | $y_i-\bar{y}$ | $(x-\bar x)^2$ | $(y-\bar y)^2$ | $(x-\bar x)(y-\bar y)$ |
|---|---|---|---|---|---|---|
| $1$ | $2$ | $-2$ | $-2$ | $4$ | $4$ | $4$ |
| $2$ | $3$ | $-1$ | $-1$ | $1$ | $1$ | $1$ |
| $3$ | $5$ | $0$ | $1$ | $0$ | $1$ | $0$ |
| $4$ | $4$ | $1$ | $0$ | $1$ | $0$ | $0$ |
| $5$ | $6$ | $2$ | $2$ | $4$ | $4$ | $4$ |
| Totals | $S_{xx}=10$ | $S_{yy}=10$ | $S_{xy}=9$ | |||
| $x_i$ | $y_i$ | $x_i-\bar{x}$ | $y_i-\bar{y}$ | $(x-\bar x)^2$ | $(y-\bar y)^2$ | $(x-\bar x)(y-\bar y)$ |
|---|---|---|---|---|---|---|
| $1$ | $2$ | $-2$ | $-2$ | $4$ | $4$ | $4$ |
| $2$ | $3$ | $-1$ | $-1$ | $1$ | $1$ | $1$ |
| $3$ | $5$ | $0$ | $1$ | $0$ | $1$ | $0$ |
| $4$ | $4$ | $1$ | $0$ | $1$ | $0$ | $0$ |
| $5$ | $6$ | $2$ | $2$ | $4$ | $4$ | $4$ |
| 合计 | $S_{xx}=10$ | $S_{yy}=10$ | $S_{xy}=9$ | |||
$D$: $n=20$, mean $50$, SD $10$, median $48$, IQR $16$. For each separate change, give new mean/median/SD/IQR (or "cannot be determined"). (a) $+5$ to all. (b) $\times 2$ all. (c) append $50$. (d) one value $+100$.$D$:$n=20$,均值 $50$,SD $10$,中位数 $48$,IQR $16$。对每个独立变化,给出新的 均值/中位数/SD/IQR(或"无法确定")。(a) 全部 $+5$。(b) 全部 $\times 2$。(c) 追加 $50$。(d) 一个值 $+100$。
resistant),通常几乎不动,但精确值需要原始数据。$x=1,3,4,6,7,9$; $y=8,11,11,16,18,20$. (a) $r$ and line. (b) Interpret $b$. (c) Residual at $x=6$.$x=1,3,4,6,7,9$;$y=8,11,11,16,18,20$。(a) $r$ 与直线。(b) 解释 $b$。(c) $x=6$ 处的残差。
A: $n=30$, mean $62$, SD $9$. B: $n=20$, mean $71$, SD $6$. (a) Combined mean. (b) Combined $\sum x^2$ and combined SD via $\sum x^2 = n(\sigma^2+\bar x^2)$. (c) Two students score $80$; $z$-scores; who is more exceptional.A:$n=30$,均值 $62$,SD $9$。B:$n=20$,均值 $71$,SD $6$。(a) 合并均值。(b) 用 $\sum x^2 = n(\sigma^2+\bar x^2)$ 求合并 $\sum x^2$ 与合并 SD。(c) 两人各考 $80$;求 $z$ 分数;谁更突出。
Soil 1: $(1,8),(2,7),(3,6)$. Soil 2: $(6,12),(7,11),(8,10)$. (a) $r$ for each soil. (b) $r$ pooled. (c) Name phenomenon & lurking variable. (d) Which analysis guides advice?土壤 1:$(1,8),(2,7),(3,6)$。土壤 2:$(6,12),(7,11),(8,10)$。(a) 各土壤的 $r$。(b) 合并的 $r$。(c) 现象名称与潜伏变量。(d) 应依据哪种分析?
Simpson's paradox)。潜伏(混杂)变量是土壤类型:土壤 2 恰好同时具有更高的剂量与更高的产量,因此合并后使剂量与产量看起来正相关,尽管固定土壤时,剂量越大产量越低。
$A=\{2,4,6,8,10\}$, $B=\{3,4,5,7,11\}$. (a) Same mean & variance. (b) Medians & shape. (c) Limits of "mean + SD only."$A=\{2,4,6,8,10\}$,$B=\{3,4,5,7,11\}$。(a) 均值与方差相同。(b) 中位数与形状。(c) 仅用"均值 + SD"的局限。
| set | deviations from $6$ | $\sum(x-6)^2$ |
|---|---|---|
| $A$ | $-4,-2,0,2,4$ | $16+4+0+4+16 = 40$ |
| $B$ | $-3,-2,-1,1,5$ | $9+4+1+1+25 = 40$ |
| 数据集 | 对 $6$ 的离差 | $\sum(x-6)^2$ |
|---|---|---|
| $A$ | $-4,-2,0,2,4$ | $16+4+0+4+16 = 40$ |
| $B$ | $-3,-2,-1,1,5$ | $9+4+1+1+25 = 40$ |
positively skewed)。
(a) Prove $\sum(x_i-\bar x)^2 = \sum x_i^2 - n\bar x^2$. (b) $n=8$, $\sum x=96$, $\sum x^2=1256$: mean, variance, SD. (c) Add a 9th value $=$ mean; new variance via the identity; consistency with Q1(b).(a) 证 $\sum(x_i-\bar x)^2 = \sum x_i^2 - n\bar x^2$。(b) $n=8$,$\sum x=96$,$\sum x^2=1256$:均值、方差、SD。(c) 加入第 $9$ 个值 $=$ 均值;用恒等式求新方差;与 Q1(b) 一致。
1-Var Stats 以及一切流式数据算法的工作方式 —— 无需回头逐个查看原始数据。