【讲师】之前的视频里,我们介绍了 如何使用回归线,特别是基于样本数据的回归线的斜率 如何使用回归线,特别是基于样本数据的回归线的斜率 我们如何利用它来推断真实总量回归线的斜率 这个视频我们要讲的是 使用回归线的推理条件是什么 使用回归线的推理条件是什么 在某种程度上 和我们在做假设检验、均值和比例的置信区间 时考虑的的推理条件类似 和我们在做假设检验、均值和比例的置信区间 时考虑的的推理条件类似 和我们在做假设检验、均值和比例的置信区间 时考虑的的推理条件类似 但也会有一些新的条件 为了帮助我们记住这些条件 就总结为 LINER,L-I-N-E-R 好记对吧,和线性这个词 Linear 非常像 给 Liner 加个a,就是线性了 linear 这个小窍门很实用 因为我们学的就是线性回归嘛 其实这里的第一个 L 就是代表的线性(Linear) 第一个条件就是要求 总量中 x 和 y 两个变量之间是线性关系 总量中 x 和 y 两个变量之间是线性关系 写下来:x 和 y 之间是线性关系 写下来:x 和 y 之间是线性关系 写下来:x 和 y 之间是线性关系 写下来:x 和 y 之间是线性关系 写下来:x 和 y 之间是线性关系 写下来:x 和 y 之间是线性关系 写下来:x 和 y 之间是线性关系 现在,在很多情况下 咱们就假设是在考试中看到的情况 比如AP考试中 他们可能会说,嘿,假设这个条件满足了 通常,它会说假设所有条件都满足 通常,它会说假设所有条件都满足 他们只是想让你知道这些条件 但这是需要考虑的 如果潜在的关系是非线性的 那你的某些推论可能就不那么有力了 那你的某些推论可能就不那么有力了 下面一个 I 是我们之前见过的 Independence 当我们讨论推理的一般条件时 这是独立 Independence 条件独立 有几种不同的思路 任何一个单独的观察都是相互独立的 任何一个单独的观察都是相互独立的 可以是 重置抽样(放回抽样法) 还可以用 10%法则 当我们考虑比例和均值的条件独立时 当我们考虑比例和均值的条件独立时 要确信样本大小不超过总量的10% 要确信样本大小不超过总量的10% 要确信样本大小不超过总量的10% 下一个 N 是标准状况(标况)Normal condition 我们在做比例和均值的推理时已经讨论过了 我们在做比例和均值的推理时已经讨论过了 尽管当我们处理回归时它会稍复杂一些 尽管当我们处理回归时它会稍复杂一些 标准状况(标况)Normal condition 很多时候人们只是说假设它已经达到了 我来真的画一条回归线,但是用一点透视图来画 我来真的画一条回归线,但是用一点透视图来画 我要增加一个三维空间 我要增加一个三维空间 这是 x 轴 这是 y 轴 真实的总体回归线是这样的 已知标准状况是 真实总量中,任意给定的 x y 的分布是正态的 正态分布 我看看能不能画出y的正态分布 我看看能不能画出y的正态分布 取这个 x 这里就是这个正态分布 然后,对于这个 x y 也是正态分布的 就像图上这样 就像图上这样 如果已知 x y 就是正态分布的 再强调一下,很多时候你会被告知 假设它已经达到了 至少在统计学入门课程中 你自己想学透是有点难的 下一个关于 E 的条件和这个也有关 等方差性 Equal variance 等方差性 Equal variance 也就是说 对于给定的x,这些正态分布的分布是相同的 对于给定的x,这些正态分布的分布是相同的 也就是方差相等 也可以考虑标准差相等 也可以考虑标准差相等 例如,对已知 x,咱们就说是这个 x 突然间,方差降低了很多 看起来就是这样的 那就不再满足推理的条件了 最后一条也很重要的是,我们已经见了很多次 Random condition 随机条件 这些数据来自于一个精心设计的随机样本或某种随机实验 这些数据来自于一个精心设计的随机样本或某种随机实验 这些数据来自于一个精心设计的随机样本或某种随机实验 到现在为止我们学过的每一种推理条件中 都见过这个条件 那我就先讲到这里 我听说有些考试会考这个 我听说有些考试会考这个 但很多时候,在统计学入门课上 如果涉及到解决问题时,他们会告诉你 嘿,我们假设推理的所有条件都已满足 或者问推理的条件是什么? 但他们不会让你去证明 例如,正态分布或等方差条件 对于统计学入门课程来说,这就有点过了 对于统计学入门课程来说,这就有点过了