【讲师】之前的视频里,我们介绍了
如何使用回归线,特别是基于样本数据的回归线的斜率
如何使用回归线,特别是基于样本数据的回归线的斜率
我们如何利用它来推断真实总量回归线的斜率
这个视频我们要讲的是
使用回归线的推理条件是什么
使用回归线的推理条件是什么
在某种程度上
和我们在做假设检验、均值和比例的置信区间 时考虑的的推理条件类似
和我们在做假设检验、均值和比例的置信区间 时考虑的的推理条件类似
和我们在做假设检验、均值和比例的置信区间 时考虑的的推理条件类似
但也会有一些新的条件
为了帮助我们记住这些条件
就总结为 LINER,L-I-N-E-R
好记对吧,和线性这个词 Linear 非常像
给 Liner 加个a,就是线性了 linear
这个小窍门很实用
因为我们学的就是线性回归嘛
其实这里的第一个 L 就是代表的线性(Linear)
第一个条件就是要求
总量中 x 和 y 两个变量之间是线性关系
总量中 x 和 y 两个变量之间是线性关系
写下来:x 和 y 之间是线性关系
写下来:x 和 y 之间是线性关系
写下来:x 和 y 之间是线性关系
写下来:x 和 y 之间是线性关系
写下来:x 和 y 之间是线性关系
写下来:x 和 y 之间是线性关系
写下来:x 和 y 之间是线性关系
现在,在很多情况下
咱们就假设是在考试中看到的情况
比如AP考试中
他们可能会说,嘿,假设这个条件满足了
通常,它会说假设所有条件都满足
通常,它会说假设所有条件都满足
他们只是想让你知道这些条件
但这是需要考虑的
如果潜在的关系是非线性的
那你的某些推论可能就不那么有力了
那你的某些推论可能就不那么有力了
下面一个 I 是我们之前见过的
当我们讨论推理的一般条件时
这是独立 Independence
条件独立
有几种不同的思路
任何一个单独的观察都是相互独立的
任何一个单独的观察都是相互独立的
可以是 重置抽样(放回抽样法)
还可以用 10%法则
当我们考虑比例和均值的条件独立时
当我们考虑比例和均值的条件独立时
要确信样本大小不超过总量的10%
要确信样本大小不超过总量的10%
要确信样本大小不超过总量的10%
下一个 N 是标准状况(标况)Normal condition
我们在做比例和均值的推理时已经讨论过了
我们在做比例和均值的推理时已经讨论过了
尽管当我们处理回归时它会稍复杂一些
尽管当我们处理回归时它会稍复杂一些
标准状况(标况)Normal condition
很多时候人们只是说假设它已经达到了
我来真的画一条回归线,但是用一点透视图来画
我来真的画一条回归线,但是用一点透视图来画
我要增加一个三维空间
我要增加一个三维空间
这是 x 轴
这是 y 轴
真实的总体回归线是这样的
已知标准状况是
真实总量中,任意给定的 x
y 的分布是正态的
正态分布
我看看能不能画出y的正态分布
我看看能不能画出y的正态分布
取这个 x
这里就是这个正态分布
然后,对于这个 x
y 也是正态分布的
就像图上这样
就像图上这样
如果已知 x
y 就是正态分布的
再强调一下,很多时候你会被告知
假设它已经达到了
至少在统计学入门课程中
你自己想学透是有点难的
下一个关于 E 的条件和这个也有关
等方差性 Equal variance
等方差性 Equal variance
也就是说
对于给定的x,这些正态分布的分布是相同的
对于给定的x,这些正态分布的分布是相同的
也就是方差相等
也可以考虑标准差相等
也可以考虑标准差相等
例如,对已知 x,咱们就说是这个 x
突然间,方差降低了很多
看起来就是这样的
那就不再满足推理的条件了
最后一条也很重要的是,我们已经见了很多次
Random condition 随机条件
这些数据来自于一个精心设计的随机样本或某种随机实验
这些数据来自于一个精心设计的随机样本或某种随机实验
这些数据来自于一个精心设计的随机样本或某种随机实验
到现在为止我们学过的每一种推理条件中
都见过这个条件
那我就先讲到这里
我听说有些考试会考这个
我听说有些考试会考这个
但很多时候,在统计学入门课上
如果涉及到解决问题时,他们会告诉你
嘿,我们假设推理的所有条件都已满足
或者问推理的条件是什么?
但他们不会让你去证明
例如,正态分布或等方差条件
对于统计学入门课程来说,这就有点过了
对于统计学入门课程来说,这就有点过了