众所周知,统计学是数据分析的基石。学了统计学,你会发现很多时候的分析并不那么准确,比如很多人都喜欢用平均数去分析一个事物的结果,但是这往往是粗糙的。而统计学可以帮助我们以更科学的角度看待数据,逐步接近这个数据背后的“真相”。 大部分的数据分析,都会用到统计方面的以下知识,可以重点学习:阅读路线:
01 概率介绍
- 概率介绍
- 离散型概率分布和连续型概率分布
- 抽样和抽样分布
- 区间估计
- 假设检验
01 概率介绍
概率是指的对于某一个特定事件的可能性的数值度量,且在0-1之间。我们抛一枚硬币,它有正面朝上和反面朝上两种结果,通常用样本空间S表示,S={正面,反面},而正面朝上这一特定的试验结果叫样本点。对于样本空间少的试验,我们极易观察出他们样本空间的大小,而对于较复杂的试验,我们就需要学习些计数法则了。
计数法则
- 多步骤试验的计数法则
如果一个试验可以分为循序的k个步骤,在第1步中有N1种试验结果,在第2步中有N2种试验结果...以此类推。那么所有的试验结果的总数为N1*N2*N3...*Nk。
举例:抛两枚硬币,第一枚有正反两种结果,第二枚有正反两种结果。所以试验结果的总数是 2X2=4
- 组合计数法则
从N项中任取n项的组合数
N和n的上下位置与我们平常见的是相反的。因为我们这里是以欧美规范为主。
举例子:从5个彩色球中,选出2个彩球,有多少种选法?