统计 09 统计中的相关概念
总体与个体
总体:是指研究对象的整体集合。比如要研究某学校学生的身高情况,那么该学校的全体学生就是总体。
个体:是总体中的单个单位,是组成总体的基本元素。在上述例子中,学校里的每一位学生就是个体。
总体
总体是指研究对象的整个集合,它包含了具有某种共同特征的所有个体或元素。例如,当我们研究某城市所有居民的收入水平时,该城市的全体居民就构成了总体;若要研究某工厂生产的所有灯泡的使用寿命,那么该工厂生产的所有灯泡就是总体。
总体的分类
有限总体:指总体中所包含的个体数量是有限的、可以明确计数的。比如一个班级的所有学生,某公司的全体员工等,这些总体的个体数量是确定的、可统计的。
无限总体:是指总体中的个体数量是无限的,或者数量大到难以精确计数。例如,在一定时间内,某条河流中流淌的所有水分子,理论上水分子的数量是无限的;再如,在连续生产过程中,生产线上生产出的产品可以看作是无限总体,因为只要生产不停,产品数量就会不断增加。
总体参数
总体具有一些特征值,称为总体参数,用于描述总体的某种性质或特征。常见的总体参数包括总体均值、总体方差、总体比例等。
1、总体均值:是总体中所有个体数值的平均数,用符号\(\mu\)表示。例如,某班级学生的考试成绩构成一个总体,所有学生成绩的平均值就是该总体的均值。
2、总体方差:用来衡量总体中各个个体与总体均值之间的离散程度,用\(\sigma^{2}\)表示。它反映了总体数据的波动情况,方差越大,说明数据的离散程度越大,分布越分散。
3、总体比例:是指总体中具有某种特定特征的个体所占的比例,用\(P\)表示。比如在一个城市的居民总体中,拥有私家车的居民所占的比例就是总体比例。
在实际的统计研究中,由于总体往往规模较大,很难对总体中的每个个体进行全面调查和研究,通常会采用抽样的方法,从总体中抽取一部分个体作为样本,通过对样本的分析和研究来推断总体的特征和规律。
样本与样本容量
样本:从总体中抽取的一部分用于观察和分析的个体集合。例如,从某学校全体学生中随机抽取100名学生进行身高测量,这100名学生就构成了一个样本。
样本容量:指样本中所包含的个体数量。在上述例子中,样本容量就是100。
变量与数据
变量:是指研究对象的某种特征或属性,它可以取不同的值。比如学生的身高、体重、考试成绩等都是变量。变量可以分为定量变量和定性变量,定量变量是可以用数值来表示的变量,如身高、体重等;定性变量是不能用数值来表示,只能用类别来表示的变量,如学生的性别、民族等。
数据:是变量的具体取值。例如,某个学生的身高是175cm,这个175cm就是关于身高变量的数据。
平均数、中位数和众数
平均数:是一组数据的总和除以数据的个数。例如,有一组数据3、5、7、9、11,它们的平均数为(3 + 5 + 7 + 9 + 11)÷5 = 7。
中位数:将一组数据按照从小到大(或从大到小)的顺序排列,如果数据的个数是奇数,则处于中间位置的数就是中位数;如果数据的个数是偶数,则中间两个数的平均数是中位数。对于数据3、5、7、9、11,中位数是7;对于数据3、5、7、9、11、13,中位数是(7 + 9)÷2 = 8。
众数:是一组数据中出现次数最多的数据值。例如,在数据2、3、3、4、5中,众数是3。
方差和标准差
方差:是用来衡量一组数据离散程度的统计量,它是每个数据与平均数之差的平方的平均数。设一组数据\(x_1,x_2,\cdots,x_n\)的平均数为\(\overline{x}\),则方差\(s^2=\frac{1}{n}[(x_1-\overline{x})^2+(x_2-\overline{x})^2+\cdots+(x_n-\overline{x})^2]\)。
标准差:是方差的平方根,即\(s=\sqrt{\frac{1}{n}[(x_1-\overline{x})^2+(x_2-\overline{x})^2+\cdots+(x_n-\overline{x})^2]}\)。标准差与方差的作用相同,但标准差的量纲与原始数据相同,更便于理解和解释数据的离散程度。
频率与概率
频率:是指在多次重复试验中,某一事件发生的次数与试验总次数的比值。例如,抛一枚硬币100次,正面朝上的次数为53次,则正面朝上的频率为53÷100 = 0.53。
概率:是对随机事件发生可能性大小的度量,是一个理论值,它表示在大量重复试验中,某一事件发生的可能性的稳定值。对于抛硬币试验,正面朝上和反面朝上的概率都是0.5。