首页 生活指南 正文内容

变量的典型特征和统计推论两种方式(一)

阿立指南 生活指南 2022-09-11 09:09:44 527 0

在某个时间点对变量的描述和推断。根据数据获取方式的不同,单变量的统计分析采用两种方法:统计描述和统计推断。

当数据采集包括整个研究人群时,使用单变量统计描述。它分为两个部分:研究变量的总体情况和典型特征。一个变量的整个画面由一个分布来描述,它将数据简化为一组变量值和频率对。为了使这种分布更加直观,通常采用统计表的形式(见表)。变量的典型特征由一系列特征值描述。变量的级别不同,使用的特征值也不同。最常见的特征值是集中值和离散值。中心值,也称为集中趋势,表示一组数据的典型水平和平均水平。离散值,

常用的特征值有:①众数值М0和离群比γ。它适用于各种级别的变量,但最适用于分类变量。众数М0用来表示变量的集中值,视差比γ用来表示变量的离散值。

众数 М0 = 数据中频率最高的变量值。例如时间序列分析:单变量和多变量方法 pdf,当表中出生的孩子数为 2 时,频率为 48,即众数。

其中 N 是观察的总数;fmo 是模式的频率。

②中值Мd和极差R或四分位差Q。适用于序数水平以上的变量时间序列分析:单变量和多变量方法 pdf,但最常用的是序数变量。中值Мd用于表示变量的集中值,范围R或四分位差Q用于表示变量的离散值。

中值Мd是数据中心的变量值。对于未分组的数据,当数据按顺序排列时,(N+1)/2的位置对应的变量值为中值,表中数据的中值为3(个数) ). 对于分组数据,累积频率达到 50% 的变量值为中值。

范围R是数据中某个变量的最大值和最小值之差。表中的范围是12。四分位差Q是数据分布中累积频率达到25%或75%的点的变量值之差。

③ 平均值μ和标准差。仅适用于区间以上的变量。均值μ用来表示变量的集中值,是数据总和的平均值。标准差用于表示变量在均值 μ 附近的平均离散度。计算公式为

其中 N 是观察的总数;Xi 是观测值。

标准差的平方称为方差。方差也可以用来表示一个变量在一段距离上的离散值。

当数据收集仅包括受试者的随机样本时,使用单变量统计推断。它分为两部分:参数估计和假设检验。参数估计是根据抽样结果,科学地估计总体特征值的大小或范围。样本的均值、个数p和标准差s作为总体的特征值,均值μ、个数p和标准差的估计值称为参数的点估计. 例如,根据样本的人均收入,估计人口的人均收入。

时间序列分析:单变量和多变量方法 pdf_分析故宫空间序列_单向有序列联表分析

式中,Xi 为样本中的观测值;是样品的容量;是样本中研究类别的数量。

参数的区间估计是估计总体特征值的范围。例如,根据样本的人均收入,估计人口人均收入的范围。当样本量不小于 30 时,总体均值的区间估计为

总分的区间估计为

根据公式确定:

在区间估计公式中,正确估计的概率为1-α(见图)。

假设检验是根据抽样结果在一定可靠性的基础上接受或拒绝原假设。例如,为了确定某个地方的生育率是否控制在15‰,可以进行抽样调查。根据抽样结果,检验生育率15‰的假设是否可以接受。这样的判断是概率性的,不可能做出100%正确的判断。衡量判断的可靠性,一般用显着性水平来表示。

使用统计推断技术的条件是:抽样所依据的总体清单必须完整;抽样是概率抽样。推理中也不涉及非抽样误差。如果数据的非抽样误差过大,统计推断的结果就会失去正确性。

欢迎 发表评论:

文章目录
    搜索