1.29k likes | 1.51k Vues
统计基础知识及法律法规. 四川省统计局. 统计的涵义. 1. 第一篇 统计基础知识. 一、统计基本概念. 1 、 统计的涵义. 统计 : 对社会经济现象数量方面的调查研究,主要从 数量 方面来描述社会经济现象。. 漫话统计. 漫话统计. 漫话统计. 曾有一位资深的海外统计学家说过: “统计就和柴、米、油、盐、酱、醋、茶一样,存在的时候并不是很突出,一旦不见了,人生就是黑白的了。”. 曾有一位资深的海外统计学家说过: “统计就和柴、米、油、盐、酱、醋、茶一样,存在的时候并不是很突出,一旦不见了,人生就是黑白的了。”. 曾有一位资深的海外统计学家说过:
E N D
统计基础知识及法律法规 四川省统计局
统计的涵义 1 第一篇统计基础知识 • 一、统计基本概念
1、 统计的涵义 • 统计:对社会经济现象数量方面的调查研究,主要从数量方面来描述社会经济现象。
漫话统计 漫话统计 漫话统计 曾有一位资深的海外统计学家说过: “统计就和柴、米、油、盐、酱、醋、茶一样,存在的时候并不是很突出,一旦不见了,人生就是黑白的了。” 曾有一位资深的海外统计学家说过: “统计就和柴、米、油、盐、酱、醋、茶一样,存在的时候并不是很突出,一旦不见了,人生就是黑白的了。” 曾有一位资深的海外统计学家说过: “统计就和柴、米、油、盐、酱、醋、茶一样,存在的时候并不是很突出,一旦不见了,人生就是黑白的了。”
1.统计的涵义 • 通俗地理解,统计就是一种帮助人们正确认识事物、分析事物的工具
统计整理 统计设计 统计分析 统计调查 1、 统计的涵义 • 统计活动、统计资料、统计学 • 统计活动(统计工作):是对所研究现象的数量特征进行收 • 集、整理和分析的调查研究活动。 • 一次完整的统计活动包括: • 统计资料:是统计活动过程的成果,包括数据资料和统计 • 分析资料。 • 对统计资料的要求:准确、及时、全面、系统、统一。 • 统计学:是有关数据的学科,是一门收集、整理和分析统计 数据的方法论科学。
统计与其他学科的区别 如何看待热议的统计话题 漫 话 统 计
统计的基本概念 2 一、统计基本概念
2、 统计的基本概念 (1) 统计总体和总体单位 (2) 统计标志和标志表现 (3) 变异和变量 (4) 统计指标和指标体系
2、 统计的基本概念 (1)统计总体和总体单位 • 统计总体:是由客观存在的某些性质上相同的许多个体所组成的整体,简称总体。 • 总体单位:组成统计总体的各个个体。 • 例如:以眉山市东坡区工业企业污染排放及处理利用情况环年基(环年基1_1)表为例 ,总体:眉山市东坡区所有工业企业,总体单位:每一个工业企业; • 四川省民营企业职工生活情况:总体:四川省所有民营企业的职工,总体单位:每一个民营企业的职工。 • 总体的特征:同质性、大量性、差异性 • 总体的类型:有限总体、无限总体
2、 统计的基本概念 (2)统计标志和标志表现 • 统计标志:是说明总体单位的特征或属性的名称。 • 标志表现:是标志特征在各个单位的具体表现。 例如:反映每个企业的特征:企业法人代码、企业地址、登记注册类型、所属行业、排水去向类型、受纳水体名称、排入的污水处理厂名称、工业总产值、“三废”综合利用产品产值、企业专职环保人员数、工业用水量、工业煤炭消费量、工业锅炉数、二氧化硫排放达标的工业炉窑数、产品产量、主要有毒有害原辅材料、废水污染物在线监测仪器套数、税金等。 反映每个企业职工的特征:性别、年龄、政治面貌、工种、技术职称、文化程度、月工资额等。
2、 统计的基本概念 标志的种类: 按标志是否能用数量表示分为:品质标志和数量标志。 • 品质标志:说明总体单位属性特征的名称,用文字描述。 • 数量标志:说明总体单位数量特征的名称,用数量表示。 数量标志的具体表现称标志值。 按标志表现是否相同分为:不变标志和可变标志。 • 不变标志:指某个标志在所有总体单位的具体表现都相同。 • 可变标志:指某个标志在各总体单位的具体表现不相同。
2、 统计的基本概念 (3)变异和变量 • 变异:是有差别的意思,分为质的差异和量的差异。 例如:民营企业职工:性别标志有男女之分;年龄标志有数量的大小之差,前者是属性变异,后者是数量变异。 • 变量:是可变的数量标志,具体值叫变量值。 例如:民营企业职工:年龄、月工资额等。 变量有连续变量和离散变量。 连续变量:其数值连续不断,要通过测量和计算取得数据。 例如:人的身高、体重、企业产值、利润等。 离散变量:其数值以整数断开,要通过计数取得数据。 例如:企业个数、职工人数等。
2、 统计的基本概念 (4)统计指标和统计指标体系 • 统计指标:是反映总体数量特征的基本概念和具体数值。 注意:从理论上讲,一个完整的统计指标由两部分构成: • 指标名称+指标数 • 例如: 2005年某民营企业完成利税总额为10亿元。 • (指标名称)(指标数值) • 从实际工作讲:常常把指标名称直接叫做统计指标。
2、 统计的基本概念 • 统计指标的种类: 数量指标:反映客观现象总规模、总水平的统计指 标,一般用绝对数表示。 例如:民营企业报表中的企业个数、职工人数、产品产量等。 按指标 反映的 内容分 质量指标:是反映客观现象相对水平或工作质量好坏 的统计指标,一般用相对数或平均数表示。 例如:民营企业经济效益:增加值率、利润率、劳动生产率等。 实物指标:是以实物计量单位计量的统计指标。 计量单位有:自然单位、度量衡单位、 双重单位、复合单位。 按指标 计量单 位分 价值指标:是以货币单位计量的指标。 例如:民营企业统计中:增加值、利润、税金等。
2、 统计的基本概念 总量指标:反映总体现象规模的统计指标,一般用绝对 数表示。 例如:民营企业报表中的企业个数、职工人数、产品产量等。 相对指标:是两个相互联系的总量指标之比,一般用相对 数表示。 计量单位:无名数、有名数。 主要类型:结构相对数、比例相对数、比较相对数、 动态相对数、强度相对数、计划完成程 度相对数。 例如:民营企业:职工文化结构、各部门发展的比例关系、单位能源消耗量、利润增长速度、增加值年计划完成程度等。 按指标 的表现 形式分 平均指标:是说明总体一般水平的指标,一般用平均数表示。 例如:民营企业报表中:从业人员年平均人数。
2、 统计的基本概念 时点指标:是说明某一统计对象在一定时刻状态上的总量。 例如:年底职工人数、企业个数、产品库存量等。 按指标 反映时 间标准 分 时期指标:是说明某一统计对象在一段时期内某种标志值 积累的的总量。 例如:工业总产值、增加值、营业收入、利润等。 观察指标 预计指标 按指标的报 告次序和准 确性分 按指标 用途分 考核指标 终期指标 • 统计指标体系:具有内在联系的一系列统计指标所构成的整体。
统计调查概念和分类 统计调查的组织方式 1 3 统计调查方案 2 4 二、 统计调查方法 统计的涵义 统计的涵义
1、统计调查概念和分类 • 概念:是按照统计设计的要求,采用最合适的方法,有计划、有组织收集真实、完整的原始资料的工作过程。 • 作用: • (1)统计调查是人们认识社会的基本方式; • (2)统计调查是统计工作中的基础环节。 • 要求: 准确、及时、全面
统计调查 按收集 资料的 方式分 按调查时 间是否连 续分 按调查 的组织 方式分 按调查 对象范 围分 直 接 观 察 法 全 面 调 查 非 全 面 调 查 经 常 性 调 查 专 门 调 查 一 次 性 调 查 访 问 法 统 计 报 表 报 告 法 • 统计调查种类
一份完整的调查方案包括: 2、统计调查方案 (1)确定调查任务与目的 注意:抓住当前最迫切需要解决的问题; 把需要与可能相结合 (2)确定调查对象、调查单位、报告单位 调查对象:调查研究的总体或调查范围。 调查单位:所要调查的具体单位。 报告单位:负责向统计调查机关提交调查资料的单位。 注意:调查单位和填报单位有时一致,有时不一致。
一份完整的调查方案包括: 表头 表体 表脚 调查表的构成要素 单一表:一个调查单位 调查表的种类 一览表:两个以上调查单位 2、统计调查方案 (3)调查项目和调查表 调查项目:调查的具体内容。 调查表:把调查项目按一定逻辑顺序排列形成的表格。
一份完整的调查方案包括: 2、统计调查方案 (4)调查时间标准和空间标准 调查标准时间:调查资料所属时间。 调查空间标准:调查单位应在什么地方接受调查。 (5)调查组织 为确保实施调查的具体工作计划。 包括:调查组织领导、调查机构的设置、人员的选调 和培训、经费来源、工作步骤及其善后处理等。
统计报表:是以原始记录为依据,按统一的表格形式、统一的报送时间和程序、自下而上地向各级领导部门提供资料的一种调查方式。统计报表:是以原始记录为依据,按统一的表格形式、统一的报送时间和程序、自下而上地向各级领导部门提供资料的一种调查方式。 统计报表 按填报 单位分 按报送 周期分 按制度内容和 实施范围分 基 层 报 表 综 合 报 表 部 门 统 计 报 表 国 家 统 计 报 表 定 期 报 表 年 报 地 方 统 计 报 表 3、统计调查的组织方式
普查:是专门组织的一次性全面调查。 3、统计调查的组织方式 • 特点: 通常是一次性的或周期性的; 有统一规定的标准时点; 规范化程度较高。 • 普查方式: 一是成立专门的普查机构进行调查; 二是根据企、事业单位的原始资料和报表资料进行调查。 注意:普查需要花费大量人、财、物力,故一般不易经常进行,只有党和国家制订重大方针政策时方可使用。
重点调查:是所要调查的总体中选择一部分重点单 位进行的非全面调查。 3、统计调查的组织方式 • 特点: 调查单位少; 调查对象的标志值比较集中于某些单位的场合。 这些单位数目不多,但其标志值在总体标志总量中占有较大比重,能反映总体的基本情况是重点调查的关键。 注意:重点单位的选择是客观的。 只适用于客观存在着重点单位的情况。
典型调查:是在调查对象中有意识地选出个别或少数有代表性的典型单位,进行深入、周密的非全面调查。典型调查:是在调查对象中有意识地选出个别或少数有代表性的典型单位,进行深入、周密的非全面调查。 3、统计调查的组织方式 • 种类:解剖麻雀、划类选典、“抓两头”。 • 作用: 可以对现象进行深入细致的分析; • 可以研究新生事物; • 在一定条件下可以验证全面调查的正确性; • 在一定条件下可以推断总体的数量特征。 指在数量表现上具有普遍意义和代表性的总体单位,可以用来推断总体的数量。 注意:典型单位的选择是主观的。根据研究目 的可选择好、中、差单位作为典型。
抽样调查:是按照随机原则,从研究总体中抽取部分单位进行观察,用其观察结果,从数量上推算总体资料的一种非全面调查。抽样调查:是按照随机原则,从研究总体中抽取部分单位进行观察,用其观察结果,从数量上推算总体资料的一种非全面调查。 3、统计调查的组织方式 • 特点: 一定要遵守随机原则; 利用样本数据推算总体数量特征; 必然产生抽样误差。 指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会。 注意:抽样调查是最科学、最完善 的一种非全面调 查方法。
4.常用统计方法 随机变量和密度函数 分布密度函数 连续型随机变量通常用分布密度函数表示。 分布密度函数的定义为: 连续型随机变量X的值落在单位区间内的概率,记作f(x) 30
可以证明随机变量的概率密度函数f(x)有如下性质可以证明随机变量的概率密度函数f(x)有如下性质 (Ⅰ) (Ⅱ) (Ⅲ) 4.常用统计方法 分布密度函数 31
【例】分布密度函数在环境统计中的应用 以煤炭开采和洗选行业COD单位去除成本(去除成本=治理费用/污染物去除量)为例,首先需要我们根据基表数据计算出各企业的COD去除成本,为保证数据可比性,最好分行业计算。然后对数据进行排序(从大到小或从小到大均可),取对数值绘图(见右图)。 32
4.常用统计方法 平均数和方差 平均指标又称统计平均数,是用以反映现象的一般水平,同时也反映了现象的集中趋势。 平均数有多种计算方法,分为: 数值平均数(算术平均数、几何平均数和调和平均数) 位置平均数(众数、中位数) 33
算术平均数 (arithmetic mean) 算术平均数简称均值,它是数据集中趋势的最主要测度值,是环境统计中最常用的一种平均值,较适用于正态分布资料统计。 总体的均值用符号 表示, 样本均值用符号 表示。 34
如果数据是未经整理的原始数据,可用下面的公式直接计算:如果数据是未经整理的原始数据,可用下面的公式直接计算: (1-1) 或 (1-2) 算术平均数(均值) 35
如果数据中相同观测值较多或者是分过组的频数表资料,可用下面公式做近似计算:如果数据中相同观测值较多或者是分过组的频数表资料,可用下面公式做近似计算: (1-3) 式中:xk为各组观测值或组中值(组中值是本组下限与相邻较大 组段的下限相加除以2; fi表示第i组观测值的个数;k表示组数。 算术平均数(均值) 36
【例3】 某市区大气中SO2浓度见下表,计算其平均浓度。 解: 37
几何平均数(geometric mean, G) 几何平均数也叫倍数均数,当观察值相差较大甚至成倍数关系时,如用算术均值表示平均水平时受少数特大或特小值影响较大,则用几何均数来表示其平均水平。 为统计计算方便,可先对观察值取对数值,计算对数值的均值后,再查反对数,既得几何平均值。 38
观察值转换为对数时注意事项 ⑴ 观察值中有个别数值为0,可将所有观察值加一常数k,使x+k>0,计算出结果后再还原,即G=G′-k。 ⑶ 观察值全为负数时,可全部按正值计算,计算出结果后再加上负号,即G= - G′。 ⑵ 观察值为小数时,可将观察值乘以常数k(k取10,100等)以化整,计算结果后再还原,即G=G′/k。 ⑷ 观察值中既有正值,也有负值时,可将所有观察值加一常数k,使x+k>0,计算出结果后再还原,即G=G′-k。 39
几何平均数计算公式 (1-3) 或 (1-4) 式中:G——几何均数; n ——观察值个数; ∏——连乘符号 ; ∑㏒x——各观察值对数和。 40
某地5人的血清滴度是1:2,1:4,1:8,1:16,1:32,求平均滴度。某地5人的血清滴度是1:2,1:4,1:8,1:16,1:32,求平均滴度。 这是分数等比级数资料,为简便计,计算分母的几何均数即可。 或 G =㏒-1(0.903) = 8 ∴5人的血清滴度平均是1:8。 41
调和平均数 (Harmonic Mean) 调和平均数是均数的另一种表现形式,一般用 符号表示。在分析研究问题时,有时由于掌握资料的局限性,但又需要计算平均数,可把调和平均数作为均数的变形使用。计算方法有简单调和平均数和加权调和平均数两种。 42
简单调和平均数 设有N个变量值为 则有简单调和平均数的计算公式为 43
【例】现有12批环保产品当日在某海关进口时报关的单价分别为每件25、24、25、27、26、25、24、28、26、25、26、28美元。试用简单调和平均数公式计算其平均价格。【例】现有12批环保产品当日在某海关进口时报关的单价分别为每件25、24、25、27、26、25、24、28、26、25、26、28美元。试用简单调和平均数公式计算其平均价格。 解 由公式得 (美元) 44
调和平均数加权法计算公式 45
【例】上例中将数据分组,然后用加权调和平均数公式计算其平均价格。【例】上例中将数据分组,然后用加权调和平均数公式计算其平均价格。 解 先将数据进行分组 然后根据公式进行计算: (美元) 46
中位数(median, M, Md) 中位数指全部观察值按大小顺序排列,居于中间位置的数值。 中位数与均数、几何均数不同,不是由全部观察值计算出来的,因而不够敏感。偏态分布资料,一端或两端有不确定数值分布的资料,分布情况不清的资料,适宜用中位数统计。 47
中位数(median, M, Md) 直接计算法:样品含量n较少时,先将观察值按大小顺序排列,再进行计算。 (1-5) n为奇数时, n为奇数时, (1-6) 式中,M——中位数; n——观察值总个数。 48
8个BOD监测数据的分析值(mg/L)分别为50,53.5, 51,53.5,52,55,58,53,计算中位数。 【例】 解:将8个数值按大小顺序排列为 50,51,52,53,53.5,53.5,55,58 n=8,M=(X4+X5)/2=(53+53.5)/2=53.25 (mg/L) 故:8个BOD监测数据的分析值中位数是53.25 (mg/L) 。 49
■ 平均指标是环境总体各单位的某一变量的代表值,说明了变量值的集中趋势。而集中趋势只是整体某变量数量特征的一个方面,另一方面还必须说明该变量的分布偏离平均数的尺度和程度,以说明平均数对该组变量值的代表性大小。因此,在运用平均数反映变量值集中趋势的同时,还应该观察该变量的离散趋势,这就需要设置一类反映变量离散趋势尺度大小的指标。 ■所谓离散趋势指标,是指反映环境总体各单位变量值程度大小的统计综合指标,又称为离散指标。在对环境总体进行综合分析时,将集中趋势指标和离散趋势指标相互配合、相互补充,可以对环境总体进行较全面的观察。 ■ 一般地,测定离散趋势常用的方法有全距、平均差、标准差(方差)和离散系数等。下面我们重点介绍方差和标准差。 50