1 / 40

统计学 -- 数据的科学与艺术

统计学 -- 数据的科学与艺术. 2009 年 8 月 6 日 《 纽约时报 》 文章 “当今大学毕业生的唯一关键词:统计学” For Today‘s Graduate, Just One Word: Statistics 往年美国的统计学年会一般四、五千人参加,而经济危机中的 2009 年年会确有近七千人参加,统计专业毕业生很容易找工作。.

marsha
Télécharger la présentation

统计学 -- 数据的科学与艺术

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 统计学--数据的科学与艺术

  2. 2009年8月6日《纽约时报》文章“当今大学毕业生的唯一关键词:统计学” For Today‘s Graduate, Just One Word: Statistics 往年美国的统计学年会一般四、五千人参加,而经济危机中的2009年年会确有近七千人参加,统计专业毕业生很容易找工作。

  3. 去年,2010年6月3日第64届联合国大会第90次会议通过决议,每年10月20日被联合国确定为“世界统计日”,去年首个世界统计日以“庆祝官方统计的众多成就”为总主题,以“服务、诚信和专业精神”为核心价值。 据估计,世界上有100多个国家和地区定期或不定期地举办过统计日、统计周或统计月,通过海报、论坛、研讨会、竞赛等形式多样的庆祝活动,普及统计知识,扩大官方统计的影响力,同时争取政府、企业和社会公众对统计工作的更多支持。

  4. 今年2月11日出版的《科学》杂志刊登专题——《数据处理》(Dealing with Data)。专题导言文章《挑战与机遇》(Challenges and Opportunities),认为数据的搜集、维护和使用已成为科学研究的主要方面。为此《科学》(Science)联合《科学—信号传导》(Science Signaling)、《科学—转化医学》(Science Translational Medicine)和Science Careers推出本专题,将围绕目前研究数据的海量增加展开讨论。

  5. 教学案例1:宏观经济的应用 我们在报刊上看到:我国2010年GDP是397,983元 ,按不变价格计算,比上年增长10.3%。 按汇率计算,约合5.88万亿美元(日本10年5.47万亿美元) ,排在世界第2位。 若按购买力平价方法(PPP),约10.5万亿美元。 我国今年6月份CPI同比上升6.4% ,PPI同比上升7.1%. 我们这么多统计数据,看经济形势主要看什么呢?

  6. 宏观经济分析的主要指标 1、 经济增长率——不变价GDP增长率 2、 通货膨胀率——居民消费价格指数(CPI) 3、 失业率 4、 国际收支 我国宏观经济调控的主要目标: 促进经济增长,稳定物价,增加就业, 保持国际收支平衡

  7. 1978-2010我国GDP增长率

  8. 中国的最终需求结构

  9. 部分国家最终需求结构(2004年)

  10. 2000-2009年中国城镇登记失业率 (三)经济结构分析 1、产业结构 统计口径:年龄男16-50,女16-45;登记(调查);下岗、停产、半停产属隐性失业;自我雇用、家庭劳动者、地下劳动者、临时工未统计。

  11. 教学案例2: 航意险的风险分析 基本保单 20元保60万元, 1/30,000 实际风险(10年中起落架次或遇难比率) 新世纪以来的4次空难: 2002.4.15 国航 北京-釜山 波音767,166人 (128人遇难) 2002.5.7 北方航空 北京-大连 MD82, 112人遇难 2004.11.21 东航 包头-上海 CRJ200庞巴迪,55人遇难 2010.8.24 河南航空 哈尔滨-伊春 E190,96人(42人遇难)

  12. 教学案例3: 均值与标准差的对立统一 简单均值的计算公式为 加权均值的计算公式为

  13. 样本方差和标准差 未分组数据: 注意: 样本方差用自由度n-1去除! 方差的计算公式 标准差的计算公式 未分组数据: 组距分组数据: 组距分组数据:

  14. 均值和标准差的应用 以姚明在8个赛季常规赛每场比赛中的得分:  赛季       均值   标准差2002-03   13.5     6.65  2003-04   17.5     6.90  2004-05   18.3     6.80  2005-06   22.3     6.31 2006---07 25.0 6.56 2007---08 22.0 6.74 2008—09 19.7 5.86 2010—11 10.2 6.14 职业生涯 19.0 6.49 球星             均值   标准差迈克尔·乔丹   30.7      3.72

  15. 教学案例4:辛浦森(Simpson's Paradox)悖论 死刑判决率% 12.6 0 17.5 6.2 36 320 11.3

  16. 总的看, 白人有19/179=10.6% 的被告被判处死刑, 与之对应, 黑人只有17/177=9.6% 的被告被判死刑, 白人死刑率要高一些. 但如果考虑受害者的种族, 结论就相反了. 当受害者是白人时, 有11/63=17.5% 的黑人被告被判死刑, 而只有 19/151=12.6% 的白人被告被判死刑. 当受害者是黑人时, 白人被告没一个人( 0%)被判死刑, 而黑人被告确有 6/103=5.8% 的被判死刑。

  17. 航班延误 下面是美国两家航空公司一个月之内在5个机场的航班情况,其整体准时率时常在新闻中予以报导.

  18. 教学案例5:平均工资的争议 2009年3月25日北京市统计局公布2008年职工年平均工资44715元,比2007年增长12.17%,上海08年平均工资39502元。 7月29日国家统计局公布上半年职工平均工资14638元,增长12.9%。 平均工资=工资总额/职工平均人数 民众感觉收入“被增长”,国统局长亲自回应。

  19. 职工统计口径(全部职工和在岗职工):城镇3亿就业,只统计1.3亿。6000万私营企业职工,5000万个体户等没统计。职工统计口径(全部职工和在岗职工):城镇3亿就业,只统计1.3亿。6000万私营企业职工,5000万个体户等没统计。 税前工资:包括养老、医疗、住房公积金等个人账户基金,现金和物质形式。 方法待改进:收入分布不是正态分布,而是右偏型分布。国际上收入分布主要用中位数,而不是平均数。

  20. 平均数受极端值影响,收入差异越大,平均数越大;中位数是位置居中的数值,一半数据比中位数大,一半数据比中位数小,中位数收入是人群中等水平收入。平均数受极端值影响,收入差异越大,平均数越大;中位数是位置居中的数值,一半数据比中位数大,一半数据比中位数小,中位数收入是人群中等水平收入。

  21. 教学案例6:房价是真摔还是假摔? 城中、城效房价上涨(%) 20 40

  22. 总的来看, 基期的房价是:(10000×80+5000×20)/(80+20)=900000/100=9000元/平方米 报告期的房价是:(12000×20+7000×80)/(20+80)=800000/100=8000元/平方米 报告期与基期相比,房价平均下跌(8000/9000=88.89%)11.11%,可实际情况呢,无论是城中还是城效,房价都是上涨的。

  23. 教学案例7:几何平均数的应用 一位投资者持有一种股票,1996年、1997年、1998年和1999年收益率分别为4.5%、2.0%、3.5%、5.4%。计算该投资者在这四年内的平均收益率。 平均收益率=103.84%-1=3.84%

  24. 数据的艺术

  25. 1 x 8 + 1 = 912 x 8 + 2 = 98123 x 8 + 3 = 9871234 x 8 + 4 = 9876 12345 x 8 + 5 = 98765123456 x 8 + 6 = 9876541234567 x 8 + 7 = 987654312345678 x 8 + 8 = 98765432123456789 x 8 + 9 = 987654321

  26. 1 x 9 + 2 = 1112 x 9 + 3 = 111123 x 9 + 4 = 1111 1234 x 9 + 5 = 11111 12345 x 9 + 6 = 111111123456 x 9 + 7 = 11111111234567 x 9 + 8 = 1111111112345678 x 9 + 9 = 111111111123456789 x 9 +10= 1111111111

  27. 9 x 9 + 7 = 8898 x 9 + 6 = 888987 x 9 + 5 = 8888 9876 x 9 + 4 = 88888 98765 x 9 + 3 = 888888987654 x 9 + 2 = 88888889876543 x 9 + 1 = 8888888898765432 x 9 + 0 = 888888888

  28. 1 x 1 = 1 11 x 11 = 121111 x 111 = 123211111 x 1111 = 123432111111 x 11111 = 123454321111111 x 111111 = 123456543211111111 x 1111111 = 123456765432111111111 x 11111111 = 123456787654321111111111 x 111111111=123456789 87654321

  29. 最后, 测测你的反应!

  30. 数字背后的成语 7 ÷2 2≦x≦3 40 ÷ 6 二四六八 0000 1 × 1 = 1 10002 =100×100×100 7/8 不三不四 接二连三 陆续不断 无独有偶 掛万漏一 一成不变 千方百计 七上八下

  31. It is easy to lie with statistics, but it is easier to lie without them.要用统计骗人很容易. 但是不用统计, 骗人更容易. ------Frederick Mosteller谢 谢!

More Related