統計學概說 Introduction to Statistics
量化研究法二 統計原理與分析技術. 第 1 章. 統計學概說 Introduction to Statistics. 愛因斯坦與哈伯的恩怨情仇. 愛因斯坦一生最大的錯是 …. 星系後移速度. 星系與地球的距離. 科學方法與推論統計. 科學的目的 發掘真相( discover the truth ) 科學的方法 嚴謹的推論與辯證程序 統計推論的目的,就是推知真理 統計決策的目的,就是在找到真相 好好學統計,真的很重要. 統計的起源( 1/2 ). 統計學 一套處理與分析量化資料的技術 探究統計方法的原理與應用的學科,稱為統計學( statistics )
統計學概說 Introduction to Statistics
E N D
Presentation Transcript
量化研究法二統計原理與分析技術 第1章 統計學概說 Introduction to Statistics
愛因斯坦與哈伯的恩怨情仇 • 愛因斯坦一生最大的錯是….. 星系後移速度 星系與地球的距離
科學方法與推論統計 科學的目的 發掘真相(discover the truth) 科學的方法 嚴謹的推論與辯證程序 統計推論的目的,就是推知真理 統計決策的目的,就是在找到真相 好好學統計,真的很重要
統計的起源(1/2) • 統計學 • 一套處理與分析量化資料的技術 • 探究統計方法的原理與應用的學科,稱為統計學(statistics) • 統計與國家治理關係密切 • 十八世紀,德國人將「國家應該注意的事實學問」,包括國家的組織、人口、軍隊與資源的記述工作,以德文的statistika一詞,正式命名為統計學 • 統計(statistic)與國家(state)語出同源
統計的起源(2/2) • 埃及 • 王室為了修建金字塔,就曾對全國人民的財產進行調查 • 中國 • 四千多年前的夏朝,《尚書/禹貢》一文記載了當時的中國九州的各地物產、交通、植物特徵等統計資料,以及田地及貢賦分為九等的作法 • 英國 • statistics是由英國數學家William Petty(1623~1687)從德文statistika翻譯而來,說明統計在「專門研究各種數量」
古典統計初始時期 • Galton(Sir Francis Galton, 1822~1911) • 1899年的遺傳學原理《Nature Inheritance》 • 引發Pearson對於統計學的興趣 • Pearson(Karl Pearson, 1857~1936) • 1890年於格里辛學院 (Gresham College) 開授《現代科學的範圍與概念》(the Scope and Concepts of Modern Science),開始注意統計的原理及對科學研究的影響 • 提出相關係數(ρ)、標準差()重要統計名詞 • 引發世人對於統計的重視,改變了人們對統計的態度 • Fisher(Ronald Aylmer Fisher, 1890~1962) • 《Statistical Methods for Research Workers》(1925)和《Design of Experiments》(1935) • 發表了統計量的精確分配的論文 • 最大概似估計法(maximum likelihood estimation)觀念的提出
古典統計發展時期 • Egon Pearson與Jerzy Neyman ( 1928 ) • 第一與第二類型錯誤,檢定力和信賴區間之類的觀念 • Abraham Wald(1902~1950) • 提出逐次抽樣(sequential sampling)統計方法
現代統計時期 • Herman Hollerith發明打孔卡片(punched card)記錄數據的方法,用於美國人口調查局(U.S. Census Bureau)舉辦每十年一次的人口普查(1894) • 二次大戰之後快速發展,到1950年進入實用階段 • SAS、SPSS、BMDP等統計套裝軟體出現 • 1972年HP (Heweleit Packard) 公司發展掌上型計算器 (calculator)
「…現代的數據,已多得到了可怕的程度。老鼠若是掉到了米倉裡還會餓死,當然是老鼠的錯。統計這個行業在現代這個充滿數據的社會裡…不要把這個行業看得太小了。」「…現代的數據,已多得到了可怕的程度。老鼠若是掉到了米倉裡還會餓死,當然是老鼠的錯。統計這個行業在現代這個充滿數據的社會裡…不要把這個行業看得太小了。」 • (引自趙民德,1999,「統計已死,統計萬歲!」第八屆南區統計研討會演說稿)
PART II 統計的基本元素與內涵
變異與變數 • 變異(variety)是統計的根本 • 科學研究的意義,在於測量過程可以顯示出由於時間的改變或人物不同,所造成人類行為與社會現象的變異。 • 科學為研究這些變異與其關聯的活動。 • 變項(variables) • 統計學對於變異的探究,主要是藉由變項或變數來落實。 • 變項是指某一屬性因時地人物不同的內容 • 常數(constant):某一個屬性或現象不因時地人物而有所不同
變項的類型 • 從因果影響的關係來看 • 獨變項(independent variable; IV) • 不受任何因素影響的前置變項 • 又稱為預測或解釋變數 • 依變項(dependent variable; DV) • 依變項的變化主要歸因於獨變項的變動。 • 又稱為結果或反應變數 • 從被測量的對象的性質來看 • 間斷變項(discrete variable) • 被測量的對象,在變項的數值變化上是有限的,數值與數值之間,無法找到更小單位的數值。 • 例如家庭子女數、某個都市的戶數、性別、國籍等等 • 連續變項(continuous variable) • 被測量的對象,其特徵可以被變項中以無限精密的數值來反應。如果技術上允許,數值可以無限切割 • 例如以米尺測量身高、以體重計測量體重、以溫度計測量氣溫等
統計學的分類I • 理論統計(theoretical statistics) • 關心統計的基本原理與理論內涵,多以數學模式的推導或模擬方法來探討統計的相關問題 • 應用統計(applied statistics) • 強調統計方法如何解決各種研究問題,多涉及研究場域的實證資料分析與具體研究課題的解決
統計學的分類II • 單變項統計(univariate statistics) • 涉及單獨一個變項的描述與檢驗 • 雙變項統計(bivariate statistics) • 涉及兩個變項關係的探討 • 多變量統計(multivariate statistics) • 牽涉到多個變項關係的分析
統計學的分類III • 描述統計(descriptive statistics) • 目的在整理與描述研究者所獲得的數據,以描繪出數據的全貌與特徵 • 推論統計(inferential statistics) • 目的則在進行統計的檢驗與決策,尋找數據背後的科學意義 • 基礎推論統計(elemental inferential statistics) • 變項間關聯程度與團體差異顯著性的探討 • 高等推論統計(advanced inferential statistics) • 分組預測、結構關係、時間關係的探討
基礎推論統計的分類系統說明 • A:單變項統計 • 針對單一變項所進行的統計處理 • 若為連續變項,牽涉到Z與t檢定 • 若為類別變項,需使用卡方檢定 • B:平均數考驗的統計分析 • 當依變項為單一連續變項,獨變項為一個或多個類別變項的統計考驗方法 • 例如:t檢定與變異數分析(ANOVA) • C:線性關係分析技術 • 當獨變項與依變項均為連續變項所採行的統計分析方法 • 例如相關與迴歸(regression) • D:類別變項的關聯分析 • 當獨變項與依變項均為類別變項時所採行的統計分析方法 • 例如卡方分析或對數線性模式(log-linear modeling) • E:分組預測統計分析 • 當依變項為類別變項,獨變項為連續變項或類連混合變項時 • 多被歸類在多變量統計 ,例如邏輯迴歸, 區別分析
結語:真的有這麼難嗎? • 統計之所以會讓人覺得困難,主要與科學的本質與統計的知識結構有關 • 第一是科學態度的嚴謹性使然 • 第二是科學問題的複雜性使然 • 第三是統計知識的層次性問題 • 第四是統計的應用與研究課題的整合問題 • 問題與解決 • 難的不是統計學,問題在於人們心中的焦慮與無知的恐懼。 • 只要克服心理上的因素,統計也不過是一門高度實用性的學問而已。