1 / 42

주요 내용

주요 내용. 확률 변수 이산 분포 연속 분포 대표적인 확률 분포. 확률 변수 (random variable). 실험 결과의 확률을 함수로 표현하기 위해서 확률 변수를 정의한다 . 확률 변수는 실험 결과를 숫자 ( 보통 실수값 ) 로 대응시키는 (mapping) 함수이다 . 확률 변수라는 이름은 잘못 정해진 이름으로 실제로는 함수 이다. 확률 변수 (random variable). 표본 공간 S 의 각 원소 a∈S 에 대하여 실수값 X(a) 를

waite
Télécharger la présentation

주요 내용

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 주요 내용 • 확률 변수 • 이산 분포 • 연속 분포 • 대표적인 확률 분포

  2. 확률 변수(random variable) 실험 결과의 확률을 함수로 표현하기 위해서 확률 변수를 정의한다. 확률 변수는 실험 결과를 숫자(보통 실수값)로 대응시키는 (mapping) 함수이다. 확률 변수라는 이름은 잘못 정해진 이름으로 실제로는 함수 이다.

  3. 확률 변수(random variable) 표본 공간 S의 각 원소 a∈S에 대하여 실수값 X(a)를 대응시키는 함수 X를 확률 변수라고 한다. 예1: 동전을 던지는 실험의 경우에는 표본 공간이 S ={앞면, 뒷면} 이다. 이때, 앞면을 0, 뒷면을 1로 대응하는 함수(확률 변수)를 정의하면 표본 공간의 각 결과에 대하여 다음과 같이 대응된다. X(앞면) = 0 X(뒤면) = 1

  4. 확률변수는 보통 대문자 알파벳 X, Y, Z, ... 등을 사용하여 나타낸다. 실험 결과가 X의 값 x에 대응되면 X=x로 나타낸다. 또한, 실험 결과가 x가 될 확률을 Pr{X=x}로 나타낸다. 예2: 네트워크로 연결된 두 컴퓨터 간에 주고받은 메시지 중에서 100개를 추출하여 크기, 전송시간을 조사하려고 한다. 표본 공간: 추출된 100개의 메시지, {ω1, ω2, ω3,…, ω100} 확률 변수 S: 메시지 길이 확률 변수 T: 메시지 전송 시간 그러면 확률 변수 S와 T에 의해 표본 공간의 각 결과는 실수값 으로 대응된다.

  5. 예3: 동전을 3번 연속해서 던지는 실험을 생각해 보자. 이 실험에서 표본 공간 S는 S = {HHH, HHT, HTH, HTT, THH, THT, TTH, TTT} 이때 다음과 같은 확률 변수를 정의하였다. X : 앞면(H)이 나온 수 그러면 이 실험의 결과는 X에 의해 다음과 같이 정수값으로 대응된다. X(HHH)=3, X(HHT)=2, X(HTH)=2, X(HTT)=1, X(THH)=2, X(THT)=1, X(TTH)=1, X(TTT)=0

  6. 그러면 다음과 같이 각 확률 변수에 대한 확률을 계산할 수 있다. Pr{X=0} = 1/8, Pr{X=1} = 3/8 Pr{X=2} = 3/8, Pr{X=3} = 1/8 또한, 다음과 같은 확률 변수를 정의하였다. Y : 모두 앞면(H) 혹은 모두 뒷면(T)이 나온 경우는 1, 이외의 경우는 0 그러면 이 실험의 결과는 Y에 의해 다음과 같이 정수값으로 대응된다. Y(HHH)=1, Y(HHT)=0, Y(HTH)=0, Y(HTT)=0, Y(THH)=0, Y(THT)=0, Y(TTH)=0, Y(TTT)=1 그러면 Pr{Y=0} = 6/8, Pr{Y=1} = 2/8

  7. 확률 변수간에 조건 확률 앞의 예의 두 확률 변수 X와 Y에 대해서

  8. 확률 변수 간의 독립 확률 변수 X의 모든 값 x와 확률 변수 Y의 모든 값 y에 대해서 다음 식을 만족하면 X와 Y는 독립이다. 2개 이상의 확률 변수들간에 상호 독립(mutually independent) 도 동일하게 정의된다.

  9. 예4: 두 개의 주사위를 던지는 실험에서 두 주사위 눈의 합이 3일 확률은 무엇인가? 표본 공간 S ={(ω1, ω2) | ω1, ω2 = 1,2,..., 6}으로 36개의 원소 확률변수 X: 두 주사위 눈의 합 따라서 구하는 확률은 Pr{X=3} = 2/36 = 1/12 두 주사위 눈의 합이 5보다 작을 확률은? Pr{X<5} = Pr{x=2}+Pr{X=3}+Pr{X=4} = 1/36 + 2/36 + 3/36 = 1/6

  10. 생일 문제(Birthday Problem) • 한 방에 있는 사람들 중에 2명 또는 그 이상이 같은 생일을 갖을 확률이 ½보다 크기 위해서는 얼마나 많은 사람들이 있어야 하나? • 1  365/365  364/365   (365N+1)/365 • 위의 값이 ½과 같기 위해서는N = 23 (n=22일 때 P≈0.475, n=23일 때 Pn≈0.506) • 놀라운가? 역설적인가(paradox)?

  11. 이것과 비교하면 • N명이 한 방에 있다고 하자. • 어떤 사람의 생일이나의 생일과 같을 확률이 ½ 보다 크기 위해서 N이 얼마나 커야 하는가? • 해법: 1/2 = 1  (364/365)N for N • 해답: N = 253

  12. 주요 내용 • 확률의 정의 • 이산 분포 • 연속 분포 • 대표적인 확률 분포

  13. 이산 확률 변수 이산 표본 공간에서 정의된 확률변수 X가 취할 수 있는 모든 값을 셀 수 있을 때 확률 변수 X를 이산 확률 변수라고 한다. 확률 질량 함수(probability mass function) 이산 확률 변수 X가 취할 수 있는 값 x1, x2, ... 의 각각에 대하여 확률 P{X=x1}, P{X=x2}, ...로 대응시켜 주는 관계 f(x)를 X의 확률 질량 함수, 혹은 확률 함수라고 부른다. f(x) = P{X=x} 이산 분포(discrete distribution) 이산 확률 변수 X의 분포를 이산 분포라고 한다.

  14. 확률 질량 함수(probability mass function) f(x) 1 0 X x1 x2 x3 x4 x5

  15. 예제:흰 공 3개와 빨간 공 2개가 들어있는 주머니에서 임의로 공 2개를 꺼냈을 때 X=빨간 공의 개수로 정의하였다. X=0, 1, 2의 값을 취할 수 있으며 각 확률을 구하라. N개에서 x개를 선택하는 경우의 수

  16. 확률 분포표 f(x) X

  17. 누적 분포 함수(cumulative distribution function) 확률 변수 x를 확률 P{X≤x}로 대응하는 함수 F(x) 1 0 X x1 x2 x3 x4 x5

  18. 예제:흰 공 3개와 빨간 공 2개가 들어있는 주머니에서 임의로 공 2개를 꺼냈을 때 X=빨간 공의 개수로 정의하였다. 누적 확률 함수를 구하라. F(x) 1.0 0.5 0.3 X 0 1 2

  19. 평균(기대값) 이산 확률 변수 X의 평균(mean) 또는 기대값을 E(X) 또는 μ로 나타낸다. 예제:흰 공 3개와 빨간 공 2개가 들어있는 주머니에서 임의로 공 2개를 꺼냈을 때 X=빨간 공의 개수로 정의하였다. 평균을 구하라. E(X) = 0*0.3 + 1*0.6 + 2*0.1 = 0.8

  20. 분산(variance) 확률변수 X의 평균을 μ라고 하면, 중심위치인 μ로부터 떨어진 정도를 나타내는 양으로서 분산을 정의하고 기호로 Var(X) 또는 σ2로 나타낸다.

  21. 표준 편차(standard deviation) 예제: 동전을 2회 던질 때 나오는 표면의 개수를 확률 변수 X로 정의하였다. 확률 변수 X의 분산과 표준편차를 구하라.

  22. 주요 내용 • 확률의 정의 • 이산 분포 • 연속 분포 • 대표적인 확률 분포

  23. 연속 확률 변수 연속 표본 공간에서 정의된 확률 변수 연속 분포(continuous distribution) 연속 확률 변수 X의 분포를 연속 분포라고 한다. 확률 밀도 함수(probability density function)

  24. 균등 분포(uniform distribution)

  25. 확률 밀도 함수

  26. 예제: 어떤 CPU의 수명 시간 X는 확률 밀도 함수가 로 주어지는 확률 분포를 따른다고 한다. CPU의 수명이 3시간 이상 5시간 이하일 확률을 구하여라.

  27. 연속 분포의 누적 분포 함수 연속 분포의 평균(기대값) 연속 분포의 분산

  28. 주요 내용 • 확률의 정의 • 이산 분포 • 연속 분포 • 대표적인 확률 분포

  29. 이산 분포 베르누이(Bernoulli) 분포 이항(Binomial) 분포 기하(Geometric) 분포 포아송(Poisson) 분포 연속 분포 균등(Uniform) 분포 지수(Exponential) 분포 감마(Gamma) 분포 정규(Normal) 분포

  30. 베르누이(Bernoulli) 분포 베르누이 시행(bernoulli trial) 실험의 결과가 두 가지가 나오는 실험(시행) 예) 동전 던지기, 생산된 제품의 상태(정상 혹은 불량) 표본 공간 S = {성공, 실패} 베르누이 확률변수 X(성공) =1, X(실패)=0 확률 질량 함수

  31. 확률 분포 평균 분산

  32. 이항 분포 확률 변수 성공 확률이 p인 베르누이 시행을 n번 독립적으로 반복했을 때의성공 횟수 independently and identically distribution (iid) 이항 분포 X의 확률 분포를 시행횟수 n과 성공률 p를 갖는 이항 분포라 한다. 확률 질량 함수 평균E(X)=np 분산Var(X)=np(1-p)

  33. p0.5, n 일수록 이항 분포는 벨(bell) 모양으로 된다.

  34. 포아송 분포 이항 분포 중에서 시행 횟수 n이 매우 크고 성공률 p가 매우 작은 경우 이항 분포는 포아송 분포에 접근한다. (경험적으로 n>30, p<0.05) 확률 질량 함수 평균 분산

  35. 포아송 분포 적용조건  단위 구간은 2개 또는 그 이상의 사건이 발생할 확률이 거의 0에 가까운 정도로 짧은 구간이다.. 각각의 단위구간은 독립적이다. 즉, 한 단위구간에서 발생하는 사건발생 수는 다른 단위구간에서 발생하는 사건발생 수에 영향을 미치지 않는다. 각 단위 구간에서 사건이 1회 발생할 확률은 그 구간의 길이에 비례하며 전구간을 통하여 일정하다. 예: 일정 시간 동안 은행에 도착하는 고객수 일정 시간 동안 주차장에 들어오는 자동차의 수 신문 한 페이지 당 오자의 수

  36. 예제: 한 데이터베이스 서버가 한 시간에 평균 9 건의 요청을 받는다고 하자. 어느 특정 시간 동안에 5회 이상의 요청을 받을 확률을 구하라. 확률 변수 X를 한 시간동안 받는 요청 횟수로 정의하면 X는 평균이 9인 포아송 분포를 따른다.

  37. 지수 분포 확률 질량 함수 평균 분산

  38. 정규 분포 확률 질량 함수 평균 분산

  39. 정규 분포는 좌우 동형의 벨(bell) 모양의 분포이다. 이항 분포 중에서 시행 횟수 n이 매우 크고 성공률 p가 0이나 1에 가깝지 않은 경우(p1/2), 이항 분포는 정규 분포에 접근한다. f(x) 68.26% 95.46% 99.73%

  40. 표준 정규 분포 평균이 , 분산이 2인 정규 분포에서 확률 변수 Z=(X-)/ 인 분포는 평균이 0, 분산이 1인 정규 분포가 된다. f(x) x -1 0 1

  41. 예제 동전을 1000번 던져서 앞면이 나오는 횟수가 500이상 750이하일 확률을 구하라. 앞면이 나올 확률은 p = 1/2이다. 이 실험에서 확률 분포는 이항 분포를 사용할 수 있으나 시행 횟수가 크고 성공률 p=1/2이므로 정규 분포를 사용할 수 있다. 즉, 평균 np=500, 분산 np(1-p)=250인 정규 분포를 사용할 수 있다.

More Related