Posts [프로그래머스 인공지능스쿨] Week2-4 인공지능 수학 : 확률과 확률분포
Post
Cancel

[프로그래머스 인공지능스쿨] Week2-4 인공지능 수학 : 확률과 확률분포

강의


확률

  • 똑같은 실험을 무수히 많이 반복할 때 어떤 일이 일어나는 비율

A라는 어떤 사건이 일어날 확률 : P(A)

확률은 0에서 1사이의 값을 가짐

  • 조합(combination)

어떤 집합에서 순서에 상관없이 뽑은 원소의 집합

n 개 중 r개를 뽑는 조합의 수

\[_{n}C_{r} = \left(\begin{array}{r} n\\ r \end{array}\right) = \frac{n!}{r!(n-r)!}\]
  • 덧셈 법칙

사건 A나 B가 일어날 확률

\[P(A \cup B) = \frac{\mid A \cup B \mid}{\mid S\mid}\]

사건 A와 B가 동시에 일어날 확률

\[P(A \cap B) = \frac{\mid A \cap B \mid}{\mid S\mid}\]

덧셈 법칙

\[P(A \cup B) = P(A) + P(B) - P(A \cap B)\]
  • 서로 배반(Mutually exclusive)

두 사건의 교집합이 공집합일 경우
사건 A와 B가 서로 배반

\[P(A \cap B) = 0\] \[P(A \cup B) = P(A) + P(B)\]
  • 조건부 확률

어떤 사건 A가 일어났을 때, 다른 사건 B가 일어날 확률

\[P(B \mid A) = \frac{P(A \cap B)}{P(A)}, (단, P(A) > 0)\]
  • 곱셈 법칙
\[P(B \mid A) = \frac{P(A \cap B)}{P(A)}\] \[P(A \cap B) = P(B \mid A)P(A)\]
  • 서로 독립

\(P(B \mid A) = P(B)\) 인 경우, 사건 A와 B는 서로 독립

\[P(A \cap B) = P(B \mid A)P(A) = P(B)P(A)\]
  • 여사건

사건 A의 여사건 : 사건 A가 일어나지 않을 사건(\(A^{c}\))
어떤 사건과 그 여사건은 서로 배반

\[P(A \cup A^{c}) = P(A) + P(A^{c}) = 1\] \[P(A) = 1 - P(A^{c})\]
  • 확률의 분할 법칙

사건 B는 다음과 같이 나누어짐

\[B = (A \cap B) \cup (A^{c} \cap B)\] \[(A \cap B)와 (A^{c} \cap B)는 서로 배반\]

따라서,

\[P(B) = P[(A \cap B) \cup (A^{c} \cap B)] = (A \cap B) + (A^{c} \cap B)\] \[= P(B \mid A)P(A) + P(B \mid A^{c})P(A^{c})\]
  • 베이즈 정리

처음의 확률 : 사전확률(prior probability)
수정된 확률 : 사후확률(posterior probability)

\[P(A \mid B) = \frac{P(A \cap B)}{P(B)} = \frac{P(B \mid A)P(A)}{P(B \mid A)P(A)+P(B \mid A^{c})P(A^{c})}\]


확률 변수(random variable)

랜덤한 실험 결과에 의존하는 실수
즉, 표본 공간의 부분 집합에 대응하는 실수
보통 표본 공간에서 실수로 대응되는 함수로 정의

  • 이산확률변수(discrete random variable)

확률 변수가 취할 수 있는 모든 수 값들을 하나씩 셀수 있는 경우

이산확률변수의 평균(기대값이라고도 함)

\[E(X) = \sum_{x}xP(X=x) = \sum_{x}xf(x)\]

이산확률변수의 분산

\[\sigma^{2} = \frac{1}{N}\sum_{i=1}^{N}(x_{i}-\mu)^{2}\]

이산확률변수의 표준편차(분산의 양의 제곱근)

\[\sqrt{\sigma^{2}} = \sigma\]
  • 연속확률변수(continuous random variable)

셀 수 없는 경우

  • 확률분포(probability distribution)

확률변수가 가질 수 있는 값에 대해 확률을 대응시켜주는 관계


확률분포

  • 이항분포

2개의 결과만을 가지는 실험, 보통 성공과 실패로 결과를 구분
성공의 확률: p
확률 변수 X : n번의 시행에서 성공의 횟수, 이항확률변수라고 함

이항확률변수 X의 확률분포

\[f(x) = P[X=x] = \left(\begin{array}{r} n\\ x \end{array}\right) p^{x}(1-p)^{n-x}\]

이항분포의 평균

\[E(X) = np\]

이항분포의 분산

\[Var(X) = np(1-p)\]

이항분포의 표준편차

\[SD(X) = \sqrt{np(1-p)}\]
  • 정규분포

연속확률변수의 확률분포

\[P[a \le X \le b] = \int_{a}^{b}f(x)dx\]

즉, 그래프 아래 부분의 넓이가 확률이 됨

표준정규확률변수

\[Z = \frac{X-\mu}{\sigma}\]
  • 포아송 분포(Poisson distribution)

일정한 시간단위 또는 공간단위에서 발생하는 이벤트의 수의 확률 분포

\[P[X=x] = f(x) = \lambda^{x} \frac{e^{-\lambda}}{x!}, x= 0,1,2, ...\]

평균 : \(\lambda\)

분산 : \(\lambda\)

  • 지수분포(exponential distribution)

포아송 분포에 의해 어떤 사건이 발생할 때, 어느 한 시점으로부터 이 사건이 발생할 때까지 걸리는 시간에 대한 확률 분포

\[f(t) = \lambda e^{-\lambda t}\]

평균 : \(E(T) = \frac{1}{\lambda}\)

분산 : \(Var(T) = \frac{1}{\lambda^{2}}\)


This post is licensed under CC BY 4.0 by the author.