티스토리 뷰

Table of Contents

Mathematical Statistics (19S1) - 무단 전재 및 재배포 금지

Basic Probability Theory

Sample Space

통계적 실험에서 발생가능한 모든 결과들의 집합을 표본공간(Sample space)이라 한다.

In probability theory, the sample space (also called sample description space, event space or possibility space) of an experiment or random trial is the set of all possible outcomes or results of that experiment.

$$\text{ Sample space}:S$$

Events

표본공간(Sample space)의 부분집합을 사건/사상(Events)이라고 한다.

Events

한국어표현

설명

표현

total event 전사상 표본공간 $S$의 모든 원소를 포함하는 사상 $A=S$
null event 공사상 표본공간 $S$의 어떤 원소도 포함하지 않는 비어있는 사상 $\emptyset$
complementary event 여사상 표본공간 $S$의 사상 $E$에 속하지 않는 모든 원소들의 집합. $E^c\text{ or }\overline{E}$
union event 합사상 두 사상 $E$, $F$의 합 ${x \mid x \in E\text{ or }x \in F} = E \cup F$
intersection event 곱사상 두 사상 $E$, $F$가 동시에 일어나는 사상 $E \cap F$
mutually exclusive event 배반사상 두 사상 $E$, $F$가 동시에 일어나지 못하는 사상 $\text{ 배반}\neq\text{ 독립} (E \perp F)$

배반과 독립은 서로 관계가 없는 개념임을 유의하자.

Useful Theorems in Statistics

Permutation

서로 다른 $n$개의 원소 중에서 $r$개를 뽑아 나열하는 방법의 수를 순열이라고 한다. 순열은 비복원추출과 복원추출 두가지가 존재하며, 비복원 추출은 각각의 실험(trial, experiment)이 종속적이다.

  • 비복원 추출

$$_nP_r = n (n - 1)(n - 2)\times \cdots \times(n-r+1)= \frac{n!}{(n-r)!}$$

  • 복원 추출

$$_n\Pi_r = n ^r$$

Combination

순열과 마찬가지로 서로 다른 $n$개의 원소 중에서 $r$개를 뽑지만 나열하지 않고 선택에 그치는 방법의 수를 조합이라고 한다. 조합은 순열에서 순차적 나열의 가지수를 제외한 것과 같다.

  • 동시 추출

$$_nC_r = \begin{pmatrix} n \\ r \end{pmatrix} = \frac{_nP_r}{r!} = \frac{n!}{r!(n-r)!}$$

  • 조합 공식 활용

$$\begin{pmatrix} n + 1 \\ r \end{pmatrix} = \begin{pmatrix} n \\ r-1 \end{pmatrix} + \begin{pmatrix} n \\ r \end{pmatrix}$$

Axiomatic Definition of Probability

사건/사상 $A$의 확률은 사건 $A$안에 있는 모든 원소에 할당된 확률의 합이다. 확률의 총합은 $1$이고 최소치가 $0$ 미만일 수 없다. 따라서 사건 $A$의 확률을 $P(A)$라 할 때, $P(\emptyset)=0$이며, $P(S)=1$이다. 즉, 어떠한 사건 $A$에 대하여 그 범위는 $0 \le P(A) \le 1$임을 알 수 있다.

모든 자연수 $i$에 대하여, $A_i$가 각각 상호배반(Mutually Exclusive)일 때, 다음 식이 성립한다.

$$P(A_1 \cup A_2 \cup A_3 \cup \cdots) = P(A_1) + P(A_2) + P(A_3) + \cdots = \sum^\infty_{i=1}{P(A_i)}$$

또한, $n$개의 원소를 갖는 사건 $E$가 있다고 하자. 어떤 시행에 대하여 $N$개의 서로 다른 결과가 동일한 확률로 발생할 때 사건 $E$의 확률은 아래와 같다.

$$P(E) = \frac{n}{N}$$

Additive Rule of Probability

  1. $P(E^c)=1-P(E)$ : 어떤 사건 $E$에 대하여, 사건 $E$의 여사건(complement) 확률은 표본집합의 확률($P(S) = 1$)에서 사건 $E$의 확률을 뺀 것과 같다.
  • Proof 1:

사건 $E$와 사건 $E$의 여집합 $E^c$는 배반사건(mutually exclusive)이므로, 확률의 공리적 정의에 의하여 $E \cup E^c = S$이다. 그러므로 $P(E \cup E^c) = P(E) + P(E^c) = P(S) = 1$이 성립한다.

$$\therefore P(E^c) = 1-P(E)$$

  1. $P(A \cup B) = P(A) + P(B) - P(A \cap B)$ : 임의의 두 사건 $A$와 $B$가 상호배반의 관계가 아닐 때, 두 사건의 합집합 확률은 두 사건 확률의 합에서 두 사건의 교집합 확률을 뺀 것과 같다.
  • Proof 2:

서로 배반이 아닌 두 사건 A와 B에 대하여,

$$
\tag{㉠} \label{eqn:ㄱ} P(A \cup B) = P(A\cap B^c) + P(A^c \cap B) + P(A\cap B)
$$

가 항상 성립힌다. $\eqref{eqn:ㄱ}$에 따라 같은 방식으로 각 사건의 확률을 정의하면:

$$
\tag{㉡} \label{eqn:ㄴ} P(A) = P(A \cap B^c) + P(A \cap B)
$$

$$
\tag{㉢} \label{eqn:ㄷ} P(B) = P(A^c \cap B) + P(A \cap B)
$$

이므로,

$$\eqref{eqn:ㄱ} - (\eqref{eqn:ㄴ} + \eqref{eqn:ㄷ}) = P(A \cup B) - P(A) - P(B) = -P(A\cap B)$$
$$\therefore P(A \cup B) = P(A) + P(B) - P(A \cap B)$$

연습문제

$P(A \cup B) = \frac{7}{8}, P(A \cap B) = \frac{1}{4}, P(A^c) = \frac{5}{8}$ 일 때 $P(A\cap B^c)$는 얼마인가.

연습문제

한 박스에 들어있는 15개의 상품 중에 5개는 불량품이다. 이 박스에서 임의로 3개의 상품을 꺼내어 구매할 때 적어도 하나의 불량품이 포함될 확률은 얼마인가.

Additive Rule of Probability (Extensive)

위에서 살펴본 기본적인 가법 정리를 확장하면 다음과 같다.

$$P(A_1 \cup A_2 \cup A_3 \cup \cdots \cup A_n) = \sum^n_{k=1}{(-1)^{k-1}S_k} $$

 

where,

 

$$\begin{aligned}
S_1 &= P(A_1) + P(A_2) + \cdots + P(A_n) ~~& \#\text{ of elements: } \begin{pmatrix} n \\ 1 \end{pmatrix} \\
S_2 &= P(A_1 \cap A_2) + P(A_2 \cap A_3) + \cdots + P(A_{n-1} \cap A_n) ~~& \#\text{ of elements: } \begin{pmatrix} n \\ 2 \end{pmatrix} \\
S_3 &= P(A_1 \cap A_2 \cap A_3) + \cdots + P(A_{n-2} \cap A_{n-1} \cap A_n) ~~& \#\text{ of elements: } \begin{pmatrix} n \\ 3 \end{pmatrix} \\
\vdots \\ 
S_n &= P(A_1 \cap \cdots A_{n-2} \cap A_{n-1} \cap A_n) ~~& \#\text{ of elements: } \begin{pmatrix} n \\ n \end{pmatrix} \\
\end{aligned}$$

연습문제

총 52장의 트럼프 카드는 4가지의 무늬로 구성되어 있으며 (♥◆♣♠) 각 무늬별로 13장의 카드가 있다.(A, 2, 3, ... , 10, J, Q, K) 트럼프 카드에서 임의로 13장의 카드를 뽑는다고 하자. 이 때 같은 무늬의 A, K 카드를 뽑을 확률은 얼마인가?

연습문제

5명의 수험생에게 임의로 수험표를 나누어줄 때, 적어도 한 명은 자기 수험표를 받게 될 확률은 얼마인가?

Conditional Probability

조건부 확률(Conditional probability)은 어떤 사건이 발생했다는 전제하에서 다른 사건이 발생할 확률을 말한다. 사건 A가 발생했다는 전제하에서 사건 B가 발생할 조건부 확률은 다음과 같이 정의한다.

$$P(B | A) = \frac{P(A\cap B)}{P(A)}\text{ where}P(A) > 0$$

Independent & Dependent

두 사건 A, B에 대하여 $P(B|A)=P(B)$ 또는 $P(A|B) = P(A)$가 성립할 때, 두 사건 A, B는 독립이라 한다. 성립하지 않으면 종속이라 한다.

  • 독립

$$\begin{aligned} P(A \cap B) &= P(A)\times P(B) \\ &where \\ & P(A) > 0, P(B) > 0 \end{aligned}$$

  • 배반

$$P(A \cap B) = \emptyset$$

Multiplication Rule of Probability

두 사건 A, B에 대하여,

$$P(B | A) = \frac{P(A \cap B)}{P(A)} \text{ 이므로 곧, } P(A \cap B) = P(B | A)P(A) $$

연습문제

  1. 52장의 카드에서 카드를 한 장씩 두 번 복원 추출하여 꺼낼 때, 꺼낸 카드가 모두 스페이드일 확률은 얼마인가.

  2. 비복원 추출할 때의 확률은 얼마인가.

연습문제

공이 5개 들어있는 주머니가 있다. 주머니에는 빨간 공과 흰 공이 각각 2개, 3개 들어있다. 첫 시도에서 임의의 공을 하나 꺼내 색상을 확인하고, 같은 색상의 공을 주머니에 하나 더 넣은 뒤 다시 임의의 공을 하나 꺼낸다. 이 때, 두 차례 시도 모두 빨간 공을 뽑을 확률은 얼마인가.

연습문제

사격 대회에서 두 선수 A, B가 목표물을 맞힐 확률이 각각 $\frac{1}{2}, \frac{2}{3}$라고 하자. 두 사람이 사격하여 누구라도 목표물을 맞힐 확률은 얼마인가.

연습문제

서로 독립인 임의의 두 사건 $A$, $B$에 대하여, 다음 물음에 답하여라.

  1. $A$와 $B^c$는 독립인가?
  2. $A^c$와 $B$는 독립인가?
  3. $A^c$와 $B^c$는 독립인가?

연습문제

서로 독립인 사건 $A$, $B$에 대하여, $P(A)=0.6, P(B)=0.3$일 때 $P(A \cup B^c)$는 얼마인가.

연습문제

서로 독립인 사건 $A$, $B$, $C$가 있을 때, 다음 물음에 답하여라.

  1. $A \cap B$와 $C^c$는 독립인가?
  2. $A$와 $B \cup C$는 독립인가?
  3. $A$와 $B \cap C$는 독립인가?

연습문제

1에서 30까지의 자연수 중에서 하나를 뽑는다고 할 때 각 사건 $A$, $B$, $C$는 다음과 같이 정의된다.

$$\begin{aligned} A &= {\text{ 짝수}} \
B &= {\text{ 3의 배수}} \
C &= {\text{ 5의 배수}}\end{aligned} $$

이 때, 각 사건 $A, B, C$는 서로 독립인가.

Multiplication Rule of Probability (Extensive)

어떤 통계적 실험에서 사건 $A_1, A_2, \cdots, A_k$가 발생한다면, 다음 식이 성립한다.

$$\begin{aligned} & P(A_1 \cap A_2 \cap A_3 \cap \cdots \cap A_k) = \\
& P(A_1)P(A_2|A_1)P(A_3|A_1 \cap A_2)\times \cdots \times P(A_k|A_1 \cap A_2 \cap \cdots \cap A_{k-1})\end{aligned}$$

단, 모든 $k$에 대하여 각 사건이 독립이면,

$$P(A_1 \cap A_2 \cap A_3 \cap \cdots \cap A_k) = P(A_1)P(A_2)P(A_3)\times \cdots \times P(A_k)$$

연습문제

검은 공과 흰 공이 각각 9개, 1개가 들어있는 주머니에서 비복원추출로 공을 1개씩 순차적으로 꺼낼 때 4번째 꺼낸 공이 흰 공일 확률은 얼마인가?

Total Probability

사건 $A_1, A_2, A_3, \cdots, A_k$가 표본공간 $S$를 완전히 분할하고 $P(A_i)\ne0 where i=1,2,\cdots,k$ 이면 표본공간 $S$의 임의의 사건 $B$에 대해 다음 식이 성립한다.

$$P(B) = \sum^k_{i=1}P(A_i \cap B) = \sum^k_{i=1}P(A_i)P(B|A_i)$$

연습문제

세 개의 생산라인 a, b, c에서 각각 전체 생산품의 $50%$, $30%$, $20%$를 생산한다. 각 생산라인의 불량률은 $2%$, $5%$, $10%$이다. 임의로 하나의 생산품을 골랐을 때 a 생산라인일 사건을 $A$, b 생산라인일 사건을 $B$, c 생산라인일 사건을 $C$라 한다. 임의로 고른 하나의 생산품이 불량품인 경우를 사건 $D$라고 할 때, $P(D)$는 얼마인가.

Bayes' Theorem

사건 $B_1, B_2, \cdots, B_n$이 표본공간 $S$를 완전히 분할하고, $A$가 표본공간 $S$의 임의의 사건이라면 다음 식이 성립한다.

$$P(B_i|A)=\frac{P(B_i)P(A|B_i)}{\sum^n_{i=1}P(B_i)P(A|B_i)} where P(B_i) > 0, P(A)>0$$

연습문제

어떤 공장은 세 개의 생산라인 a, b, c에서 각각 전체 생산품의 $30%$, $45%$, $25%$를 생산하고 각 생산라인의 불량률은 $2%$, $3%$, $2%$이다. 임의로 고른 하나의 생산품이 불량품이었을 때, 그 제품이 생산라인 c의 제품일 확률은 얼마인가.

연습문제

상자 속에 3 장의 카드가 있다. 하나는 양면이 모두 빨간색이고 두 번째는 양면이 모두 파란색이다. 세 번째는 한 면은 빨간색, 다른 면은 파란색이다, 상자에서 1장의 빨간색 카드를 꺼낼 때 그 뒷면도 빨간색일 확률은 얼마인가.

연습문제

어떤 병원의 암 검사의 적중룰은 95% 이다. 즉, 실제 암환자를 검사한 결과 양성으로 판단할 확률은 0.95 이다. 또 암에 걸리지 않은 사람을 검사결과 양성으로 판단할 확률은 0.01 이다. 통계적으로 1000 명 당 5 명 꼴로 암에 걸린다고 할 때 검사결과 양성으로 나타난 사람이 실제 암에 결렀을 확률은 얼마인가.

연습문제

어느 대학교 졸업생 중 남학생의 25%와 여학생의 10%는 은행에 취업하였다. 여자 졸업생은 전체 졸업생의 60%이다. 임의로 한 학생을 선택하였더니 은행에 취업한 학생이었다면 그 학생이 여학생일 확률은 얼마인가.

연습문제

어느 도시에서 남성의 4%와 여성의 1%의 키가 1.8m 보다 크다. 또 여성은 전체도시 인구의 60%이다. 임의로 한 사람을 선택하였더니 1.8m 보다 크다면 그 사람이 여성일 확률은 얼마인가.

연습문제 (Monty Hall Problem) LINK

이 문제는 조건부확률을 사용하여 정확히 설명할 수 있다. 사건 X가 발생할 확률을 P(X), 사건 Y가 발생할 확률을 P(Y)라고 하자. 사건 Y가 발생했을 때 X가 발생할 확률을 P(X|Y)라고 하면, P(X|Y)는 사건 X와 Y가 동시에 발생할 확률 P(X∩Y)을 사건 Y가 발생할 확률 P(Y)로 나눈 값이 된다.

$$P(X|Y) = \frac{P(X \cap Y)}{P(Y)}$$

가령 (공평한) 주사위 두 개를 던질 때, 처음 주사위에서5가 나올 확률은1/6이다. 그러나 주사위 두 개에서 나온 값의 합이9라고 알고 있다면 처음 주사위의 값이5일 확률은 다를 수 있다. 주사위 두 개에서 나오는 경우의 수는 총 36가지인데 처음 주사위가 5가 나오고 합이 9인 경우는 단 한 가지 밖에 없다. 한편 두 주사위의 합이 9인 경우는 4가지 (3+6, 4+5, 5+4, 6+3)이다. 따라서 1/36을 4/36으로 나눈 값인 1/4 만큼의 확률이 된다.

$$P(\text{ 처음주사위 5}|\text{ 합 9}) = \frac{P(\text{ 처음주사위 5}\cap\text{ 합 9})}{P(\text{ 합 9})} = \frac{1/36}{4/36}=\frac{1}{4}$$

사건 Y가 발생했을 때 X가 발생할 확률을 P(X|Y)라고 하였는데, 그러면 사건 X가 발생했을 때 Y가 발생할 확률 P(Y|X)에 대해서 알아보자. P(Y|X)는 다음과 같이 된다.

$$P(Y|X) = \frac{P(X \cap Y)}{P(X)}$$

이 식을 정리하면 P(X∩Y)는 P(X)와 P(Y|X)의 곱이 되어, 결국 P(X|Y)는 다음과 같다.

$$P(X | Y) = \frac{P(X \cap Y)}{P(Y)} = \frac{P(Y | X)P(X)}{P(Y)}$$

'Course Works > 수리통계학' 카테고리의 다른 글

The Concept of Probability Theory  (0) 2019.08.14
댓글
댓글쓰기 폼