본문 바로가기

챗-gpt로 사회조사분석사 도전하기

Ⅲ과목 통계분석과 활용_1장 확률분포_01확률분포의 의미_➋이산확률변수와 연속확률변수

728x90
➋이산확률변수와 연속확률변수
이산확률변수(Discrete Random Variable)
이산확률변수는 확률론과 통계학에서 사용되는 개념입니다. 이산확률변수는 가능한 결과가 이산적인 값을 가지는 확률변수를 말합니다. 즉, 가능한 결과가 셀 수 있는 유한 개이거나 무한 개이지만 셀 수 있는 경우를 의미합니다.

예를 들어, 주사위를 던져서 나오는 결과는 이산확률변수의 한 예입니다. 주사위를 던지면 1부터 6까지의 정수 중 하나가 나오는데, 이 결과는 유한한 개수의 결과 중에서 하나를 선택하므로 이산확률변수입니다.

또 다른 예로는 동전 던지기 실험에서 앞면이 나올 횟수를 들 수 있습니다. 예를 들어, 동전을 10번 던져서 앞면이 나올 횟수는 0부터 10까지의 정수 중 하나이므로 이 또한 이산확률변수입니다.

이산확률변수는 각각의 가능한 값에 대해 그 값이 나타날 확률을 정의해야 합니다. 이를 확률질량함수(probability mass function)라고 하며, 이 함수를 통해 각 값이 나타날 확률을 알 수 있습니다.

확률질량함수 (Probability Mass Function, PMF): P(X = x) = p(x) 이때, X는 이산확률변수를 나타내며, p(x)는 X가 특정 값 x를 가질 확률을 나타냅니다. 이산확률변수의 확률질량함수는 각 값에 대한 확률을 나타내는 함수입니다.

이산확률변수와 대비되는 개념으로는 연속확률변수가 있습니다. 이는 가능한 결과가 연속적인 값을 가지는 확률변수를 말하며, 예를 들어 사람의 키나 무게 등이 있습니다.
▶연속확률변수(Continuous Random Variable)
연속확률변수는 통계학과 확률론에서 사용되는 중요한 개념입니다. 이산확률변수와 달리 연속확률변수는 가능한 결과가 연속적인 값을 가지는 확률변수를 의미합니다. 즉, 결과가 어떤 구간 내의 모든 실수 값을 가질 수 있는 경우를 말합니다.
예를 들어, 사람의 키, 무게, 온도 측정, 시간 측정 등은 연속확률변수의 예입니다. 이들은 특정 범위 내의 어떤 값을 취할 수 있기 때문입니다.

연속확률변수는 확률밀도함수(probability density function, PDF)를 통해 정의됩니다. 확률밀도함수는 연속확률변수의 분포를 나타내며, 그 아래의 영역의 넓이가 확률을 의미합니다. 특정 값에 대한 확률을 직접 구하는 것이 아니라, 값이 속한 구간에 대한 확률을 계산합니다.

확률밀도함수 (Probability Density Function, PDF): f(x) 여기서, X는 연속확률변수를 나타내며, f(x)는 X가 특정 값 x 근처의 구간에 속할 확률밀도를 나타냅니다. 연속확률변수의 확률밀도함수는 값의 구간에서 밀도를 나타내는 함수입니다. 특정 값 x에 대한 확률을 직접 구하는 것이 아니라, 구간의 확률밀도를 통해 확률을 계산합니다.

즉, 연속확률변수 X가 어떤 구간 [a, b]에 속할 확률은 확률밀도함수를 그 구간에서 적분한 값으로 구하게 됩니다. 이는 이산확률변수와는 다른 특징으로, 이산확률변수에서는 특정 값에 대한 확률을 직접 구할 수 있지만, 연속확률변수에서는 특정 값에 대한 확률이 아니라 특정 구간에 대한 확률을 구하게 됩니다.
728x90
반응형