자격증 도전/ADP

분산분석 T-test

star빛 2022. 4. 16. 13:10

분산분석을 하기 위해서는 집단의 n개의 데이터 수와 분산을 알아야 함.

집단 내에 어느정도로 분포가 퍼져있는지 계산한 값.

A 집단

평균:78

분산 : 9

표준편차 : 3

 

B 집단

평균 : 73

분산 : 9

표준편차 : 3

 

T-test를 통해 두 집단이 차이가 있는지 분석

집단 간의 차이가

집단 내의 편차보다 큰지 작은지 보는 것

집단 내의  차이가 집단 간의 차이보다 크다면 T값은 작아짐.

집단 내의 차이보다 집단 간의 차이가 크다면 분자가 커지므로써 t 값이 커짐.

t 값이 커지면 집단 간 차이가 커짐

 

차이/ 분산 

차이를 분산으로 비교.

즉, 분산을 알고 있다면 이 차이가 유의한지 아닌지 통계적으로 알 수 있음.

 

0.272

https://www.tdistributiontable.com/

 

T Table - T Table

Given below is the T Table (also known as T-Distribution Tables or Student’s T-Table). The T Table given below contains both one-tailed T-distribution and two-tailed T-distribution, df up to 1000 and a confidence level up to 99.9% Free Usage Disclaimer:

www.tdistributiontable.com

자유도 =  n -1 + n2-1

df = 23

통상적으로 0.05 유의수준(5%)으로 봄

그래서 df=23, 0.05 --> 1.714

0.272 가 더 작으므로 통계적 차이가 유의미하지 않다.

1.714는 기준이 된다. 정규분포 혹은 자유도에따라서 t-분포가 될 수 있음. 

 

https://www.scribbr.com/statistics/t-distribution/

 

T-distribution: What it is and how to use it

The t-distribution, also known as Student’s t-distribution, is a way of describing data that follow a bell curve when plotted on a graph, with the

www.scribbr.com

 

어떠한 분포의 기준이 되어서 그 면적 값을 P-value 라고 함.

 

단순히 평균이 2kg 차이가 난다고 해서 분산보다 얼마나 큰가가 통계적인 사고이다.

 

귀무 가설 : 통상적인 개념

대립 가설 : 새로운 개념

P-value란? : 유의확률, 대립가설이 우연히 채택될 확률

유의확률이 작을 수록 귀무가설을 기각할 가능성이 높아지는 것

유의 수준(a) : 귀무가설을 기각하기 위한 반대의 증거가 어느정도 강해야 하는지를 의미하는 수준 (기준) 

즉, 귀무가설을 유지하기 위한 최소한의 확률이 어느 정도인지를 정하는 

 

p-value 유의확률
a 유의수준
p-value < a 귀무가설을 기각하고, 대립가설을 채택
p-value > a 귀무가설을 기각하지 않음

 

 

p-value 가 5% 보다 높으면 귀무가설을 기각하지 않고

p-value 가 5% 보다 작으면 귀무가설을 기각한다

t값 0.272 일때 분포의 면적이 p-value

https://deepai.org/machine-learning-glossary-and-terms/test-statistic

 

Test Statistic

A test statistic is the value used in a hypothesis test to decide whether to support or reject a null hypothesis.

deepai.org

 

1.174는 기각역 유의수준 5% 임. 자유도와 분포를 통해서 구함.

그 오른쪽의 면적이 5%

기각역보다 커야지 p-value는 5% 보다 작은 것임.

t값이 커야함. t 값이 크다는 것은 분산에 비해서 차이가 커야지 이 차이가 있다고 말할 수 있음.

H0 A=B (평균이 같다 : 귀무가설)

H1 A=/B (평균이 다르다 : 대립가설)

집단 내의 분산보다 확실하게 커서 t 값이 2.xx 면 p-value 값이 5% 보다 작아지고 그러면 귀무가설을 기각하고 두 개의 집단이 차이가 있다.

 

즉, A집단과 B 집단의 2kg의 차이는 유의수준 a=0.05하에 통계적으로 유의하지 않다.

 

 

 

 

 

클래스101 강의 복습!