분산분석 T-test
분산분석을 하기 위해서는 집단의 n개의 데이터 수와 분산을 알아야 함.
집단 내에 어느정도로 분포가 퍼져있는지 계산한 값.
A 집단
평균:78
분산 : 9
표준편차 : 3
B 집단
평균 : 73
분산 : 9
표준편차 : 3

T-test를 통해 두 집단이 차이가 있는지 분석
집단 간의 차이가
집단 내의 편차보다 큰지 작은지 보는 것
집단 내의 차이가 집단 간의 차이보다 크다면 T값은 작아짐.
집단 내의 차이보다 집단 간의 차이가 크다면 분자가 커지므로써 t 값이 커짐.
t 값이 커지면 집단 간 차이가 커짐
차이/ 분산
차이를 분산으로 비교.
즉, 분산을 알고 있다면 이 차이가 유의한지 아닌지 통계적으로 알 수 있음.
0.272
https://www.tdistributiontable.com/
T Table - T Table
Given below is the T Table (also known as T-Distribution Tables or Student’s T-Table). The T Table given below contains both one-tailed T-distribution and two-tailed T-distribution, df up to 1000 and a confidence level up to 99.9% Free Usage Disclaimer:
www.tdistributiontable.com

자유도 = n -1 + n2-1
df = 23
통상적으로 0.05 유의수준(5%)으로 봄
그래서 df=23, 0.05 --> 1.714
0.272 가 더 작으므로 통계적 차이가 유의미하지 않다.
1.714는 기준이 된다. 정규분포 혹은 자유도에따라서 t-분포가 될 수 있음.

https://www.scribbr.com/statistics/t-distribution/
T-distribution: What it is and how to use it
The t-distribution, also known as Student’s t-distribution, is a way of describing data that follow a bell curve when plotted on a graph, with the
www.scribbr.com
어떠한 분포의 기준이 되어서 그 면적 값을 P-value 라고 함.
단순히 평균이 2kg 차이가 난다고 해서 분산보다 얼마나 큰가가 통계적인 사고이다.
귀무 가설 : 통상적인 개념
대립 가설 : 새로운 개념
P-value란? : 유의확률, 대립가설이 우연히 채택될 확률
유의확률이 작을 수록 귀무가설을 기각할 가능성이 높아지는 것
유의 수준(a) : 귀무가설을 기각하기 위한 반대의 증거가 어느정도 강해야 하는지를 의미하는 수준 (기준)
즉, 귀무가설을 유지하기 위한 최소한의 확률이 어느 정도인지를 정하는
p-value | 유의확률 |
a | 유의수준 |
p-value < a | 귀무가설을 기각하고, 대립가설을 채택 |
p-value > a | 귀무가설을 기각하지 않음 |
p-value 가 5% 보다 높으면 귀무가설을 기각하지 않고
p-value 가 5% 보다 작으면 귀무가설을 기각한다
t값 0.272 일때 분포의 면적이 p-value
https://deepai.org/machine-learning-glossary-and-terms/test-statistic
Test Statistic
A test statistic is the value used in a hypothesis test to decide whether to support or reject a null hypothesis.
deepai.org

1.174는 기각역 유의수준 5% 임. 자유도와 분포를 통해서 구함.
그 오른쪽의 면적이 5%
기각역보다 커야지 p-value는 5% 보다 작은 것임.
t값이 커야함. t 값이 크다는 것은 분산에 비해서 차이가 커야지 이 차이가 있다고 말할 수 있음.
H0 A=B (평균이 같다 : 귀무가설)
H1 A=/B (평균이 다르다 : 대립가설)

집단 내의 분산보다 확실하게 커서 t 값이 2.xx 면 p-value 값이 5% 보다 작아지고 그러면 귀무가설을 기각하고 두 개의 집단이 차이가 있다.
즉, A집단과 B 집단의 2kg의 차이는 유의수준 a=0.05하에 통계적으로 유의하지 않다.
클래스101 강의 복습!