목록자격증 도전 (13)
Star_project
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/nmi5O/btrBjIRuKPG/2lHPi3Vtxc2ChaxvgvMK9k/img.jpg)
추세 변동 : 추세변동이란 X(시간)에 따라 y(종속변수) 값이 달라진다는 것 오차의 최소 선을 그린게 추세변동 계절 변동 : 계절 변동은 특정 주기별로 같은 패턴을 보이는 파동의 형태 특징: ex. 온도, 일자별로 일수도 있음. 순환 변동 : 추세변동 + 계절 변동의 개념,, 일정한 주기를 가지고 추세를 따라감 불규칙변동 : 시간과 종속변수와의 관계로는 설명할 수 없는 변동 Ex) 천재지변, 태풍, 홍수 등 --> 추세, 계절, 순환 변동으로 설명 불가능하면 불규칙 변동. 추세를 ARIMA로 예측, 계절 순환 변동 은 SARIMA 추세, 계절, 순환을 제거하고 남은 잔차를 가지고 불규칙 변동 해석 사진 출처 : https://itfeature.com/time-series-analysis-and-fore..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/9UCpI/btrz45mRBCh/M3SIBx830mKYm0F6bwCvN1/img.png)
분류분석 평가지표 https://en.wikipedia.org/wiki/Receiver_operating_characteristic Receiver operating characteristic - Wikipedia Diagnostic plot Terminology and derivationsfrom a confusion matrix condition positive (P) the number of real positive cases in the data condition negative (N) the number of real negative cases in the data true positive (TP) A test result that correctly ind en.wikipedia.org 로지스틱..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/dDRr0n/btrz35tKbtQ/8Lzw3lVzyPkF4qhjpGjk1K/img.png)
구분 독립변수 X (설명변수) 범주형 연속형 종속변수 y (반응변수) 범주형 카이제곱 검정 로지스틱 회귀 (분류분석) 연속형 T검정, ANOVA검정 회귀분석 로지스틱 회귀 : 독립변수가 연속형, 종속변수가 범주형일때, 즉 목저은 범주형 변수를 연속형 변수로 설명하는 것. 종속변수가이산형일때, 0 , 1, 2 일때 연속형 변수는 어떠한 특징을 갖는지 . 사건의 발생 가능성을 예측 종속변수의 발생 가능성을 예측 분류기법이라고도 함. 종속변수가 이산형 변수(범주의 개수가 두개인 경우)일 때 사용. 1, 0으로 분류, (예, 남자, 여자) 종속변수가 2개 이상 범주인 경우 다항로지스틱 회귀 사용 https://www.javatpoint.com/logistic-regression-in-machine-learnin..
자료 유형에 따른 분석 방법의 결정 구분 독립변수 X (설명변수) 범주형 연속형 종속변수 y (반응변수) 범주형 카이제곱 검정 로지스틱회귀 분류 분석 연속형 T검정, ANOVA 검정 회귀분석 5.1 회귀분석 개념 하나 혹은 그 이상의 원인이 종속변수에 미치는 영향을 추적하여 식으로 표현하는 통계기법 변수들 사이의 인과관계를 밝히고 모형을 적합하여 관심있는 변수를 예측하거나 추론하기 위해 사용하는 분석 방법 독립 변수의 개수가 하나인 경우 단순선형회귀분석, 독립변수의 개수가 두 개 이상이면 다중선형회귀분석으로 분석함 5.2. 선형회귀분석 직선. 종속변수와 독립변수 간의 선형관계가 있는지 궁금. 잔차가 최소가 되는 최소제곱법을 사용함. 5.2.1. 선형회귀분석의 가정 독립변수와 종속변수 간의 선형성(선형회귀..
t-test : t-분포 ANOVA : F분포 1. 교차검정 : 카이제곱분포 사용 , 카이제곱 검정 설명변수가 범주형 자료인 경우 사용 각 범주에 따른 결과변수의 분포를 설명하거나, A, B, C가 20 : 40: 40 의 비율로 분포되어있다. or 범주형 변수가 2개 이상인 경우 두 변수가 상관이 있는지를 검정 X 변수와 X1 X2 X3 가 y 변수와 상관이 있는지 카이제곱 분포의 통계량을 통해서 t-value를 구한 후 검정할 수 있음. 교차표를 만들어서 볼 수 있음. value_counts , crosst:?? 카이제곱 검정에서 사용해야함. 2. 교차분석 개념 명목/ 서열 수준의 두 변수 간의 관계 적합성, 독립성, 동질성 검정. 카이제곱 검정통계량이 높으면 T-value 값이 낮아짐. 관찰빈도와 ..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/49HAy/btrzyWCMKF4/4z9HcHk6wJmV1I2Edp7kEk/img.jpg)
https://slideplayer.com/slide/3764428/ ANOVA TABLE Factorial Experiment Completely Randomized Design. - ppt download Sum of squares entries Similar expressions for SS B, and SS C. Similar expressions for SS BC, and SS AC. slideplayer.com 가설 검정 귀무가설 H0 : 3개 1) a 와 b의 상호작용 효과(교호작용)가 없다. 2) a변수에 따른 종속변수의 값에는 차이가 없다. 3) b변수에 따른 종속변수의 값에는 차이가 없다. 대립가설 H1 : 3개 1) a 와 b의 상호작용 효과(교호작용)가 있다. 2) a변수에 따른 종..
분산분석은 개수에 따라 일원배치, 이원배치, 다원배치 분산분석으로 나누어진다. 독립변수가 한 개일 경우 일원배치 분산분석을 한다. 분석 구분 분석 명칭 독립변수 개수 종속변수 개수 단일변량 분산분석 일원배치 분산분석 1개 1개 이원배치 분산분석 2개 다원배치 분산분석 3개 이상 다변량 분산분석 MAVOVA 1개 이상 2개 이상 1. 일원배치 분산분석의 개념 분산분석에서 반응값에 대한 하나의 범주형 변수의 영향을 알아보기 위해 사용되는 검증 방법이다. 모집단의 수에는 제한이 없으며, 각 표본의 수는 같지 않아도 된다. F 검정 통계량을 이용한다. 가정 각 집단의 측정치는 서로 독립적이며, 정규분포를 따른다. 각 집단 측정치의 분산은 같다. (등분산 가정) 요인 제곱합 자유도 평균제곱 F-value p 집단..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/E53Sz/btrzv5nBuwN/7HhGkoLEvAxWM34BSDsDwk/img.jpg)
https://slidetodoc.com/anova-i-part-2-class-14-how-do/ ANOVA I Part 2 Class 14 How Do Logic of F Test and Hypothesis Testing Form of F Test: Between Group Differences Within Group Differences Purpose: Test null hypothesis: Between Group = Within Group = Random Error Interpretation: If null hypothesis is not supported (F > 1) then Between Gr slidetodoc.com F value = 비율 = 두 분산의 비율 계산 between varia..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/N2TPk/btrzv5gLbjF/ztlXWViM7j0MJeSXO6nRKK/img.png)
https://www.wk-99.top/products.aspx?cname=one+tailed+t+test+formula&cid=6 one tailed t test formula www.wk-99.top 1. 일표본 검정 표본이 한개, 모집단의 평균을 추정, 하나의 집단이 평균이 어떠한 값이랑 같은지 다른지를 검정 https://towardsdatascience.com/which-hypothesis-test-to-perform-89d7044d34a1 Which hypothesis test to perform? The objective of statistics is to make inferences about a population based on information contained in a sampl..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/WkSy5/btrzv5nsPMg/xRF6lfkvDxR18qxNbWqYj0/img.png)
분산분석을 하기 위해서는 집단의 n개의 데이터 수와 분산을 알아야 함. 집단 내에 어느정도로 분포가 퍼져있는지 계산한 값. A 집단 평균:78 분산 : 9 표준편차 : 3 B 집단 평균 : 73 분산 : 9 표준편차 : 3 더보기 T-test를 통해 두 집단이 차이가 있는지 분석 집단 간의 차이가 집단 내의 편차보다 큰지 작은지 보는 것 집단 내의 차이가 집단 간의 차이보다 크다면 T값은 작아짐. 집단 내의 차이보다 집단 간의 차이가 크다면 분자가 커지므로써 t 값이 커짐. t 값이 커지면 집단 간 차이가 커짐 차이/ 분산 차이를 분산으로 비교. 즉, 분산을 알고 있다면 이 차이가 유의한지 아닌지 통계적으로 알 수 있음. 0.272 https://www.tdistributiontable.com/ T Ta..