본문 바로가기
BigData

빅데이터 분석기사 _3유형 정리

by Lcoding 2024. 11. 21.
반응형

 

 

빅데이터 분석기사 _ 3유형 정리

# 단일 표본 t-검정.
from scipy.stats import ttest_1samp
t_stat, p_value = ttest_1samp(sample, popmean)

# 독립 표본 t-검정.
from scipy.stats import ttest_ind
t_stat, p_value = ttest_ind(group1, group2)

# 대응 표본 t-검정.
from scipy.stats import ttest_rel
t_stat, p_value = ttest_rel(before, after)

# Shapiro-Wilk 정규성 검정.
from scipy.stats import shapiro
stat, p = shapiro(data)

#  Levene의 등분산 검정.
from scipy.stats import levene
stat, p = levene(group1, group2)

# Wilcoxon 부호 순위 검정.
from scipy.stats import wilcoxon
stat, p = wilcoxon(data1, data2)

# Mann-Whitney U 검정.
from scipy.stats import mannwhitneyu
stat, p = mannwhitneyu(data1, data2)

# 카이제곱 적합도 검정. 수치형 데이터
from scipy.stats import chisquare
stat, p = chisquare(f_obs, f_exp)

# 카이제곱 독립성 검정. 범주형 데이터
from scipy.stats import chi2_contingency
stat, p, dof, expected = chi2_contingency(table)

# 일원 분산 분석 (ANOVA).
from scipy.stats import f_oneway
stat, p = f_oneway(group1, group2, group3)

# 최소제곱회귀(Ordinary Least Squares).
from statsmodels.formula.api import ols
model = ols('y ~ x', data).fit()

# 로지스틱 회귀(Logistic Regression).
from statsmodels.api import Logit
model = Logit(y, X).fit()

from statsmodels.api as sm
model = sm.GLM(y, x, family = sm.families.Binomial()).fit()

# 분산 분석.
from statsmodels.api import anova_lm
anova_results = anova_lm(model)
반응형

loading