반응형
빅데이터 분석기사 _ 3유형 정리
# 단일 표본 t-검정.
from scipy.stats import ttest_1samp
t_stat, p_value = ttest_1samp(sample, popmean)
# 독립 표본 t-검정.
from scipy.stats import ttest_ind
t_stat, p_value = ttest_ind(group1, group2)
# 대응 표본 t-검정.
from scipy.stats import ttest_rel
t_stat, p_value = ttest_rel(before, after)
# Shapiro-Wilk 정규성 검정.
from scipy.stats import shapiro
stat, p = shapiro(data)
# Levene의 등분산 검정.
from scipy.stats import levene
stat, p = levene(group1, group2)
# Wilcoxon 부호 순위 검정.
from scipy.stats import wilcoxon
stat, p = wilcoxon(data1, data2)
# Mann-Whitney U 검정.
from scipy.stats import mannwhitneyu
stat, p = mannwhitneyu(data1, data2)
# 카이제곱 적합도 검정. 수치형 데이터
from scipy.stats import chisquare
stat, p = chisquare(f_obs, f_exp)
# 카이제곱 독립성 검정. 범주형 데이터
from scipy.stats import chi2_contingency
stat, p, dof, expected = chi2_contingency(table)
# 일원 분산 분석 (ANOVA).
from scipy.stats import f_oneway
stat, p = f_oneway(group1, group2, group3)
# 최소제곱회귀(Ordinary Least Squares).
from statsmodels.formula.api import ols
model = ols('y ~ x', data).fit()
# 로지스틱 회귀(Logistic Regression).
from statsmodels.api import Logit
model = Logit(y, X).fit()
from statsmodels.api as sm
model = sm.GLM(y, x, family = sm.families.Binomial()).fit()
# 분산 분석.
from statsmodels.api import anova_lm
anova_results = anova_lm(model)
반응형
'BigData' 카테고리의 다른 글
대형 언어 모델(LLM) 및 NLP 대표 분석 기법에 대하여 알아보자. (2) | 2025.02.21 |
---|---|
GLM과 Logit의 차이점은? (0) | 2024.11.25 |
numpy의 concatenate() 함수를 사용할때 zero-dimensional arrays cannot be concatenated 오류 (1) | 2024.11.17 |
ROC_AUC_Score / Accuracy / F1 Score의 차이와 선택 기준 (1) | 2024.11.16 |
MAE / MSE / RMSE 차이와 선택 기준은? (2) | 2024.11.15 |