빅데이터 분석기사

빅데이터 분석기사 _ 3유형 정리

# 단일 표본 t-검정.
from scipy.stats import ttest_1samp
t_stat, p_value = ttest_1samp(sample, popmean)

# 독립 표본 t-검정.
from scipy.stats import ttest_ind
t_stat, p_value = ttest_ind(group1, group2)

# 대응 표본 t-검정.
from scipy.stats import ttest_rel
t_stat, p_value = ttest_rel(before, after)

# Shapiro-Wilk 정규성 검정.
from scipy.stats import shapiro
stat, p = shapiro(data)

#  Levene의 등분산 검정.
from scipy.stats import levene
stat, p = levene(group1, group2)

# Wilcoxon 부호 순위 검정.
from scipy.stats import wilcoxon
stat, p = wilcoxon(data1, data2)

# Mann-Whitney U 검정.
from scipy.stats import mannwhitneyu
stat, p = mannwhitneyu(data1, data2)

# 카이제곱 적합도 검정. 수치형 데이터
from scipy.stats import chisquare
stat, p = chisquare(f_obs, f_exp)

# 카이제곱 독립성 검정. 범주형 데이터
from scipy.stats import chi2_contingency
stat, p, dof, expected = chi2_contingency(table)

# 일원 분산 분석 (ANOVA).
from scipy.stats import f_oneway
stat, p = f_oneway(group1, group2, group3)

# 최소제곱회귀(Ordinary Least Squares).
from statsmodels.formula.api import ols
model = ols('y ~ x', data).fit()

# 로지스틱 회귀(Logistic Regression).
from statsmodels.api import Logit
model = Logit(y, X).fit()

from statsmodels.api as sm
model = sm.GLM(y, x, family = sm.families.Binomial()).fit()

# 분산 분석.
from statsmodels.api import anova_lm
anova_results = anova_lm(model)

저작자표시 비영리 변경금지 (새창열림)

'BigData' 카테고리의 다른 글

대형 언어 모델(LLM) 및 NLP 대표 분석 기법에 대하여 알아보자. (2)	2025.02.21
GLM과 Logit의 차이점은? (0)	2024.11.25
numpy의 concatenate() 함수를 사용할때 zero-dimensional arrays cannot be concatenated 오류 (1)	2024.11.17
ROC_AUC_Score / Accuracy / F1 Score의 차이와 선택 기준 (1)	2024.11.16
MAE / MSE / RMSE 차이와 선택 기준은? (2)	2024.11.15

암자의 코딩생활

빅데이터 분석기사 _3유형 정리

'BigData' 카테고리의 다른 글

티스토리툴바

빅데이터 분석기사 _3유형 정리

'BigData' 카테고리의 다른 글

관련글

티스토리툴바