반응형 BigData20 네이버의 검색 API 및 네이버 데이터랩 API 사용 방법에 대하여 알아보자 안녕하세요.오늘은 네이버의 검색 API 및 네이버 데이터랩 API를 사용하는 방법에 대하여 알아보겠습니다. 네이버 개발자 센터 - https://developers.naver.com/main/ NAVER Developers네이버 오픈 API들을 활용해 개발자들이 다양한 애플리케이션을 개발할 수 있도록 API 가이드와 SDK를 제공합니다. 제공중인 오픈 API에는 네이버 로그인, 검색, 단축URL, 캡차를 비롯 기계번역, 음developers.naver.com 네이버 개발자 센터 페이지에서 로그인하면 여러가지 API를 지원 받을 수 있습니다. 해당 사이트에서 애플리케이션 등록 → 내 애플리케이션 (등록한 해당 애플리케이션 선택) →API설정 → 사용 API → 사용할 API를 등록합니다. API 리스트네.. 2025. 2. 25. 대형 언어 모델(LLM) 및 NLP 대표 분석 기법에 대하여 알아보자. 안녕하세요. 오늘은 대형 언어 모델(LLM) 및 NLP 대표 분석 기법에 대하여 알아보겠습니다. 1. 대형 언어 모델(LLM)의 정의정의:대형 언어 모델은 방대한 양의 텍스트 데이터를 학습하여 언어의 패턴, 문맥, 의미를 이해하고 생성할 수 있는 딥러닝 모델입니다.아키텍처: 주로 Transformer 기반으로 구성되어 있으며, self-attention 메커니즘을 통해 복잡한 언어 표현을 학습합니다.예시: GPT, BERT, T5 등이 있습니다.특징:다양한 NLP 태스크(번역, 요약, 질문 응답, 감성 분석 등)를 하나의 모델로 수행할 수 있습니다.사전 학습 후 특정 태스크에 대해 미세 조정(fine-tuning)을 진행하여 높은 성능을 발휘합니다. 2. LLM을 활용한 대표 NLP 분석 기법2_1. .. 2025. 2. 21. GLM과 Logit의 차이점은? 안녕하세요 오늘은 로지스틱 회귀분석할때 사용되는, GLM과 Logit의 차이점에 대하여 알아보겠습니다. 로지스틱 회귀분석에서 GLM(Generalized Linear Model)과 Logit은 유사한 목적으로 사용되지만,이 둘은 주로 모델링 방식과 사용 목적의 차이에 따라 구분됩니다. 각각의 개념과 차이점은 다음과 같습니다. 1. GLM (Generalized Linear Model)개념 - 일반화 선형 모델(GLM)은 회귀 분석의 확장 형태로, 종속 변수의 분포가 정규 분포가 아니더라도 모델링할 수 있도록 설계되었습니다. 다양한 링크 함수(link function)와 확률 분포를 사용할 수 있는 유연한 모델입니다. 로지스틱 회귀와의 관계 - GLM은 로지스틱 회귀를 포함한 더 일반적인 프레임워크입니.. 2024. 11. 25. 빅데이터 분석기사 _3유형 정리 빅데이터 분석기사 _ 3유형 정리# 단일 표본 t-검정.from scipy.stats import ttest_1sampt_stat, p_value = ttest_1samp(sample, popmean)# 독립 표본 t-검정.from scipy.stats import ttest_indt_stat, p_value = ttest_ind(group1, group2)# 대응 표본 t-검정.from scipy.stats import ttest_relt_stat, p_value = ttest_rel(before, after)# Shapiro-Wilk 정규성 검정.from scipy.stats import shapirostat, p = shapiro(data)# Levene의 등분산 검정.from scipy.stat.. 2024. 11. 21. numpy의 concatenate() 함수를 사용할때 zero-dimensional arrays cannot be concatenated 오류 안녕하세요. 오늘은 numpy의 concatenate() 함수를 사용할때,zero-dimensional arrays cannot be concatenated 오류가 발생하는 경우에 대하여 알아보겠습니다. --- OneHotEncoder ---from sklearn.preprocessing import OneHotEncoderX_TRAIN = X_TRAIN.select_dtypes('object').copy()X_VAL = X_VAL.select_dtypes('object').copy()X_TEST = X_test.select_dtypes('object').copy()enc = OneHotEncoder().fit( X_TRAIN )X_TRAIN_OHE = enc.transform( X_TRAIN)X_.. 2024. 11. 17. ROC_AUC_Score / Accuracy / F1 Score의 차이와 선택 기준 안녕하세요, roc_auc_score / accuracy / f1_score의 차이와 선택 기준에 대하여 알아보겠습니다. roc_auc_score, accuracy, f1_score는 모두 모델의 성능을 평가하는 지표지만,평가하는 관점과 사용하는 상황이 다릅니다. 1. ROC_AUC_Score (Receiver Operating Characteristic - Area Under the Curve) ROC AUC는 이진 분류 모델에서 주로 사용되는 성능 지표로, 모델의 분류 성능을 종합적으로 평가합니다. ROC 곡선: 모델의 **참 양성 비율 (True Positive Rate, TPR)**과 **거짓 양성 비율 (False Positive Rate, FPR)**을 각각 y축과 x축에 나타낸 그래프입니다.. 2024. 11. 16. 이전 1 2 3 4 다음 반응형