Home
PRism
Cancel

Olist EDA 및 RFM 분석

Kaggle - Brazilian E-Commerce Public Dataset by Olist 참고 노트북 | Customer Segmentation & LTV 사용 라이브러리 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sn...

차원 축소(Dimension Reduction) 정리

차원 축소(Dimension Rduction) 매우 많은 피처로 구성된 다차원 데이터 세트의 차원을 축소해 새로운 차원의 데이터 세트를 생성하는 것 일반적으로 고차원으로 갈 수록, 데이터 포인트 간의 거리가 기하급수적으러 멀어지고 희소(sparse)한 구조를 가지게 됨 단순히 피처의 개수를 줄이는 개념보다는, 데이터를 더 잘 설명할 수있는 잠재적인 요...

회귀 (Regression) 정리

회귀(Regession) 통계학에서의 회귀 -> 여러 개의 독립 변수와 한 개의 종속 변수 간의 상관 관계를 모델링하는 기법 독립 변수의 값에 여향을 미치는 회귀 계수(Regression Coefficient) 머신러닝의 회귀는, 주어진 피처(특징/특성)와 결정 값 데이터 기반에서 학습을 통해 최적의 회귀 계수를 찾아내는 것 대표적인 회귀 모...

멋쟁이 사자처럼 AI School 13주차

7월 25일 프로젝트 발표 비지도 학습 차원 축소 차원의 저주 -> 고차원에서 데이터 밀도가 낮아지고 용량이 높아지는 현상 PCA(Principal Component Analysis) SVD TruncatedSVD (aka LSA) LatenetDirichletAllocation ...

22년 7월 4주차 주간 회고

1. Dacon Summer 대회 쇼핑몰 매출 예측 경진 대회에 참여해봤는데, 생각만큼 점수를 내지 못했음 점수가 잘 나온 사람들의 노트북을 보면 지점별로 나누어 예측을 했는데 아무리 봐도 어떤 방식인지 이해가 안됨.. 확실히 공부해야할게 너무 많은거 같다 2. 수어 인식 및 분류 모델 Deep Learning 프로젝트로 진행했는데, 짧은 시간 동안...

영문 수어 실시간 분류 모델

실시간 수어 분류 모델 한국 숫자 분류 모델 사용 라이브러리 import numpy as np import pandas as pd import matplotlib.pyplot as plt import koreanize_matplotlib import seaborn as sns from PIL import Image import pillow_heif...

DACON 쇼핑몰 지점별 매출액 예측 경진대회 2 모델링 (회귀 모델)

DACON - 쇼핑몰 지점별 매출액 예측 경진대회 Model - Regression Data DACON - 쇼핑몰 지점별 매출액 예측 경진대회 사용 라이브러리 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import korean...

DACON 쇼핑몰 지점별 매출액 예측 경진대회 1 EDA/Preprocessing

DACON - 쇼핑몰 지점별 매출액 예측 경진대회 EDA and Preprocessing Data DACON - 쇼핑몰 지점별 매출액 예측 경진대회 사용 라이브러리 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import kor...

Kaggle 마스크 타입 분류

Kaggle Face Mask Types Dataset 사용 라이브러리 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import os import glob import pathlib import splitfolders im...

멋쟁이 사자처럼 AI School 12주차

7월 18일 자연어 처리 (NLP) (주로) 텍스트를 벡터화하는 방법 머신러닝: 단어의 빈도수 딥러닝: 시퀀스 방식의 인코딩 정규 표현식 토큰화(Tokenization): 텍스트 조각을 토큰이라 함 패턴을 찾는데 유용 정제(Cleaning): ...