5월 30일
- 분석하기 좋은 깔끔한 데이터 (Tidy Data) ->
long-form
- 변수가 열이고, 관측치가 행인 데이터
pandas
에서melt
를 지원- 참고할 만한 논문
pandas
는wide-form
이 시각화에 유리하지만,plotly
나seaborn
은long-form
이 유리함
pandas
를 이용한 전처리- 전혀 다른 형태의 데이터를 병합하는 방법
- 수치형 / 범주형 데이터의 차이를 이해하고 시각화하기
- 데이터 기초 기술통계를 통한 요약과 빈도 구하기
5월 31일
- 국민건강보험공단_의약품처방정보 대용량 데이터를 이용하는 방법
6월 1일
- 지방 선거로 인한 휴강
6월 2일
- 파이썬 모듈 만들기 (의존성에 따라)
- 리팩토링
- 가독성이 얼마나 좋아졌는지
- 의미가 얼마나 더 잘 이해되는지
- 은근슬쩍 틈틈이 해야함 (ex. 기능 추가 전/후로)
- 모듈 제작과 리팩토링은 복잡성을 관리하기 위함
\
-> linecontinuation charimport
다시하기1 2 3
from importlib import reload import foo foo = reload(foo)
- 파이썬 동작 확인 시각화
- Q. 모듈 안의 코드는 어떤 순서로 작성해야하는가?
- 의존성 그래프 순서대로
- 추상적 -> 구체적 (코드를 조금만 보고 전체적인 코드의 의미를 파악 가능한 순서)
- 추상적일수록 코드가 변경될 일이 적고, 구체적일수록 코드가 변경될 사능성이 높음
- 밖에서 호출되지 않는 함수들은
_
로 시작함
6월 3일
- 데이터 분석을 위한 통계 기초
요약
- 점점 기본적인 틀에 익숙해지고 활용하는데 큰 어려움이 없어지는거 같음
Comments powered by Disqus.