패스트캠퍼스

[패스트 캠퍼스 부트캠프] 2주차

retill28 2024. 6. 28. 09:12

 

2주차 부트캠프의 주내용은 크게 두 개로 나눌 수 있다. 

 

 

하나는 통계학, 하나는 Excel을 사용한 실습. 

평균, 분산, 표준편차 등 기초 통계와 관련된 부분은 고등학교 시절 수학에서 다뤘기도 하다. 

이에 대한 복습을 조금 했고 관련 내용에 대한 짤막한 요약은 아래에 포스팅했다.

 

 

통계

통계학 산술적 방법을 기초로, 다량의 데이터를 관찰하고 정리 분석하는 방법을 연구하는 학문 연구의 대상이 되는 모집단(조사하고자 하는 전체 집단)으로부터 자료를 수집, 정리하고,표본 정

retill28.tistory.com

 

 

 

 

통계는 크게 2가지로 나눌 수 있다. 

 

기술통계학 : 요약 통계량, 그래프 표 등을 이용해 데이터를 정리, 요약하여 데이터의 전반적인 특성을 파악하는 방법이다. 표, 그래프 등을 활용해 데이터를 시각적으로 표현하고 통계량 등으로 수치를 요약함


추론 통계학 : 데이터가 모집단으로부터 나왔다는 가정하에 모집단으로부터 추출된 표본을 사용하여 모집단의 특성을 파악하는 방법 점 추정, 구간 추정을 하거나 가설을 검정한다.

 

 

그러니까 전자는 데이터를 보고 평균이 얼만지, 최대 최소는 얼마가 나왔고, 평균보다 이상 이하인건 무엇이며...

이런 수치들에 대한 각종 통계값을 통한 분석을 하는 방법. 

후자는 데이터를 보고 이 다음에 올 예측치를 가늠한다던가, 추출한 일부 데이터로 전체를 가늠해 보는 추론에 대한 부분. 물리 수업 때 수치를 점으로 찍어 추세선을 구하고 그 값이 얼마라서 공식을 확인하는.. 그런 과정들이랑 유사하다.

 

EDA라고 하여, 탐색적 데이터 분석  시간에는 주로 기술 통계학을 다루었다. 

실제 함수를 사용하거나, 분석 툴을 이용하거나 두가지 방법이 있다. 

이 자체는 별 것 아닌듯 하지만 모든 분석의 기초가 되는 느낌. 

 

탐색적 데이터 분석

탐색적 데이터 분석 ( EDA, Exploratory Data Analysis)기존의 통계학이 정보의 추출 과정에서 가설 검정 등에 치우쳐 자료가 가지고 있는 본연의 의미를 찾는데 어려움이 있어, 이를 보완하고자 주어진

retill28.tistory.com

 

 

 

데이터 모델링을 시각화와 연관지어 추론 통계학을 배웠다.

각 분석 모델에 따른 이론과 실습 과정을 분류해서 각각 글로 묶어보았다. 

 

통계적 데이터 분석 / 모델링 : t-test

통계의 갈래 기술통계학 : 요약 통계량, 그래프 표 등을 이용해 데이터를 정리, 요약하여 데이터의 전반적인 특성을 파악하는 방법.표, 그래프 등을 활용해 데이터를 시각적으로 표현하고 

retill28.tistory.com

 

 

통계적 데이터 분석 / 모델링 : 회귀분석

상관 분석 두 변수가 어떤 선형적인 관계를 가지고 있는지를 분석하는 방법. 각 변수를 x, y축에 넣고 그 변하는 정도, 상관 계수 (기울기)를 구한다. 상관계수는 -1이상 1이하의 값을 가지며, 0.

retill28.tistory.com

 

 

통계적 데이터 분석 / 모델링 : 시계열 데이터 분석

시계열 데이터 분석  시계열(時系列) 데이터 時 : 시간 시 / 系 : 이을 계 / 列 : 벌일(늘어뜨린) 열즉, 시간의 흐름에 따라 발생된 데이터를 분석하는 기법 시계열 데이터는 정상성을 가진 정상

retill28.tistory.com

 

 

데이터 시각화 - 거품형 차트 & 지도

* 실습내용 *코로나 확진자 현황 데이터를 분석해전국 지도 위에 거품형 차트로 나타내기  1. 데이터 전처리  - raw 데이터의 날짜들을 분리, vlookup을 위해 고유번호 생성    2. vlookup을 이용해

retill28.tistory.com

 

 

 

다음주 부터는 파이썬 수업을 시작한다고 하니

이번주 내로 공공데이터 분석건을 조금 더 다뤄보고 분석해서 여러 인사이트를 꺼내보는 연습을 주말에 해볼 계획이다. 

수학, 통계학 같은 이론적인 부분들은 다른 툴을 다룰때에도 크게 다를것 같지 않으니 꼭꼭 다시 볼 것!