Excel 10

데이터 시각화 - 거품형 차트 & 지도

* 실습내용 *코로나 확진자 현황 데이터를 분석해전국 지도 위에 거품형 차트로 나타내기  1. 데이터 전처리  - raw 데이터의 날짜들을 분리, vlookup을 위해 고유번호 생성    2. vlookup을 이용해 위의 표에는 월별 지역별 확진자수 누적, 아래 표에는 현월에서 전월을 빼서 지역별 확진자수 현황을 구한다.    3.  2번의 아래표를 활용해 x, y옆에 입력하는 월에 따라 해당 월의 확진자 수를 불러온다.아래는 5월의 지역별 확진자수를 불러옴. 월을 입력하는 열 아래에 들어간 함수는 아래와 같다. vlookup과 match 사용.=VLOOKUP($AA5,$M$26:$Z$45,MATCH($AD$4,$M$26:$Z$26,0),0)x와 y는 배경으로 넣을 대한민국 지도에서 각 지역의 위치 좌표..

Excel 2024.06.28

통계적 데이터 분석 / 모델링 : 시계열 데이터 분석

시계열 데이터 분석  시계열(時系列) 데이터 時 : 시간 시 / 系 : 이을 계 / 列 : 벌일(늘어뜨린) 열즉, 시간의 흐름에 따라 발생된 데이터를 분석하는 기법 시계열 데이터는 정상성을 가진 정상 시계열 데이터와 정상성을 가지고 있지 않은 비정상 시계열 데이터로 구분한다. 비정상 시계열 데이터는 분석이 어려우므로 정상 시계열 데이터로 변환해서 분석하기도 한다.  여기서 정상성이란, 추세와 계절성을 가지고 있지 않으며 관측된 시간에 무관함을 말하낟. 추세란, 오르거나 내려가는 증감의 형태를 말한다고 보면 되고, 계절성이란, 특정 기간 동안 반복되서 나타나는 성질을 말한다. 수많은 방법 중 지수 평활법에 대해서 실습까지 해보기로 했다.     지수 평활법(Exponential Smoothing) 현재 시..

Excel 2024.06.28

통계적 데이터 분석 / 모델링 : 회귀분석

상관 분석 두 변수가 어떤 선형적인 관계를 가지고 있는지를 분석하는 방법. 각 변수를 x, y축에 넣고 그 변하는 정도, 상관 계수 (기울기)를 구한다. 상관계수는 -1이상 1이하의 값을 가지며, 0.7 이상일땐 강한 양의 상관관계, -0.7 이하일땐 강한 음의 상관관계를 가진다.   Excel 데이터 분석을 통해 좌측 표의 각 열에 대하여 상관관계를 구하면 우측 표가 된다.우측 하단 표를 정리하여 조건부 서식으로 시각화한게 우측 상단표. 매출과 각각의 요소는 평균 이상의 상관관계를 보이고 있는데,그 중에서도 매출과 판매수량의 상관계수가 매우 높다. 또 해당 표에서는 모든 요소들은 양의 상관관계를 가지며 음의 상관관계는 하나도 없다. 그럼 양의 상관관계를 가지는 두 관계는 반드시 인과관계가 있는가?  그..

Excel 2024.06.28

통계적 데이터 분석 / 모델링 : t-test

통계의 갈래 기술통계학 : 요약 통계량, 그래프 표 등을 이용해 데이터를 정리, 요약하여 데이터의 전반적인 특성을 파악하는 방법.표, 그래프 등을 활용해 데이터를 시각적으로 표현하고 통계량 등으로 수치를 요약함 추론 통계학 : 데이터가 모집단으로부터 나왔다는 가정하에 모집단으로부터 추출된 표본을 사용하여 모집단의 특성을 파악하는 방법 점 추정, 구간 추정을 하거나 가설을 검정한다.  가설 검정 - 표본의 정보를 사용해서 가설의 합당성 여부를 판정하는 과정귀무 가설(𝐻0, 영 가설) 기본적으로 참으로 추정되며 처음부터 버릴 것으로 예상하는 가설(차이가 없거나, 의미 있는 차이가 없는 경우)대립 가설(𝐻1, 연구 가설) 귀무 가설에 대립하는 명제. 보통 독립 변수와 종속 변수 사이에 어떤 특정한 관련이 ..

Excel 2024.06.28

통계

통계학 산술적 방법을 기초로, 다량의 데이터를 관찰하고 정리 분석하는 방법을 연구하는 학문 연구의 대상이 되는 모집단(조사하고자 하는 전체 집단)으로부터 자료를 수집, 정리하고,표본 정보로부터 자료를 추출한 모집단에 대한 정보, 추론, 의사결정등 다양한 인사이트를 도출한다.     기초 통계용어변량 : 각 데이터의 값 (만 16세 학생 100명의 키)계급 : 변량을 일정 간격으로 나눈 구간  (키 170cm이상 175cm 이하)도수 : 각 계급에 속하는 변량의 개수 (키 170~175cm의 학생은 16명)상대 도수 : 전체 변량 중  각 계급에 속하는 변량의 비율 (계급 키 170~175cm의 상대도수는 16퍼) 도수분포표 : 각 계급에 따른 도수를 조사해서 표로 나타낸것히스토그램 : 도수분포표를 시각화..

Excel 2024.06.28

탐색적 데이터 분석

탐색적 데이터 분석 ( EDA, Exploratory Data Analysis)기존의 통계학이 정보의 추출 과정에서 가설 검정 등에 치우쳐 자료가 가지고 있는 본연의 의미를 찾는데 어려움이 있어, 이를 보완하고자 주어진 자료만 가지고도 충분한 정보를 찾을 수 있도록 하는 자료 분석 방법  기초 통계량 - 데이터의 간결한 요약을 위한 통계값. 자료의 특성을 나타내는 대표성들이 있다. 중심경향성 : 데이터 분포의 중심을 보여주는 값 ( 최빈값, 중앙값, 산술평균, 가중평균, 기하평균...)퍼짐정도 : 자료가 얼마나 흩어져있고 모였는지( 분산, 표준편차, 범위. IQR)왜도 (skewness) : 분포의 좌우 비대칭성 정도 ( 오른쪽 치우짐 - negative, 왼쪽 치우침 - positive)첨도 (kurt..

Excel 2024.06.22

대시보드 완성하기

시각화 자료들을 통해 위와 같은 대시보드 만들기 슬라이서에서 어떤 지역, 몇월을 선택하느냐에 따라 그래프들이 변한다.  1. 좌측의 슬라이서들 만들기 2. 막대그래프 그리기 3. 영역형, 꺾은선 그래프 그리기        1. 좌측의 슬라이서들 만들기 - 아래와 같이 피벗테이블 만들기 피벗테이블 메뉴중 슬라이서를 생성하면 각 피벗테이블마다 슬라이서가 생성된다.     2. 막대 그래프 그리기 아래와 같이 월별 Sales 표를 하나, 차트 열을 하나 만든다.  여기서 차트 열이란, 피벗테이블에서 선택한 값이, 구분값의 월과 같으면 차트에 Sales를 표시한다. 즉, 피벗테이블에서 선택한 월의 Sales만 차트 표에 표시한다. 아래 그림은 5월을 선택해서 5월 차트에만 sales가 나타난다. Sales와 C..

Excel 2024.06.21

Excel 응용 - 손익계산서 예제

앞서 배운 함수들을 응용해서 위의 손익계산서를 완성해보는 게 목표.  1. 전사 = 영업1본부 + 영업 2본부 2. 영업 1본부 = 영업 α팀 + 영업 β팀3. 영업 2본부 = 영업 A팀 + 영업 B팀       =SUMIFS('RAW2030(실습)'!$K:$K,'RAW2030(실습)'!$C:$C,'PL2030(실습)'!D$51,'RAW2030(실습)'!$G:$G,'PL2030(실습)'!$B52,'RAW2030(실습)'!$J:$J,'RAW2030(실습)'!$N$3) 로우 데이터에서 매출액에 해당하는 모든 셀들의 값을 더할것 -> SUMIF 조건 1 : 날짜에서 1월, 조건2 : 중분류 중 매출액, 조건 3 : 영업 α팀 위의 수식을 아래와 옆, 다른 셀들에도 수식 복사해서 나머지도 채운다.      위의..

Excel 2024.06.21

Excel 유용한 기능들

1. 피벗 테이블이란? 원본 데이터(큰 표) 중 일부 레이블만 갖고와서 짧게 보여주는 표  행에 region, segment, 열에 Month, 그리고 값에 sales들의 합을 넣어둔 피벗 테이블.피벗 테이블을 만들때엔 행과 열에 무엇을 넣을지 구체적으로 생각하고 넣을것.        2. 조건부 서식 특정 조건을 만족하는 데이터에 정해둔 서식을 적용하게 하는 기능 예 : 1000 이상의 데이터 값에 대해 셀 배경을 붉은색에 가깝게 칠하는 규칙  좌측 : 2가지 색조형, 0에 가까울수록 초록, 1000에 가까울수록 붉은색 가운데 : 데이터 막대형, 1000을 100%로 하고 각 셀의 데이터를 막대그래프로 나타냄우측 : 아이콘 집합형 , 1000이상 붉은색, 200이상 노란색, 그 외 초록색  조건부 서식..

Excel 2024.06.21

Excel 함수 모음

1. 연산덧셈 - SUM(범위) 평균 - AVERAGE (범위)숫자 데이터 갯수 - COUNT (범위) 데이터가 있는 셀 갯수 - COUNTA(범위)비어있는 셀 갯수 - COUNTBLANK(범위)하나의 조건 만족하는 셀 갯수 - COUNTIF(범위, "조건")2개 이상 조건 만족하는 셀 갯수 - COUNTIFS(조건 1 범위, "조건1", 조건 2범위, "조건2")2. 논리 IF(조건, 조건 만족시 결과, 불만족시 결과 )IF(조건, 조건 만족시 결과, IF(조건, 조건 만족시 결과, 불만족시 결과 )) 처럼 중첩 가능3. 데이터 가져오기 VLOOKUP (검색할 값, 데이터의 범위(=공통기준), 기준에서 불러올 데이터의 열 번호, T or F)예시 : = VLOOKUP( $E3, $C:$J, 3, 0) ..

Excel 2024.06.20