이번주 부터 새로운 툴에 대해서 배웠다.
바로 Python.
가장 기초부터 시작해, 빠르게 데이터 분석을 위한 라이브러리와 기능들까지.
한 주만에 배웠다고 하기엔 너무 많은 내용들이었다.
아래는 그것들을 정리해준 글들을 목차 겸 덧붙여 본다.
우선 복습하는 겸 가장 기초적인 내용에 대해서 포스팅 한 것부터 남겨본다.
기초라고 쓰고 전반적인 문법들을 통칭하는것이라 포스팅 글이 좀 많다.
특히 3번인 Comprehenshion은 가독성 좋게 늘 읽던거랑 달리 깊게 공부가 필요했다.
ChatGPT를 동원해 만든 각종 예제들을 풀고 공부한 결과들을 포함해서 기록으로 남긴다.
파이썬 기초 1 - 자료형
1. 숫자형int (정수형) float (실수형)숫자형은 연산이 가능하다.더보기a = 3b = 4print(a + b)print(a - b)print(a * b)print(a / b)print(a ** b) #제곱print(a % b) #나눗셈 후 나머지print(a // b) #나눗셈 후 몫a ==
retill28.tistory.com
파이썬 기초 2 - 제어문
1. if 문 조건의 참과 거짓을 판단해 그에 따라 동작을 수행합니다.if 조건문1: 수행문1 ... elif 조건문2: 수행문1 ... ... else: 수행문1 ...if 조건에 들어가는 참고
retill28.tistory.com
파이썬 기초 3 - Comprehenshion
[1] List Comprehenshion리스트 안에 for문을 포함하여 한 줄로 편하게 코드를 작성할 수 있게 하는 문법.형식 : [표현식 for 항목 in 반복가능객체 if 조건문]예문ls = []for i in range(1, 5): ls.append(i)prin
retill28.tistory.com
파이썬 기초 4 - 함수와 예외처리
함수 (Function)입력값을 받아서 명령을 수행하고 결괏값을 반환한다.사용자가 직접 선언, 사용할 수 있다. 선언 형태는 아래와 같다. 입력값 : (변수1, 변수2 / 출력값 : return으로 주는 값)def 함수명
retill28.tistory.com
파이썬 기초 5- 라이브러리
라이브러리타인이 만든, 혹은 기본 파이썬이 제공하는, 이미 만들어져있는 유용한 함수들의 모음자주 사용하는 기능을 쉽게 재사용할 수 있고 다른 사람과도 그 기능을 공유할 수 있습니다.라
retill28.tistory.com
파이썬 문법을 다 훑어본 다음으론,
데이터와 통계에 데한 패키지인 Pandas,
그리고 거기서 잘 쓰는 Dataframe
이 두가지에 대한 이해와, 각종 함수, 기능들을 배웠다.
더 나아가 데이터 전처리의 기본인 가공 및 집계에 관한 것도.
이건 처음 배우는 내용들이라 요약한다고 했는데도 다소 글이 많다.
dataframe 1 - 생성, 조회, 추출
목표 : Pandas 패키지 라이브러리를 사용한, Python 데이터 분석 1. series Pandas패키지에서는 series라는 리스트를 사용한다. 딕셔너리, 리스트로 시리즈를 만들 수 있다. dic = {'a':1,'b':2,'c':3}dic_series = p
retill28.tistory.com
dataframe 2 - 구조
1. 인덱스데이터프레임 행(가로)들의 이름을 인덱스라고 한다. 인덱스 일부 변경 - 데이터명.rename({인덱스:바꿀 인덱스, 인덱스:바꿀 인덱스, ...})인덱스 전체 변경 - 데이터명.index = 바꿀 인덱스
retill28.tistory.com
dataframe 3 - 데이터 가공
1. 결측값 처리 isna(): 결측값을 True로 반환합니다.notna(): 결측값을 False로 반환합니다.결측값 제거 : 데이터명.dropna(axis=0, how='any', subset=None) axis : {0: index / 1: columns}how : {'any' : 존재하면 제거 / 'al
retill28.tistory.com
dataframe 4 - 데이터 집계
1. 분포와 통계량describe() 함수를 통해 기초 통계량들을 구할 수 있다. 아래와 같은 함수를 사용해서 대푯값을 구할 수 있다,numeric_only = True 옵션을 통해 데이터 타입이 숫자인 항목에 한해 구할
retill28.tistory.com
마지막으론 시각화 라이브러리로
여러가지 그래프들을 그려보았다.
그려본것만 두자리수가 넘는데, 수업중에 한 가장 기본적인 것을 복습하는 겸 정리했다.
데이터 시각화 1
Python에서 데이터 시각화를 하기 위해 다음과 같은 두가지 라이브러리를 사용한다.matplotlib: 파이썬 데이터 시각화의 가장 기본적인 라이브러리. 유연하게 커스텀이 가능seaborn: matplotlib을 좀 더
retill28.tistory.com
학부 전공 중에 파이썬을 자주 했지만, 문법을 비롯한 순수 코딩에 가까웠었다.
이미 알고 있는 지식이니까 금방 따라잡을 수 있겠지 싶었더니,
꼭 그렇지만도 않은게.. matplot이나 numpy 같은건 연구실에 대한 자료가 아니라면 잘 쓰지 않으니까.
기껏 맘먹고 건드려서 코딩해보면,
시각화 라이브러리와 문자열을 처리하는 그 모든것들이
수시로 오류를 내고 꽤 구현이 힘든 기억들로만 남아있다.
그래서 처음 배우기에 더욱 자신이 없던, 데이터프레임 전용 라이브러리와 시각화에 많이 집중하고, 공부했다.
이번주엔 코드탐구와 기능을 알아보는데에 집중했고,
이제는 가지고 온 데이터셋에 대한 분석과 인사이트들을 파보는데에 신경써봐야겠다.
'패스트캠퍼스' 카테고리의 다른 글
[패스트 캠퍼스 부트캠프] 7주차 (0) | 2024.08.01 |
---|---|
[패스트 캠퍼스 부트캠프] 4주차 (0) | 2024.07.12 |
[패스트 캠퍼스 부트캠프] 2주차 (0) | 2024.06.28 |
[패스트 캠퍼스 부트캠프] 1주차 (0) | 2024.06.21 |
Big Data 이해 &Data Literacy (24.06.18) (0) | 2024.06.20 |