Python 19

dataframe 4 - 데이터 집계

1. 분포와 통계량describe() 함수를 통해 기초 통계량들을 구할 수 있다.  아래와 같은 함수를 사용해서 대푯값을 구할 수 있다,numeric_only = True 옵션을 통해 데이터 타입이 숫자인 항목에 한해 구할 수 있다.    2. 상관관계 분석 corr() 함수를 통해 각 컬럼별 상관관계를 분석할 수 있다.  후에 배울 그래프와 결합하면 아래처럼 나타낼 수 있다.     3. groupby()같은 값을 한 그룹으로 묶어서 각종 연산과 통계값을 구하는 방법형식 : 데이터.groupby(컬럼명).연산및통계함수 df.groupby('Pclass').count()    #Pclass 각 그룹군에 대해 해당 값이 몇개인지 표로 보여줌 df.groupby('Pclass').nunique() #유니크한..

Python 2024.07.05

dataframe 3 - 데이터 가공

1. 결측값 처리 isna(): 결측값을 True로 반환합니다.notna(): 결측값을 False로 반환합니다.결측값 제거 : 데이터명.dropna(axis=0, how='any', subset=None)  axis : {0: index / 1: columns}how : {'any' : 존재하면 제거 / 'all' : 모두 결측치면 제거}subset : 행/열의 이름을 지정합니다.df.dropna(axis=1)         // 결측지 있는 열 제거 df.dropna(how='any')    // 결측지 존재하면 행 삭제 df.dropna(subset=['Cabin','Age'])   //해당 열에서 결측지 있으면 해당 열 제거 결측값 대치특정 컬럼의 결측값을 특정 값으로 변경데이터명[컬럼명].fill..

Python 2024.07.05

dataframe 2 - 구조

1. 인덱스데이터프레임 행(가로)들의 이름을 인덱스라고 한다. 인덱스 일부 변경 - 데이터명.rename({인덱스:바꿀 인덱스, 인덱스:바꿀 인덱스, ...})인덱스 전체 변경 - 데이터명.index = 바꿀 인덱스 리스트  열 하나를 통채로 인덱스로 설정도 가능하다 인덱스로 지정한 열을 다시 열로 변환할 때 1. 열을 남기고 싶으면  데이터명.reset_index()2. 열을 삭제하고 싶으면 데이터명.reset_index(drop = True)  2. 행추가 pd.concat([기존 데이터명, 붙일 데이터명])df3 = pd.concat([df1, df2])     #df1아래에 df2 데이터들이 추가됨제거데이터명.drop(인덱스명, axis=0)df3.drop([i for i in range(891,..

Python 2024.07.05

dataframe 1 - 생성, 조회, 추출

목표 : Pandas 패키지 라이브러리를 사용한, Python 데이터 분석 1. series Pandas패키지에서는 series라는 리스트를 사용한다. 딕셔너리, 리스트로 시리즈를 만들 수 있다. dic = {'a':1,'b':2,'c':3}dic_series = pd.Series(dic)dic_seriesls = [1,2,3]ls_series = pd.Series(ls, index=['a','b','c'])# index를 사용하지 않으면 0부터 인덱스가 부여된다 a    1b    2c    3 a    1b    2c    3  2. DataframeSeries를 이어붙여서 표로 만든 것을 Dataframe 이라고 한다. 딕셔너리, 리스트로 시리즈를 만들 수 있다. 딕셔너리로 만들기 리스트로 만들기..

Python 2024.07.05

파이썬 기초 5- 라이브러리

라이브러리타인이 만든, 혹은 기본 파이썬이 제공하는, 이미 만들어져있는 유용한 함수들의 모음자주 사용하는 기능을 쉽게 재사용할 수 있고 다른 사람과도 그 기능을 공유할 수 있습니다.라이브러리엔 두 종류가 있다. 표준과 외부표준 라이브러리: 파이썬을 설치할 때 자동으로 설치됩니다.외부 라이브러리: 기본으로 설치된 라이브러리가 아니므로 새로 설치해 주어야 합니다.라이브러리를 불러오는 방법 !pip install 라이브러리명        #외부 라이브러리 다운로드 import 라이브러리명              #다운된 라이브러리를 코드에서 사용하기 위한 준비  라이브러리 종류1. random - 각종 랜덤으로 값을 받기 위한 라이브러리 2. datetime - 시간, 날짜를 처리, 계산, 문자열 이용들을 위..

Python 2024.07.05

파이썬 기초 4 - 함수와 예외처리

함수 (Function)입력값을 받아서 명령을 수행하고 결괏값을 반환한다.사용자가 직접 선언, 사용할 수 있다. 선언 형태는 아래와 같다. 입력값 : (변수1, 변수2 / 출력값 : return으로 주는 값)def 함수명(변수1, 변수2, ...):     수행문1     수행문2     ...     return 결괏값 #결괏값이 없는 경우 생략 가능함수 선언 내부에서 사용한 변수는 함수 안에서만 작동하고 사라진다. 즉 함수외의 범위에서 사용하는 것과는 별개다x = 1def twice(x):    x = x * 2     #이 x는 첫줄의 x=1에서의 x랑은 별개    return xprint(twice(x))     # 결과 : 2print(x)               # 결과 : 1lambda 함..

Python 2024.07.05

파이썬 기초 3 - Comprehenshion

[1] List Comprehenshion리스트 안에 for문을 포함하여 한 줄로 편하게 코드를 작성할 수 있게 하는 문법.형식  :  [표현식 for 항목 in 반복가능객체 if 조건문]예문ls = []for i in range(1, 5):    ls.append(i)print(ls)ls = []for i in range(1, 5):    if i % 2 == 0:        ls.append(i)print(ls)words = ["apple", "banana", "cherry"]lengths = []for word in words :  lengths.append(len(word))print(lengths)ls = [i for i in range(1,5)]print(ls)ls = [i for i in ..

Python 2024.07.05

파이썬 기초 2 - 제어문

1. if 문 조건의 참과 거짓을 판단해 그에 따라 동작을 수행합니다.if 조건문1:     수행문1    ... elif 조건문2:     수행문1    ... ... else:     수행문1    ...if 조건에 들어가는 참고 연산표     2. while 문조건문이 참인 경우에 실행, 즉 거짓이 될때까지 반복하여 수행while ( 조건문 ) :    수행문1    수행문2 ...while 의 조건을 True로 주면 무한반복을 한다. 이때, 강제로 빠져나가려면 아래처럼 break를 사용한다.  더보기 jajang = 0while True:    jajang += 1    print(f'짜장면을 {jajang}그릇 먹었습니다.')    if jajang == 10:        print('무료 쿠..

Python 2024.07.05

파이썬 기초 1 - 자료형

1. 숫자형int (정수형) float (실수형)숫자형은 연산이 가능하다.더보기a = 3b = 4print(a + b)print(a - b)print(a * b)print(a / b)print(a ** b)   #제곱print(a % b)   #나눗셈 후 나머지print(a // b)    #나눗셈 후 몫a == b      #비교연산 - a와 b가 같은가   2. 문자형string - 문자 형태로 이루어진 자료형, 따옴표(''), 큰 따옴표("")로 글자를 감싼다 '123'이라는 값은 백이심삼 이라는 수량 값이 아니라 123이라는 숫자로 나타난 문자긴 문자는 '''Hello, World! Hello, Python!''' 처럼 따옴표 3개로 표기 가능문자열 연산은 아래와 같다.더보기문자열 연산 1 (+)..

Python 2024.07.05