1. 인덱스
데이터프레임 행(가로)들의 이름을 인덱스라고 한다.
인덱스 일부 변경 - 데이터명.rename({인덱스:바꿀 인덱스, 인덱스:바꿀 인덱스, ...})
인덱스 전체 변경 - 데이터명.index = 바꿀 인덱스 리스트
열 하나를 통채로 인덱스로 설정도 가능하다
인덱스로 지정한 열을 다시 열로 변환할 때
1. 열을 남기고 싶으면 데이터명.reset_index()
2. 열을 삭제하고 싶으면 데이터명.reset_index(drop = True)
2. 행
추가 | pd.concat([기존 데이터명, 붙일 데이터명]) |
df3 = pd.concat([df1, df2]) #df1아래에 df2 데이터들이 추가됨
|
제거 | 데이터명.drop(인덱스명, axis=0) |
df3.drop([i for i in range(891, len(df3))]) #891부터 끝까지 삭제
|
중복 제거 | 데이터명.drop_duplicates() |
3. 열
추가 | 데이터명[추가할 컬럼명] = 추가할 값 |
df1['age_simplified'] = df1['Age'] // age_simplified 열 추가
|
제거 | 데이터명.drop(제거할 컬럼명, axis=1) |
df1.drop('given_name', axis=1)
#여러개를 삭제하고 싶을때는 삭제하고 싶은 칼럼이름을 리스트로 제시 |
이름 변경 | 데이터명.rename({열이름:바꿀이름, 열이름:바꿀이름, ...}, axis=1) 데이터명.columns = 열 이름 리스트 |
df1.rename({'PassengerId':'Id'}, axis=1)
df1.columns = [i for i in range(12)]
|
'Python' 카테고리의 다른 글
dataframe 4 - 데이터 집계 (1) | 2024.07.05 |
---|---|
dataframe 3 - 데이터 가공 (1) | 2024.07.05 |
dataframe 1 - 생성, 조회, 추출 (0) | 2024.07.05 |
파이썬 기초 5- 라이브러리 (0) | 2024.07.05 |
파이썬 기초 4 - 함수와 예외처리 (0) | 2024.07.05 |