Python

dataframe 2 - 구조

retill28 2024. 7. 5. 04:11

1. 인덱스

데이터프레임 행(가로)들의 이름을 인덱스라고 한다.

 

인덱스 일부 변경 - 데이터명.rename({인덱스:바꿀 인덱스, 인덱스:바꿀 인덱스, ...})

인덱스 전체 변경 - 데이터명.index = 바꿀 인덱스 리스트

 

열 하나를 통채로 인덱스로 설정도 가능하다

 

인덱스로 지정한 열을 다시 열로 변환할 때 

1. 열을 남기고 싶으면  데이터명.reset_index()

2. 열을 삭제하고 싶으면 데이터명.reset_index(drop = True)

 

 

2. 행

추가  pd.concat([기존 데이터명, 붙일 데이터명])
df3 = pd.concat([df1, df2])     #df1아래에 df2 데이터들이 추가됨
제거 이터명.drop(인덱스명, axis=0)
df3.drop([i for i in range(891, len(df3))])   #891부터 끝까지 삭제
중복 제거 이터명.drop_duplicates()  

 

 

3. 열

추가 데이터명[추가할 컬럼명] = 추가할 값
df1['age_simplified'] = df1['Age']     // age_simplified 열 추가
제거 데이터명.drop(제거할 컬럼명, axis=1)
df1.drop('given_name', axis=1)      
#여러개를 삭제하고 싶을때는 삭제하고 싶은 칼럼이름을 리스트로 제시
이름 변경 데이터명.rename({열이름:바꿀이름, 열이름:바꿀이름, ...}, axis=1) 
이터명.columns = 열 이름 리스트
df1.rename({'PassengerId':'Id'}, axis=1)
df1.columns = [i for i in range(12)]

 

 

 

 

 

 

 

 

'Python' 카테고리의 다른 글

dataframe 4 - 데이터 집계  (1) 2024.07.05
dataframe 3 - 데이터 가공  (1) 2024.07.05
dataframe 1 - 생성, 조회, 추출  (0) 2024.07.05
파이썬 기초 5- 라이브러리  (0) 2024.07.05
파이썬 기초 4 - 함수와 예외처리  (0) 2024.07.05