본문 바로가기
파이썬/파이썬 데이터 분석, 데이터처리

Pandas) 데이터 분석 8편, 데이터 정렬 및 row, column 데이터 수정

by SeH_ 2023. 1. 16.
반응형

1. 데이터 가져와서 특정 컬럼 값 기준으로 오름차순, 내림차순 하기.

import pandas as pd 


df = pd.read_excel('score.xlsx',index_col = '순번')
#엑셀 내에 순번이 있어야 함.

# 오름차순 정렬 
df.sort_values('키',inplace=True)
print(df)


# 내림차순 정렬
df.sort_values('키',inplace=True,ascending = False)
print(df)

앞의 예제들과 달리 2번째 줄에 index_col을 설정하였습니다.

 

 

 

2. 특정 컬럼 값 두개로 정렬하기 

# 수학 기준으로 정렬하지만, 같은 점수일 때는 영어로 정렬 
df.sort_values(['수학','영어'],ascending= False, inplace=True)
print(df)

df.sort_values(['수학','영어'],ascending = [True,False], inplace =True)
print(df)

 

 

 

3. Index로 정렬하기

df.sort_index()

 

4. Column 수정 

# 북산고를 상북고로 바꾸기. 딕셔너리 형태로 정의 !! 
df['학교'].replace({'북산고' : '상븍고', '능남고' : '무슨고'},inplace= True)
print(df)

df['SW특기'] = df['SW특기'].str.lower()
print(df)


df['학교'] = df['학교'] + '등학교'
print(df)

 

새로운 Column을 추가하고 싶다면, 새로운 column을 입력하면 알아서 잘 더해주게 됩니다. 

df['총합'] = df['국어'] + df['수학'] + df['영어']+ df['과학'] + df['사회']


df['결과'] = 'Fail'
df.loc[df['총합']> 400, '결과'] = 'pass'

 

Column 삭제

# 컬럼 삭제
df.drop(columns = ['총합'],inplace=True)
df.drop(columns = ['국어','수학'],inplace=True)
print(df)

 

 

5. Row 수정

df.loc[8] = ['이정환', '해남고등학교',184,90,90,90,90,90,'Kotlin']
# 인플레이스 안해도 됨.
df.loc[5,['학교', 'SW특기']]= ['능남고등학교','C']
# 5번 학생의 학교 전학, SW 특기도 변경
print(df)

 

댓글