Pandas) 데이터 분석 8편, 데이터 정렬 및 row, column 데이터 수정

1. 데이터 가져와서 특정 컬럼 값 기준으로 오름차순, 내림차순 하기.

import pandas as pd 


df = pd.read_excel('score.xlsx',index_col = '순번')
#엑셀 내에 순번이 있어야 함.

# 오름차순 정렬 
df.sort_values('키',inplace=True)
print(df)


# 내림차순 정렬
df.sort_values('키',inplace=True,ascending = False)
print(df)

앞의 예제들과 달리 2번째 줄에 index_col을 설정하였습니다.

2. 특정 컬럼 값 두개로 정렬하기

# 수학 기준으로 정렬하지만, 같은 점수일 때는 영어로 정렬 
df.sort_values(['수학','영어'],ascending= False, inplace=True)
print(df)

df.sort_values(['수학','영어'],ascending = [True,False], inplace =True)
print(df)

3. Index로 정렬하기

df.sort_index()

4. Column 수정

# 북산고를 상북고로 바꾸기. 딕셔너리 형태로 정의 !! 
df['학교'].replace({'북산고' : '상븍고', '능남고' : '무슨고'},inplace= True)
print(df)

df['SW특기'] = df['SW특기'].str.lower()
print(df)


df['학교'] = df['학교'] + '등학교'
print(df)

새로운 Column을 추가하고 싶다면, 새로운 column을 입력하면 알아서 잘 더해주게 됩니다.

df['총합'] = df['국어'] + df['수학'] + df['영어']+ df['과학'] + df['사회']


df['결과'] = 'Fail'
df.loc[df['총합']> 400, '결과'] = 'pass'

Column 삭제

# 컬럼 삭제
df.drop(columns = ['총합'],inplace=True)
df.drop(columns = ['국어','수학'],inplace=True)
print(df)

5. Row 수정

df.loc[8] = ['이정환', '해남고등학교',184,90,90,90,90,90,'Kotlin']
# 인플레이스 안해도 됨.
df.loc[5,['학교', 'SW특기']]= ['능남고등학교','C']
# 5번 학생의 학교 전학, SW 특기도 변경
print(df)

저작자표시

'파이썬 > 파이썬 데이터 분석, 데이터처리' 카테고리의 다른 글

Pandas) 데이터 분석 9편, 함수 적용 및 그룹화 (0)	2023.01.16
Pandas) 데이터 분석 7편, 데이터 필터링, and 및 or 등 다양한 조건, nan 처리 (1)	2023.01.15
Pandas) 데이터 분석 6편, loc, iloc의 이해 (0)	2023.01.15
Pandas) 데이터 분석 4편, 데이터 분석, 데이터 파싱, Column 추출 (0)	2023.01.15
Pandas) 데이터 분석 3편, 파이썬으로 만든 데이터를 csv, excel 파일로 저장 및 읽기 (0)	2023.01.15

Pandas) 데이터 분석 8편, 데이터 정렬 및 row, column 데이터 수정

'파이썬 > 파이썬 데이터 분석, 데이터처리' 카테고리의 다른 글

댓글

티스토리툴바

Pandas) 데이터 분석 8편, 데이터 정렬 및 row, column 데이터 수정

'파이썬 > 파이썬 데이터 분석, 데이터처리' 카테고리의 다른 글

관련글

댓글

티스토리툴바