반응형
1. 데이터 가져와서 특정 컬럼 값 기준으로 오름차순, 내림차순 하기.
import pandas as pd
df = pd.read_excel('score.xlsx',index_col = '순번')
#엑셀 내에 순번이 있어야 함.
# 오름차순 정렬
df.sort_values('키',inplace=True)
print(df)
# 내림차순 정렬
df.sort_values('키',inplace=True,ascending = False)
print(df)
앞의 예제들과 달리 2번째 줄에 index_col을 설정하였습니다.
2. 특정 컬럼 값 두개로 정렬하기
# 수학 기준으로 정렬하지만, 같은 점수일 때는 영어로 정렬
df.sort_values(['수학','영어'],ascending= False, inplace=True)
print(df)
df.sort_values(['수학','영어'],ascending = [True,False], inplace =True)
print(df)
3. Index로 정렬하기
df.sort_index()
4. Column 수정
# 북산고를 상북고로 바꾸기. 딕셔너리 형태로 정의 !!
df['학교'].replace({'북산고' : '상븍고', '능남고' : '무슨고'},inplace= True)
print(df)
df['SW특기'] = df['SW특기'].str.lower()
print(df)
df['학교'] = df['학교'] + '등학교'
print(df)
새로운 Column을 추가하고 싶다면, 새로운 column을 입력하면 알아서 잘 더해주게 됩니다.
df['총합'] = df['국어'] + df['수학'] + df['영어']+ df['과학'] + df['사회']
df['결과'] = 'Fail'
df.loc[df['총합']> 400, '결과'] = 'pass'
Column 삭제
# 컬럼 삭제
df.drop(columns = ['총합'],inplace=True)
df.drop(columns = ['국어','수학'],inplace=True)
print(df)
5. Row 수정
df.loc[8] = ['이정환', '해남고등학교',184,90,90,90,90,90,'Kotlin']
# 인플레이스 안해도 됨.
df.loc[5,['학교', 'SW특기']]= ['능남고등학교','C']
# 5번 학생의 학교 전학, SW 특기도 변경
print(df)
'파이썬 > 파이썬 데이터 분석, 데이터처리' 카테고리의 다른 글
Pandas) 데이터 분석 9편, 함수 적용 및 그룹화 (0) | 2023.01.16 |
---|---|
Pandas) 데이터 분석 7편, 데이터 필터링, and 및 or 등 다양한 조건, nan 처리 (1) | 2023.01.15 |
Pandas) 데이터 분석 6편, loc, iloc의 이해 (0) | 2023.01.15 |
Pandas) 데이터 분석 4편, 데이터 분석, 데이터 파싱, Column 추출 (0) | 2023.01.15 |
Pandas) 데이터 분석 3편, 파이썬으로 만든 데이터를 csv, excel 파일로 저장 및 읽기 (0) | 2023.01.15 |
댓글