Hayden's Archive

[Python-pandas] 데이터 그룹연산 - groupby() / pivot_table() / 알아두어야 할 함수들 본문

Study/Data

[Python-pandas] 데이터 그룹연산 - groupby() / pivot_table() / 알아두어야 할 함수들

_hayden 2020. 7. 13. 23:24

< 차례 >

데이터 그룹연산 - groupby()
실전데이터 응용하기
알아두어야 할 함수들
피벗 테이블 pivot_table()
실전데이터 Pivot_Table 응용
문제1
문제2
사용자 함수 정의

 

* 데이터 그룹연산 - groupby() 

위로↑


* 실전데이터 응용하기 

위로↑


* 알아두어야 할 함수들 

argmin(), argmax() => 굉장히 중요한 함수. 최솟값, 최댓값을 가지고 있는 인덱스를 반환

 

describe 통계적인 정보를 요약해서 출력해줌

위로↑


* 피벗 테이블 pivot_table() 

★중요(엑셀 다룬 사람들은 피벗 테이블 많이 봤을 것)
기존 데이터를 DataFrame으로 받아오면 그걸 변형해서 써야 하는데 그걸 Pivot Table이라고 함

-> 주로 인덱스를 재조정(일종의 그룹핑)
-> 피벗에서 인덱스는 그룹핑을 말함.
-> 그룹핑은 여러번 할 수 있음.

피벗에서 인덱스는 결국 groupby 함수로도 그룹핑할 수 있음.

컬럼을 안 주면 자동으로 값이 컬럼이 됨.
컬럼을 어떨 때 주는지 알아야 함.
피벗테이블에 컬럼을 안 주는 경우가 더 많음.

위로↑


* 실전데이터 Pivot_Table 응용 

위로↑


* 문제1 

위로↑


* 문제2

위로↑


* 사용자 함수 정의

위로↑