Hayden's Archive
[Python-pandas] 데이터 그룹연산 - groupby() / pivot_table() / 알아두어야 할 함수들 본문
Study/Data
[Python-pandas] 데이터 그룹연산 - groupby() / pivot_table() / 알아두어야 할 함수들
_hayden 2020. 7. 13. 23:24< 차례 >
데이터 그룹연산 - groupby()
실전데이터 응용하기
알아두어야 할 함수들
피벗 테이블 pivot_table()
실전데이터 Pivot_Table 응용
문제1
문제2
사용자 함수 정의
* 데이터 그룹연산 - groupby()
* 실전데이터 응용하기
* 알아두어야 할 함수들
argmin(), argmax() => 굉장히 중요한 함수. 최솟값, 최댓값을 가지고 있는 인덱스를 반환
describe 통계적인 정보를 요약해서 출력해줌
* 피벗 테이블 pivot_table()
★중요(엑셀 다룬 사람들은 피벗 테이블 많이 봤을 것)
기존 데이터를 DataFrame으로 받아오면 그걸 변형해서 써야 하는데 그걸 Pivot Table이라고 함
-> 주로 인덱스를 재조정(일종의 그룹핑)
-> 피벗에서 인덱스는 그룹핑을 말함.
-> 그룹핑은 여러번 할 수 있음.
피벗에서 인덱스는 결국 groupby 함수로도 그룹핑할 수 있음.
컬럼을 안 주면 자동으로 값이 컬럼이 됨.
컬럼을 어떨 때 주는지 알아야 함.
피벗테이블에 컬럼을 안 주는 경우가 더 많음.
* 실전데이터 Pivot_Table 응용
* 문제1
* 문제2
* 사용자 함수 정의