목록Study/Data (15)
Hayden's Archive
import matplotlib.pyplot as plt plt.figure(figsize=(10,6)) # 가로사이즈 10, 세로사이즈 6 plt.plot(walk) plt.savefig('walk.png') # 같은 경로에 walk.png 저장됨 plt.show() # 객체 이름이 지저분하게 나와서 이거까지 입력하고 마무리해줌
인덱싱과 슬라이싱 인덱싱만 쓰게 된다면 하나의 데이터(스칼라값)만 추출할 수 있음. - one row, one column을 스칼라값이라고 함. 인덱싱은 스칼라값을 추출하기 위한 방법. 슬라이싱을 쓰려면 반드시 인덱싱이 들어가야 함. 값을 추출하는 일이 비일비재하므로 인덱싱과 슬라이싱 굉장히 중요. 마지막 숫자는 포함되지 않는다. where절 => 3항 연산자와 동일 Numpy 통계함수
벡터와 배열을 위한 넘파이(Numpy) Numpy 배열 생성하기 array() 사용해서 np 배열 생성 랜덤함수 사용해서 np 배열 생성 np 배열과 리스트 비교 배열 초기화 Numpy 배열의 속성과 기본함수(ndim, shape, reshape) 랜덤함수와 seed값 설정하기 * 벡터와 배열을 위한 넘파이(Numpy) 벡터 -> 1차원이다! 데이터 분석에서는 살짝 다루지만(판다스에서 또 나옴) 머신이나 딥에서 넘파이가 많이 나옴. 3차원은 딥에서 다룸. 데이터 분석을 하는데는 2차원을 함. 모든 데이터는 우리가 보기에 난수같은 숫자로 만들어짐. 데이터 -> 보안상 고객 정보를 100만분의 1로 나누고 루트 씌우고 ~~ 형태(0~1 사이의 숫자. 난수처럼 보이는 숫자.)의 줌. -> 그래서 ..
국가통계정보 (1) KOSIS 국가통계포털( http://kosis.kr ) : 통계청을 비롯해 여러 통계 작성기관에서 제공되고 있는 통계정보를 제공하고 있는 국가통계포털 예) [주제별 통계] - [인구 • 가구] - [인구동향조사] - [출생] - [출산순위별 출생] - [시군구] - [시군구/성/출산순위별 출생] (2) e-나라지표( http://www.index.go.kr ) : 국정 전문 분야에 대한 각종 국정 통계에 대해 정확한 통계와 추이, 통계분석 등을 제공 예) [e-나라지표] - [부문별 지표] - [경제] - [거시경제] - [물가동향] - [소비자물가지수] (3) 마이크로데이터 통합서비스( https://mdis.kostat.go.kr/) : 사용자가 직접 자료를 가공하여 처리할 수 ..
1) SPSS( http://www.spss.co.kr ) : 광범위한 분야에 대한 데이터 입력, 데이터 관리 및 통계 분석을 목적. 통계적 분석 절차 이외에도 데이터 마이닝(Data Mining), 리포팅(Reporting) 등의 다양한 기능이 들어있는 뛰어난 데이터 소프트웨어 2) SAS( http://www.sas.com/ ) : 범용 통계 패키지로서 자료의 처리 기능이 뛰어나며, 데이터베이스(Database), 데이터웨어 하우징(Data Warehousing), 각종 응용 프로그램과의 호환 등을 포함한 통합 패키지로 자료의 처리 기능이 뛰어남. 자료의 단순한 통계적 처리보다는 방대한 양의 자료처리와 여러 가지 데이터 분석을 통한 의사결정에 도움을 주는 프로그램. BASE SAS : SAS의 가장 ..