목록python (36)
Hayden's Archive
인덱싱과 슬라이싱 인덱싱만 쓰게 된다면 하나의 데이터(스칼라값)만 추출할 수 있음. - one row, one column을 스칼라값이라고 함. 인덱싱은 스칼라값을 추출하기 위한 방법. 슬라이싱을 쓰려면 반드시 인덱싱이 들어가야 함. 값을 추출하는 일이 비일비재하므로 인덱싱과 슬라이싱 굉장히 중요. 마지막 숫자는 포함되지 않는다. where절 => 3항 연산자와 동일 Numpy 통계함수
벡터와 배열을 위한 넘파이(Numpy) Numpy 배열 생성하기 array() 사용해서 np 배열 생성 랜덤함수 사용해서 np 배열 생성 np 배열과 리스트 비교 배열 초기화 Numpy 배열의 속성과 기본함수(ndim, shape, reshape) 랜덤함수와 seed값 설정하기 * 벡터와 배열을 위한 넘파이(Numpy) 벡터 -> 1차원이다! 데이터 분석에서는 살짝 다루지만(판다스에서 또 나옴) 머신이나 딥에서 넘파이가 많이 나옴. 3차원은 딥에서 다룸. 데이터 분석을 하는데는 2차원을 함. 모든 데이터는 우리가 보기에 난수같은 숫자로 만들어짐. 데이터 -> 보안상 고객 정보를 100만분의 1로 나누고 루트 씌우고 ~~ 형태(0~1 사이의 숫자. 난수처럼 보이는 숫자.)의 줌. -> 그래서 ..
함수는 정의해놓고 써야 함. 라이브러리에서 제공하는 함수를 갖다 쓸 때도 볼 줄 알아야 함. def = definition ★함수 헤더의 끝은 콜론(:)이다. => brace가 필요한 곳은 콜론을 찍음.. 머신러닝, 딥러닝을 하다보면, 함수를 우리가 정의해서 사용하는 경우가 많이 있다. 1. 기본문법 def 함수이름(매개변수): """ doc string...함수 기능에 대한 설명... (내가 만든 함수에 대한 주석) """ return (리턴할 게 있으면 리턴 키워드 쓰고 없으면 안 씀) 2. ★★★함수를 만드는 4가지 방법 (라이브러리에서 가져다 쓸 때 함수 사용법이 다르게 나옴. 그래서 이해해야 함.) - 위치 매개변수 - 기본 매개변수 - 키워드 매개변수 - 가변 매개변수 (파이썬 안 하고 자바나..
파이썬은 자바와 달리 code block을 쓰지 않고 indent(들여쓰기)를 씀
딕셔너리(Dictionary) 자바의 Map과 같이 Key, Value로 이뤄져 있고 {}로 둘러싸임. 잘 다뤄야 함. 셋(Set) 유니크한 데이터만 들어감.(중복 없음) 순서가 없음. 셋으로 리턴되는 것을 추출하기 편하게 하려면 리스트나 튜플로 변환시킴. 모양새는 {}
튜플은 모양새가 () 튜플을 만들 일은 잘 없지만 머신이나 딥에서 데이터 돌린 결과가 튜플로 리턴되는 경우가 꽤 있음. 튜플의 인덱싱과 슬라이싱은 리스트와 동일. 튜플은 어차피 조회 때만 쓴다. 데이터 분석은 거의 다 조회임. 데이터 생성할 일이 거의 없음. 데이터의 특징을 전략적으로 파악하고 시각적으로 표현하는 것. 튜플을 쓴다는 건 리스트 대신에 쓴다는 것. 튜플은 리스트보다 메모리 효율성이 훨씬 뛰어남. 메모리의 크기를 알아볼 수 있는 것 => sys.getsizeof() 이용해서 크기 비교...
인덱싱, 슬라이싱 개념 너무 중요!!! 인덱싱 : 특정한 위치에 있는 문자를 리턴해옴. 슬라이싱 : 어디서부터 어디까지.... 슬라이싱은 인덱싱을 내포하는 개념. 주요함수... len, split, join(split의 반대)는 꼭 알아야 함... 문자열을 split 써서 리스트로 반환됨... 리스트를 join 써서 합치면 문자열로 반환됨... => 둘 다 문자열에서 쓰는 함수... 자바에서는 자료구조라고 안하면 Collection이라고 함. 파이썬에서는 리스트가 가장 중요하고 그 다음이 딕셔너리. tuple을 만들어서 쓸 일은 잘 없다.