목록Study/Python (18)
Hayden's Archive
참고 : 장고걸스 튜토리얼 tutorial.djangogirls.org/ko/ 들어가며 · HonKit 1차 : 2015. 10. 1. 이수진, 함기훈, Jay Park, 조혜선, 정광윤, 임정훈, 문지영, 김휘경, 송석리, 여형석, 심혜민 tutorial.djangogirls.org 가상환경에서 작업하므로 터미널에서 가상환경이 활성화되어 있는지 확인하고 시작하자.(아래의 (myvenv)처럼 가상환경이 보여야 한다.) 활성화되지 않았을 경우 가상환경 활성화 방법은 지난 포스팅( hayden-archive.tistory.com/395 ) 참고 장고의 기본 골격을 만들어주는 스크립트를 실행하자. 맨 끝의 점을 꼭 빼먹지 않도록 한다. 현재 디렉토리에 장고를 설치하라고 스크립트에 알려주는 축약된 표시이다. $..
참고 : 장고걸스 튜토리얼 tutorial.djangogirls.org/ko/ 들어가며 · HonKit 1차 : 2015. 10. 1. 이수진, 함기훈, Jay Park, 조혜선, 정광윤, 임정훈, 문지영, 김휘경, 송석리, 여형석, 심혜민 tutorial.djangogirls.org 내가 사용 중인 우분투에는 이미 파이썬이 설치되어 있다. 적당한 디렉토리에 가서 가상환경을 만들어본다. 나는 Documents 디렉토리 아래 실습용 디렉토리를 만들고 그 아래 튜토리얼에서 말한 myvenv라는 가상환경을 만들어보았다. $ python3 -m venv myvenv 가상환경을 활성화시켜본다. 위에서 생성한 가상환경 디렉토리의 bin 폴더의 activate를 실행하는 것이다. $ source myvenv/bin/..
참고 : 파이썬 엑셀 쓰기 라이브러리 비교 참고 : 큰 엑셀 파일 내용 읽기 파이썬으로 엑셀 파일을 쓸 수 있는 라이브러리는 많다. 그 중에서도 가장 많이 쓰이는 openpyxl 라이브러리를 써볼까 한다. 윈도우에서 실행하였으며 openpyxl.readthedocs.io/en/latest/ 을 참고하여 실습하였다. 1. Anaconda Prompt 에서 다음 명령어로 openpyxl을 설치한다. $ pip install openpyxl 이미 설치되어 있을 경우 다음 명령어로 업그레이드한다. $ pip install --upgrade openpyxl 2. Jupyter Notebook에서 다음 코드가 실행되는지 확인한다. from openpyxl import Workbook 에러 없이 잘 실행된다. 3. ..
1) 우분투에 아나콘다 설치 참고 : greedywyatt.tistory.com/107 [Ubuntu 18.04] Anaconda 설치 및 가상환경 구축 ■ 참고문헌 ● https://enant.tistory.com/10 ● https://antilibrary.org/1746 ■ 본문 아나콘다 홈페이지에 들어가서 LInux 버전을 다운 받는다. 저는 Python 3.7 64-Bit(x86) Installer (654 MB) 를 다운.. greedywyatt.tistory.com 아나콘다 홈페이지에서 리눅스용으로 직접 다운받거나 아래의 명령어로 설치 wget https://repo.continuum.io/archive/Anaconda3-2020.07-Linux-x86_64.sh 다운받은 경로에 찾아가서 설..
함수는 정의해놓고 써야 함. 라이브러리에서 제공하는 함수를 갖다 쓸 때도 볼 줄 알아야 함. def = definition ★함수 헤더의 끝은 콜론(:)이다. => brace가 필요한 곳은 콜론을 찍음.. 머신러닝, 딥러닝을 하다보면, 함수를 우리가 정의해서 사용하는 경우가 많이 있다. 1. 기본문법 def 함수이름(매개변수): """ doc string...함수 기능에 대한 설명... (내가 만든 함수에 대한 주석) """ return (리턴할 게 있으면 리턴 키워드 쓰고 없으면 안 씀) 2. ★★★함수를 만드는 4가지 방법 (라이브러리에서 가져다 쓸 때 함수 사용법이 다르게 나옴. 그래서 이해해야 함.) - 위치 매개변수 - 기본 매개변수 - 키워드 매개변수 - 가변 매개변수 (파이썬 안 하고 자바나..
파이썬은 자바와 달리 code block을 쓰지 않고 indent(들여쓰기)를 씀
딕셔너리(Dictionary) 자바의 Map과 같이 Key, Value로 이뤄져 있고 {}로 둘러싸임. 잘 다뤄야 함. 셋(Set) 유니크한 데이터만 들어감.(중복 없음) 순서가 없음. 셋으로 리턴되는 것을 추출하기 편하게 하려면 리스트나 튜플로 변환시킴. 모양새는 {}
튜플은 모양새가 () 튜플을 만들 일은 잘 없지만 머신이나 딥에서 데이터 돌린 결과가 튜플로 리턴되는 경우가 꽤 있음. 튜플의 인덱싱과 슬라이싱은 리스트와 동일. 튜플은 어차피 조회 때만 쓴다. 데이터 분석은 거의 다 조회임. 데이터 생성할 일이 거의 없음. 데이터의 특징을 전략적으로 파악하고 시각적으로 표현하는 것. 튜플을 쓴다는 건 리스트 대신에 쓴다는 것. 튜플은 리스트보다 메모리 효율성이 훨씬 뛰어남. 메모리의 크기를 알아볼 수 있는 것 => sys.getsizeof() 이용해서 크기 비교...
2차원 배열은 행렬(Matrix) 구조. -> 이런 구조와 많이 닮은 파일이 엑셀. 데이터 분석에서 1차원 배열을 벡터라고 하고 2차원 배열를 매트릭스라고 함. 데이터 분석에서는 벡터보다 매트릭스 구조를 많이 다루게 됨. -> 이유? 행(row)이 사람의 명수, 건수가 되고 열(column)은 특징(feature)를 뜻하게 됨. feature들이 많을수록, 예컨대 600개 정도 되게 되면 연산하는데 굉장히 많은 시간이 걸리게 됨. 학습이 되려면 데이터의 양도 많아야 함. feature는 많은데 건수가 3개면 학습이 안 됨. 엑셀이나 csv로 데이터를 받아올 때 매트릭스 구조. 물음표 찍어보면 함수 속성 볼 수 있음. reverse가 False로 되어 있으므로 내림차순으로 정렬하려면 reverse를 Tru..