Python - 과학계산을 위한 Jupyter(Armbian)
Odroid C2, Raspberry Pi 계열의 ARM CPU를 위한 Armbian 에서 과학계산을 위한 Jupyter 설치 및 구성까지 요약하고 있다.
https://packaging.python.org/guides/installing-scientific-packages/
과학계산을 위한 Python Jupyter
과학계산을 위한 Python 모듈을 시스템 패키지로 설치하고 pip
를 사용해서 Jupyter Notebook 을 설치하고 사용하는 과정을 정리했다.
- 개발 프론트 엔드: Jupyter
- 과학계산 모듈: numpy, scipy, pandas
Setup
시스템에 Python2, Python3 가 설치되었는지 확인:
- Ubuntu/Debian 계열: Python 2.7, Python 3.5 설치되어 있다.
- openSUSE : Python2.7
시스템 개발 패키지 설치
컴파일에 필요한 헤더 등이 포함된 개발자 라이브러리를 설치한다.
1 | sudo apt-get install build-essential |
python-dev, python-distlib, apython-setuptools 은 파이썬 개발과 패키징을 지원한다.
pip 설치
배포본에 pip가 설치되어 있지 않으면
1 | apt-get install python3-pip |
python3 설치후 마지막으로 update-alternatives
를 이용해 pip
를 pip3 로 연결해 준다.
다른 배포본에서 필요시 update-alternatives 사용:
1 | sudo update-alternatives --install /usr/bin/pip pip /usr/bin/pip3 30 |
라이브러리 설치
Scientific stack - apt
시스템 패키지로 과학계산을 지원하는 Python2, Python3 모듈을 설치.
1 | $ sudo apt-get install python-numpy python-decorator python-scipy python-matplotlib |
symbolic mathematics 관련 패키지도 설치한다.
1 | sudo apt-get install python-sympy python-nose |
설치되고 사용이 가능한지 확인한다. 다음 두 모듈 numpy, scipy 의 버전이 출력되면 된다.
1 | python -c "import numpy;print(numpy.__version__)" |
1 | python -c "import scipy;print(scipy.__version__)" |
여기까지 설치하면 의존성에 관련한 아래 같은 여러 패키지가 함께 설치된다.
- requests : Python package provides a graceful interface for making HTTP requests,
- pil : provides Python imaging capabilities,
- scrapy : is a web scraping framework,
- geopy provides geocoding and geodesic distance functions,
- shapely provides 2D geometry manipulation,
- pyproj: provides cartographic transformations. In the second command, jupyter provides interactive coding notebooks,
- geopandas spatializes pandas,
- OSMnx lets you work with OpenStreetMap street networks.
이 패키지들은 별도로 설치를 하고자 하면 pip
로 설치하거나 시스템 패키지로 다음 같이 설치 할 수 있다.
Python2
1 | sudo apt-get install python-requests python-pil python-scrapy python-geopy python-shapely python-pyproj |
Python3
pil -> Pillow
1 | sudo apt-get install python3-requests python3-pil python3-scrapy python3-geopy python3-shapely python3-pyproj |
Pandas
Pandas 로 데이터 셋트를 다룰 예정이라면
1 | sudo apt-get install libgdal-dev |
libgdal-dev 은 geopandas에서 geospatial analysis 에 필요하다.
1 | sudo apt-get install python-pandas python3-pandas |
### Jupyter Notebook
Jupyter는 웹 브라우저를 통해서 IDE 환경을 제공하고, 다양한 언어/문법을 지원하는 Kernel 이라는 해석기를 통해 IDE에서 코딩한 결과를 확인할 수 있다.
Jupyter 관련 모듈을 pip
로 사용자 환경에 설치하고 사용하겠다.
- 시스템에 설치된 Python3 와 pip 모듈
1 | sudo apt-get install libzmq3-dev |
libzmq3-dev은 쥬피터 노트북에서 필요로 한다.
pip
먼저 pip를 업그레이드 해준다.
1 | $ sudo pip install -U pip |
Python2.6부터 User scheme 개념이 도입되며서 pip
로 설치하는 패키지를 개별 사용자 환경 위치에 설치할 수 있다.
install 명령에 --user
옵션을 주고 설치한다.[^2]
- 기본으로 리눅스는 ~/.local 폴더이고,
- Mac OS X 는 ~/Library/Python/X.Y 에 위치한다.[^3]
그리고 PATH
에 ~/.local/bin 을 추가한다.
Install Jupyter
사용자 환경에서 pip로 Jupyter를 설치한다. Python3 환경에서 설치를 권장하고 있다.
1 | $ python3 -m pip install --user jupyter |
그리고 필요하면 Python2에서 설치할 수 있다.
1 | $ python2 -m pip install --user jupyter |
jupyter notebook
을 실행해 보자.
서버로 실행
jupyter notebook
을 바로 실행하면 로컬 머신의 브라우저를 실행한다. 여기서는 원격 사용을 위해 다음 같이 브라우저 없이 시작한다.
1 | $ jupyter notebook --no-browser --ip=* --port=8000 |
jupyter notebook을 시작하면 콘솔에 ?token=a.....
부분의 토큰을 복사해 브라우저에 입력후 쥬피터 노트북 사용을 시작한다. 브라우저로 노트북에 접속해서 복사한 토큰을 입력한 후 로그인한다.
{:width=”650”}
사용자 설치 모듈 목록
여기까지 pip로 사용자 환경 local에 설치한 모듈 목록을 백업해 둘 수 있다.
1 | $ pip freeze —-local > requirements.txt |
Upgrade jupyter
여기서는 pip 가상머신을 이용하고 있어서 다음 같이 pip install 명령으로 업그레이드 할 수 있다.
1 | $ python3 -m pip install -U --user jupyter |
### Jupyter 설정 이용
jupyter는 설치된 후에 jupyter 시스템 디렉토리와 사용자 JUPYTER_DATA_DIR에 필요한 내용을 저장한다.
- 시스템 디렉토리: /usr/local/share/jupyter/
- JUPYTER_DATA_DIR 는 보통 ~/.jupyter
설정 파일을 이용해서 사용자 비밀번호를 이용해 노트북을 사용할 수 있다.
먼저 실행중인 쥬피터 노트북에서 passwd()
를 실행해 패스워드 해시 값을 얻는다.
1 | In [1]: from notebook.auth import passwd |
패스워드 해시 값을 데이터 디렉토리의 설정 파일에 입력해야 한다.
데이터 설정 파일
먼저 다음 같이 설정 파일을 생성한다.
1 | $ jupyter notebook --generate-config |
mynotebook.py에 다음을 설정한다.
1 | #c.NotebookApp.notebook_dir = '/path/to/notebook_directory' |
복사한 패스워드 해시 값을 mynotebook.py 설정 파일 안의 c.NotebookApp.password
항목 주석을 풀고 해시 값을 입력한다.
1 | c.NotebookApp.password = 'sha1:4ee6bb2da3d7:ed76216b87228540e5f5f20fcfa8069cf82686f0' |
설정 파일을 이용해 jupyter-notebook을 실행한다.
1 | $ jupyter notebook --config .jupyter/mybook_config.py [DIR] |
이제 jupyter에 접속하려면 다음 같이 패스워드를 묻고 입력한 후에 사용할 수 있다.
{:width=”650”}
Background 실행
Jupyter-notebook을 백그라운드로 실행하려면 nohup
을 사용할 수 있다.
1 | $ nohup jupyter notebook --no-browser --ip=* --port=8000 [DIR] > log-jupyter.log & |
nohup은 재시동시 다시 시작해야 하는 불편한 점이 있다.
crontab 으로 실행
nohup 과 결합해서 사용해도 좋은 방법으로 crontab 을 사용해 재시동 후 자동으로 시작해 줄 수 있다. 사용자 crontab 을 편집해 다음 같이 사용할 수 있다.
1 | @reboot cd /home/foo; jnohup jupyter notebook --no-browser --ip=* --port=8000 [DIR] > log-jupyter.log & |
이 방법도 사용자가 시작/상태확인/종료 같은 직접적인 방법을 사용하기는 좀 불편하다.
그래서 upstart의 init.d 를 사용하거나 systemd 의 unit으로 생성해서 사용하는 것이 좋다.
systemd 에서 실행
systemd unit으로 새로운 unit 파일을 생성해서 기존 systemctl
명령으로 시작/상태/종료/재시작 등의 작업을 할 수 있다. 물론 재시동 관련해서도 완벽히 동작한다.
systemd의 unit 위치는 OS 마다 조금 다른 것 같다. 여기서는 /etc/systemd/system 밑에 jupyter.service 라는 유닉 파일로 직접 작업한다.
- /etc/systemd/system/jupyter.service
가상환경을 사용하고 있으므로 systemd unit의 ExecStart
의 python도 가상환경 위치로 지정해 주어야 한다.
1 | [Unit] |
그리고 시스템 유닛을 시작해 준다.
1 | systemctl enable jupyter.service |
현재 서버의 열린 포트는 다음 같이 netstat
명령으로 확인이 가능하다.
1 | $ netstat -tlnp |
virtualenv 이용
Python과 Virtualenv 환경을 더 알고 싶으면 다음 두 링크에 자세한 설명이 있다.
참조
Python - 과학계산을 위한 Jupyter(Armbian)
https://thinkbee.github.io/2017-10-30-jupyter-scitific-virtuaenv-2a3c1a7a4948/