본문 바로가기

좋아하는것/책

파이썬 JUPYTER NOTEBOOK 실전 입문



많은 사람들이 관심을 가지고 있는 인공지능 혹은 머신러닝에 대해서 학습을 하고자 스터디를 진행하기 위하여 그 기초를 만들기 위해 진행한 또 다른 스터디!!


많은 사람들은 데이터 분석을 데이터 사이언스 혹은 전 처리로 부른다.


그중에서 데이터의 분포를 확인하기 위한 시각화 도구로써 많이 사용되는 Jupyter Notebook에 대하여 아주 아주 자세하게 기초부터 설명 되어 있는 도서를 소개 하고자 합니다.


처음에 Python을 접하고 뭔가를 해봐야겠다 라고 Anaconda를 설치하고 나오는 개발자들에게 아주 아주 익숙한 화면..


씨꺼먼 화면에 덜렁 덜렁 있는 Anaconda Prompt...


처음 그 화면을 보고 있으면 정말 막막하다..


하지만 우리에게는 Jupyter Notebook이 있다.


물론 이미 클라우드 환경을 사용하고 계시는 분들이 계시면 익숙하겠지만


이를테면 MS의 Azure에 Notebook, Google의 Colaboratory 등이 이미 있으니까..



이 책은 Jupyter Notebook을 개발자 혹은 데이터 과학자들의 개발 환경에 설치를 하고 그에 대한 자세한 기능들 이를테면 단축키 부터 시작해서 각종 시각화 도구들을 사용할수 있는 방법을 알려준다.


대표적으로 많이 사용하는 Matplotlib이나 Bokeh 라이브러리에 대한 아주 아주 자세하게 알려 주고 있다.


또한, 비교적 최신 버전의 패키지를 기반으로 작성되어 있다.

현재 Jupyter Notebook의 최신 버전이 5.6.0이고 책에서 설치하는 버전은 5.0.0이다.

Major 버전이 동일 한것으로 비추어 볼때, 번역이 굉장히 빨리 이루어졌다는것도 직 간접적으로 알수 있다.


책의 내용은 읽기 편한 구조로 되어 있으며, 최대한 자세하게 소개하려는 저자의 의도들이 잘 들어나 있다.



각종 그래프의 설명과 함께 해당 그래프를 어떻게 표현하면 될지 표현 하는 과정의 그래프의 데이터는 어떻게 제공해야 할지 등에 대해서 잘 설명되어 있다.



함수 호출시의 각 파라미터에 대한 한글 설명이 있어 파라미터에 대한 변경을 통해서 기능에 대한 이해도를 높이려는데 집중하고 있는 부분이 많이 있다. 하나씩 바꿔서 해보면 가끔 오류가 날 때도 있지만 무엇이 어떻게 변경되는지 쉽게 확인 할수 있다.



각기 다른 데이터 형태로 표현하는 예시도 풍부하다.


만약 데이터 과학 혹은 데이터 분석에 관심이 있어 시작하려고 하는 사람이 있다면 입문서로 추천할 만한 책이다.


단, 다루고 있는 영역이 Jupyter Notebook에 집중되어 있다 보니 기초적인 것들에 대한 설명을 그다지 풍부하지 않아 보이기는 한다.


그런것들은 블로그 혹은 다른 도서를 통해서 보완해서 정독한다면 초기 입문자들에게 큰 도움이 될것 같다. 


나 역시 도움을 받아 이런 저런 그래프를 열심히 그려 보고 있다.


요런 그래프들 말이다.. ^^;;