외계어로 구성된 책 제목;

요즘 개발자들은 익혀야 할 것들이 많다. 그중 하나가 기계학습(머신러닝과 딥러닝)이 아닐까? 예전에 비해 컴퓨팅 파워가 저렴해지면서 일반 개발자들도 기계학습의 기본 개념을 익히고 사용할 수 있게 되었다. 하지만 익히는 과정은 순탄하지만은 않다. 내 경우도  여러번 시도를 해보았지만, 수학식들에 파묻혀 내가 익히고싶던 주제를 잘 정복하지 못했다.

 

이번에 살펴본 'XGBoost와 사이킷런을 활용한 그레이디언트 부스팅'의 가장 큰 장점은 잘 설계된 구성이다. 하나하나 예제를 따라가 보면서 지도학습 알고리즘의 개념과 다양한 모델이 나온 배경(개발자의 고민)을 이해할 수 있었다. 그래서 모처럼 머신러닝 책을 깔끔하게 완독했다.  아주 초심자용 책은 아니다. 기계학습에 대한 개략적 이해를 선행한 다음, 수학식에 파묻히기 보다는 이 책으로 예제를 통해 실용적인 관점으로 그레디언트 부스팅의 개념을 이해하는 것이 효과적이라 생각한다. 심화학습은 별개의 문제이다. 즉, 다르게 표현하자면 이 책은 지도학습분야에서 숲을 소개하는 책으로 느껴진다. 예제들은 널리 공개되어있는 데이터셋을 사용했는데, 데이터 자체의 특성이나 내용에 대한 소개는 조금 부족하다. 책이 전체적으로 지도학습 모델이 정확도를 높여가는 진화과정을 소개하는 형태로 구성되어 있다. 나에게는 이런 방식이 그동안 빠르게 발전해온 지도학습의 역사를 이해하는데 도움이 많이 되었다. 세세한 모델과 수식을 기대하는 독자들은 아쉬울 수 있겠다.

 

원서의 경우 Packt에서 310쪽으로 출간했는데,  우리나라 버전은 박해선님이 매끄럽게 잘 번역하였다. 우리나라 버전은 380쪽으로 살짝 늘어났다. 하지만 Safari Book에서 제안하는 것처럼 약 6시간만에 읽을 수 있는 책은 아니다. 군데군데 추가되어있는 역자 노트는 역자의 경험이 함축되어있는 보조 지식을 담고 있어서 원문의 이해를 돕고 있다.

 

파이썬에 대한 기본 문법은 이해하고 있어야 읽기 수월하다. pandas나 numpy 패키지에 대해 간략하게 사용법을 소개하는 정도로 예제들이 구성된다. 이 부분이 부족한 사람들은 파이썬 책을 참고도서로 보면 좋겠다. 없어도 막히거나 할 수준은 아니다.

나는 책에서 소개한 것처럼 아나콘다 버전을 사용하지 않고 직접 파이썬으로 필요한 패키지들을 설치하였다. 윈도우에서 실습해 보았는데, 내가 사용한 환경은 다음과 같다.

  • 파이썬 3.9.12
  • Numpy 1.22.3
  • SciPy 1.8.0
  • SciKit-Learn 1.1.0
  • XGBoost 1.5.2
  • Jupyter 1.0.0
  • Notebook 6.4.11
  • Pandas 1.1.4 

PIP로 설치했는데, 별다른 이슈없이 잘 설치되었고, 예제 또한 책에서 소개된 대로 잘 진행되었다.

 

지도학습을 프로젝트에 적용해 보고 싶은 개발자들에게 추천한다.

종이질은 살짝 아쉽다. 빛 반사가 있는 지질이라. 스탠드 아래에서 보면 반사되어서 글이 잘 안보인다. ㅠㅠ

한 챕터씩 읽을때마다 개념들을 익히는 즐거움은 있지만... 기억에 남는 건 model 만들고  데이터셋을 split한 다음, model에 fit해서 테스트 데이터 넣어보고....평균 오차 뽑고.. 반복.

 

  "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

반응형

리눅스 펭귄 TUX 오랜만이야~ 네 친구 불량펭귄(불펭)도 보고싶다.

 

WSL을 제대로 사용하기 위한 첫걸음

WSL은 윈도우를 메인 개발환경으로 사용하는 개발자가 여러 다양한 운영체제, 특히 유닉스/리눅스 계열 운영체제에서 동작하는 서비스를 개발하거나  윈도우에 더 강력한 생산성 도구를 추가 사용하고 싶을 때 고려되는 옵션중 하나이다. MS 윈도우는 GUI를 기반으로 사용자들에게 편리하게 쓰기 쉬운 개인용 컴퓨터 운영체제가 되었지만, 서버의 영역에서는 리눅스(POSIX 운영체제들)에 많이 밀렸다. 다양한 툴과 GNU 컴파일러들, 다양한 서버 프로그램 등 리눅스가 제공해주는 강력한 기능들은 개발자들에게 윈도우에서도 너무 쓰고싶은 리눅스만의 매력 포인트였다.

클라우드 시대가 전개되면서 리눅스는 더 많은 개발자들의 많은 지지를 받게 된다.  하지만 MS는 Visual Studio, 오피스 등 각종 강력한 도구들을 갖추고 있는 회사 아닌가! 운영체제 차원에서는 BSD를 기반으로 하는 맥북이 Unix의 강점을 잘 활용할 수 있는 구조였기에 나도 한동안 맥북을 개발 메인용도로 사용하였다. 집에서는 윈도우를 사용하고 윈도우 기반 앱을 개발하다보니 윈도우를 벗어날 수 없어 한동안 MinGW/msys 나 VirtualBox 같은 도구로 VM을 생성하여 리눅스를 설치하고 사용했었다. 일정 정도 원하는 바를 해소해주는 방안이긴 했으나 호스트 운영체제인 윈도우와 VM상의 리눅스는 상호 운용성이 부족하고, VM 관리도 불편하여 초반 설정후 잘 안쓰게 되었다.

 하지만 WSL이라는 게임 체인저가 등장했다. WS(Windows Subsystem)이라는 개념은 초기 32비트 앱을 실행하기 위한 서브시스템에서 출발했지만 이제는 리눅스(WSL)에서 안드로이드(WSA)까지 확장되어 기존 운영체제 장벽을 허물고 있다. 그런데 의외로 WSL에 대한 서적은 나오질 않았는데, 이 책은 WSL을 다룬 첫번째 국내 서적이다.

리눅스에 사용경험이 있는 윈도우 사용자라면 MS가 워낙 쉽게 구성해서 WSL을 설치 사용해 본 적이 있을 것이다. 그런데 그 구조나 구성 원리에 대한 소개는 찾아보기 어려웠다. 그러나 보니 상호 운용성을 고려해서 설계된 WSL의 능력을 100% 사용하지 못하는 것이 아닌가 생각하던 차에 이 책을 접하게 되었다.

WSL 2 아키텍쳐

이 책의 구조: WSL의 과거와 현재, 미래 방향을 이해하자

이 책은 전체 구조부터 활용까지 WSL이 시도하는 전체 로드맵을 간결하게 소개하고 있다.

 

1장에서는 WSL이 만들어지기까지의 MS사의 시도들, 아스토리아나 드로 브릿지부터 WSL 1과 WSL2의 구조를 설명하면서 이에 대한 장단점을 기술하고 있다. 이런 역사를 다루는 것은 역시 이러한 기술이 왜 등장했으며 어떤 방향으로 나아가고 있는지를 이해하는데 큰 도움이 된다.

2장에서는 WSL을 설치하는 과정을 다룬다. 이미 나는 WSL을 사용한 경험이 있기 때문에 큰 무리없이 읽을 수 있었다.

3장에서는 이제 윈도우와 리눅스를 섞어 사용하기 위하여 디스크 마운팅이나 경로 설정/변환을 다룬다. 쉘 스크립트를 통해 윈도우/리눅스간 장점을 활용하기 위해서는 충분히 이해하고 있어야 한다. 예를 들어 /etc/wsl.conf 파일의 [interop] 섹션을 통해 리눅스 서브 시스템에서 윈도우 프로그램을 연계하여 실행한다거나 윈도우에 설정된 시스템 환경변수 값을 어떻게 가져오는지에 대한 동작을 간략히 소개한다.

4장에서는 WSL 백업에 관한 이야기인데, 사실 나는 내 개인 블로그의 이전 글에서 WSL백업을 다룬 적이 있었다. C드라이브의 용량부족을 해소하기 위하여 다른 디스크로 기본 경로를 옮겼었는데, 그때는 기술 블로그를 보면서 따라하는 수준이었다면 4장의 내용을 통해 왜 그렇게 되는지를 좀 더 이해할 수 있게 되었다.

책에서는 WSL1과 WSL2를 같이 사용할 수 있다고 되어있겠지만, 특별한 이유가 없다면 최신 기술인 WSL2를 이용하는 것이 좋다. 5장에서는 WSL2의 구조적 변화를 설명하고 있다. WSL2의 효용가치를 높이기 위해 마이크로소프트사가 직접 관리하는 리눅스 커널을 사용하고 있는 것도 놀라웠다. (마치 우리 MS가 바뀌었어요를 보는 느낌.) 

6장의 파일시스템과 7장의 네트워킹은 윈도우/리눅스간 상호 운용성을 어떻게 구현하고 있는지에 대한 기반 기술을 간략하게 소개하고 있다. WSL을 구성하는 파일시스템 형식이 volfs, drvfs, tmpfs, procfs, sysfs 등 여러개인 것은 생각하지 못했던 부분이었다. 각 파일시스템과 용도, 특징을 잘 소개하다보니 MS가 왜 그렇게 구현했고, WSL이 어떻게 동작하는지에 대한 이해가 높아진다. 막연히 윈도우와 리눅스간 파일 공유는 SAMBA를 사용하지 않았을까 했는데 P9NP라는 프로토콜로 새롭게 구축한 배경도 재미있게 읽었다.

8장과 9장은 개발환경 구축, 리눅스용 프로그램을 윈도우에서 실행하는 방법과 도구를 소개하고 있는데, WSL을 처음 접하는 개발자라면 도움이 될 것이다. 윈도우에서 실행한 비주얼스튜디오 코드에서 리눅스 서브시스템에 접근하여 코드를 개발하는 방법 등을 소개하고 있다.

 

WSL을 통해 리눅스와 윈도우 두 운영체제 명령어를 섞어 사용하여 둘간의 격차를 좁힐 수 있다.

WSL의 빠른 개발속도로 인해 책 내용과 살짝 안맞는 부분이 있다. 예를 들어 윈도우 터미널에서 WSL을 설정하는 부분이 예전에는 설정파일이었는데, 이제는 GUI에서 설정하도록 변경되었다. 하지만 책 내용을 이해하고 따라하는데에는 문제가 되지 않는 정도이다.

 

WSL을 처음 사용할 때 반드시 읽어보고 시작할만한 책 

이 책은 WSL을 사용해 보고자 하는 개발자 또는 WSL을 예전 리눅스를 사용하던 느낌으로만 쓰고 있는 개발자들이 WSL의 능력을 좀 더 이해하고자 할 때 좋은 길잡이가 될 수 있는 책이다. "개발자 및 IT 전문가를 위한 리눅스용 윈도우 하위 시스템 실무 안내서"라는 이 책의 부제가 딱 들어맞는 내용과 구성이다. 관련 기술들을 훑고 있다는 점에서는 좋게 평가한다. 다만 기술의 깊이 면에서는 조금 더 자세히 설명해 주어도 괜찮지 않았을까 하는 아쉬움이 들지만.. 그래도 잘 구성한 실무 안내서이다.

 

개인적으로 별점 4.5개를 부여해 본다. 당연하지라고 생각했던 WSL에 대한 구조를 좀 더 이해할 수 있게 되었다. 이 책을 읽고나니 WSL에 좀 더 궁금점들이 생겨서 "Pro WSL"(APress)을 읽어보고 있다. 이 책을 통해 WSL의 기본 개념을 얻었기 때문인지 상대적으로 쉽게 읽고 있는 중이다.

 

이책을 통해 학습하면서 알게된 사이트 몇군데를 함께 공유한다.

 

YES24 구입 좌표: http://www.yes24.com/Product/Goods/107889281

 

처음 만나는 WSL - YES24

설치 방법부터 다양한 활용까지 쉽고, 간편하고, 빠르게 익히는 WSL WSL은 가상 머신이나 듀얼 부팅 설정 없이 윈도우에서 최적화된 리눅스 환경을 제공하는 시스템이다. 이 책은 WSL을 사용하는

www.yes24.com

 

마이크로소프트사의 WSL  한글 문서 페이지: https://docs.microsoft.com/ko-kr/windows/wsl/

 

Linux용 Windows 하위 시스템 설명서

Linux용 Windows 하위 시스템 설명서의 개요입니다.

docs.microsoft.com

 

마이크로소프트 코맨드라인이라는 개발 블로그: https://devblogs.microsoft.com/commandline/

 

Windows Command Line

Windows Terminal, Console and Command Line, Windows Subsystem for Linux, WSL, Windows Package Manager

devblogs.microsoft.com

   "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

반응형

+ Recent posts