외계어로 구성된 책 제목;

요즘 개발자들은 익혀야 할 것들이 많다. 그중 하나가 기계학습(머신러닝과 딥러닝)이 아닐까? 예전에 비해 컴퓨팅 파워가 저렴해지면서 일반 개발자들도 기계학습의 기본 개념을 익히고 사용할 수 있게 되었다. 하지만 익히는 과정은 순탄하지만은 않다. 내 경우도  여러번 시도를 해보았지만, 수학식들에 파묻혀 내가 익히고싶던 주제를 잘 정복하지 못했다.

 

이번에 살펴본 'XGBoost와 사이킷런을 활용한 그레이디언트 부스팅'의 가장 큰 장점은 잘 설계된 구성이다. 하나하나 예제를 따라가 보면서 지도학습 알고리즘의 개념과 다양한 모델이 나온 배경(개발자의 고민)을 이해할 수 있었다. 그래서 모처럼 머신러닝 책을 깔끔하게 완독했다.  아주 초심자용 책은 아니다. 기계학습에 대한 개략적 이해를 선행한 다음, 수학식에 파묻히기 보다는 이 책으로 예제를 통해 실용적인 관점으로 그레디언트 부스팅의 개념을 이해하는 것이 효과적이라 생각한다. 심화학습은 별개의 문제이다. 즉, 다르게 표현하자면 이 책은 지도학습분야에서 숲을 소개하는 책으로 느껴진다. 예제들은 널리 공개되어있는 데이터셋을 사용했는데, 데이터 자체의 특성이나 내용에 대한 소개는 조금 부족하다. 책이 전체적으로 지도학습 모델이 정확도를 높여가는 진화과정을 소개하는 형태로 구성되어 있다. 나에게는 이런 방식이 그동안 빠르게 발전해온 지도학습의 역사를 이해하는데 도움이 많이 되었다. 세세한 모델과 수식을 기대하는 독자들은 아쉬울 수 있겠다.

 

원서의 경우 Packt에서 310쪽으로 출간했는데,  우리나라 버전은 박해선님이 매끄럽게 잘 번역하였다. 우리나라 버전은 380쪽으로 살짝 늘어났다. 하지만 Safari Book에서 제안하는 것처럼 약 6시간만에 읽을 수 있는 책은 아니다. 군데군데 추가되어있는 역자 노트는 역자의 경험이 함축되어있는 보조 지식을 담고 있어서 원문의 이해를 돕고 있다.

 

파이썬에 대한 기본 문법은 이해하고 있어야 읽기 수월하다. pandas나 numpy 패키지에 대해 간략하게 사용법을 소개하는 정도로 예제들이 구성된다. 이 부분이 부족한 사람들은 파이썬 책을 참고도서로 보면 좋겠다. 없어도 막히거나 할 수준은 아니다.

나는 책에서 소개한 것처럼 아나콘다 버전을 사용하지 않고 직접 파이썬으로 필요한 패키지들을 설치하였다. 윈도우에서 실습해 보았는데, 내가 사용한 환경은 다음과 같다.

  • 파이썬 3.9.12
  • Numpy 1.22.3
  • SciPy 1.8.0
  • SciKit-Learn 1.1.0
  • XGBoost 1.5.2
  • Jupyter 1.0.0
  • Notebook 6.4.11
  • Pandas 1.1.4 

PIP로 설치했는데, 별다른 이슈없이 잘 설치되었고, 예제 또한 책에서 소개된 대로 잘 진행되었다.

 

지도학습을 프로젝트에 적용해 보고 싶은 개발자들에게 추천한다.

종이질은 살짝 아쉽다. 빛 반사가 있는 지질이라. 스탠드 아래에서 보면 반사되어서 글이 잘 안보인다. ㅠㅠ

한 챕터씩 읽을때마다 개념들을 익히는 즐거움은 있지만... 기억에 남는 건 model 만들고  데이터셋을 split한 다음, model에 fit해서 테스트 데이터 넣어보고....평균 오차 뽑고.. 반복.

 

  "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

반응형

 

책 몇권을 구매했다.

 

1.System Design Interview Vol2.

우선 신입사원들이 자신들이 해보고 싶은 과제를 수행하는 기간인데, 이 책의 1장과 2장에 도움이 될만한 구조가 소개되는 것 같아서 구매했다. Vol1의 번역서를 읽었는데, 내용이 괜찮았고 단순히 기술적인 문제가 아니라 주어진 과제를 어떻게 해결해 갈 것인가를 인터뷰형식으로 풀어내서 좋았다. 그래서 2권은 주저하지 않고 주문했다. 인사이트 사장님께 번역서 출간 예정인지를 물어보았으나, 일정도 안나오는 상태라 그냥 원서 구매를 헀다. 과연 원서를 먼저 다 읽을 것인가? 아니면 번역서가 먼저 나올 것인가?

 

2. 컴파일러 개발자가 들려주는 C이야기

내가 가장 즐겨보는 언어인 C/C++ 이야기이다.  그냥 호기심에 끌려서 구매했다. 요즘 컴파일러에 대해 호기심도 많이 생기고, Domain Specific Language를 만들어 보면 주어진 문제를 해결하는데 도움이 될 것 같아서 끌렸다. 1장 슬쩍 읽었는데, 역시 재미있다;;

 

3.  오브젝트 디자인 스타일 가이드

최근 팀 코드 리뷰를 하다가 객체의 R&R을 깨는 듯한 느낌의 코드를 많이 보게 되었다. 그래서 가이드도 줄 겸해서 읽어보고 추가 구매할지 여부를 판단해 볼까 한다.

 

4. 쏙쏙 들어오는 함수형 코딩

조금 쉽게 쓰여진 함수형 프로그래밍에 관한 책이라 구입. 아직 내용을 안봤지만, 함수형에 대한 고민이 좀 더 깊어지지 않을까 기대 하면서 샀다.

 

5. 좋은 팀을 만드는 24가지 안티 패턴 타파 기법

결국 일을 하는 것은 사람이고,  개개인이 가진 역량보다 큰일을 하려면 팀을 조직해야 한다. 팀웍, 팀 성장을 어떻게 도울지에 대한 힌트를 얻기 위해 구입한 책. 타산지석처럼 안티패턴에서 좋은 팀을 만드는 힌트를 얻을 수 있지 않을까?

 

6. 객체지향 UI 디자인: 쓰기편한 소프트웨어 디자인 원리

최근 디자인팀의 결과물이 썩 마음에 안드는데, 마땅한 이유를 명쾌하게 정리하지 못하는 것 같아서 고민하던 차에...눈에 띄어 구매했다. 책은 왠지 좀 구리다. 겉표지부터 이건 정식 출간한 책이 아니고 그냥 대학가에서 제본한 책 느낌이다. 뭐 책에서 그런게 중요한 것은 아니다만은... 오늘 앞부분 조금 읽어보았는데, 무슨 이야기를 할 지 대충은 알겠고.. 번역이 썩 매끄럽지는 않은 것 같다. (책 디자인 때문에 그런 느낌을 받았을지도..) 일본서를 번역한 책. 

 

역시 5월.. 올 한해의 34%를 넘긴 시점에서 끝까지 달려보자.

반응형

'0.잡담' 카테고리의 다른 글

인류의 잔혹함.  (0) 2023.01.23
5월 29일 일상  (0) 2022.05.29
[기록] 한살림선언문  (0) 2022.04.16
[기록] 21세기 진보학생연합 출범 선언문  (0) 2022.04.15
[잡생각] 감자빵을 만든 이미소 대표 기사  (0) 2022.01.22

+ Recent posts