Skip to content
newhigen
Go back

『데이터 과학자 원칙』

책에 대하여

서평

잘하는 데이터 과학자에 대해서 알고 싶었는데 자료가 많이 없어서 아쉬웠다. 그 와중에 이 책을 발견했고, 내가 알고 싶었던 내용들이 있었다. 데이터 과학에 대한 내용이 있어서 좋았고, 데이터 과학자가 데이터 과학 외로도 익혀야하는 전반적인 기술들을 - 소프트스킬, 소프트웨어 엔지니어링 - 알려줘서 좋았다.

내용 중에서 4장의 데이터 과학자 팁은 정말 기대했던 자료다. 시니어 데이터 과학자를 사수로 만나 이런 얘기를 듣고 싶었다.

각 장마다 마지막에 책 추천을 해줘서 좋다. 저자들이 주제에 대해서 영향 받은 내용을 더 파보기 좋다.

내용

데이터 과학 Pearls and Pitfalls

04 시작하는 데이터 과학자를 위한 개발과 운영 지침서 by AWS 데이터 과학자 「p.92-120」

문제 정의 단계

데이터 준비와 피처 엔지니어링 단계

모델 개발과 평가 단계

배포와 운영 단계

참고자료

소프트 스킬

우리가 실천의 사례가 된다.1

차별화된 성장’데이터 사이언스 생존무기’

다양하게 여러개를 파는 것도 압도적으로 하나를 파는 것만큼 가치있다.

시야는 명확하게, 방향은 일관되게.

조직 우물 밖에서 교류한다.

자신에 대한 메타인지. 업무에 대한 메타인지. 목적, 맥락.

  1. 자신의 욕구와 상황 파악.
  2. 방향으로 가기 위한 경험이 무엇인지.
  3. 실제로 실행.

“그럼에도 불구하고.” “우리는 답을 찾을 것이다. 늘 그랬듯이.”

데이터 과학

‘데이터는 긴 호흡으로 이루어진다.’

데이터 과학자: 데이터를 활용해서 문제를 해결하는 사람.

“아마도 많은 데이터 과학자는 본인의 일에 이런 것이 포함되는지를 고려조차 하지 못할 겁니다. 그리고 혹자는 이런 일에 시간을 보내다 보면 본인의 전문성이 떨어지는 것이 아닌지 고민을 하다가, 결국 발을 빼기도 합니다.”❗️공감 「p.85」

‘Get your hands dirty.’2

단순한 결과로 설득한다.오컴의 면도날

92-120은 DS에게 정말 좋은 heuristics! ★ ✓ 꼭 다시 읽고, 정리하고, 실천하기

데이터 과학과 엔지니어링

데이터 과학도 어느 정도 엔지니어링적인 요소를 포함하기 마련이다.

p.155-168은 사실상 소프트웨어 엔지니어링 업무이다.

데이터 과학 고유의 엔지니어링 워크플로우에 대한 관심이 필요할 때이다.

8장은 데이터 엔지니어링에도 도움이 되는 내용이다.

Footnotes

  1. 피플웨어

  2. 상향, 하향 _ Lean Software Development



Next Post
『내 인생을 빛내줄 스마트폰 사진』