본문 바로가기

Book/IT

[리뷰] 데이터 품질의 비밀

 회사에서 빅데이터 플랫폼관련 개발을 하고 있어서 데이터 품질에 대한 관심도가 많은 편이다. 어느 플랫폼/솔루션이나 마찬가지겠자만 지속적으로 개발/수정되고 있기 때문에 데이터 수집, 정제, 변환, 테스트 등에 대한 고민이 늘 있다. 아직은 초창기라서 오류 처리등에 대해서도 미숙한 부분이 있다. 이 책에서는 각종 오픈 소스를 통해서 좀 더 편하고 체계적으로 오류처리를 하는 부분도 소개해 주고 있어서 데이터 수집부분에 대한 품질을 좀 더 높여 볼 수 있는 포인트를 잡을 수 있었다.

 또한, 전체적으로 검증단계에서 데이터가 오수집으로 인한 오류 등이 발생할 수 있는 데, SQL Query에 대한 예시를 보여주면서 예시로 쉽게 접근 할 수 있어서 좋았다.

 품질에 대해서는 최대한 플랫폼 측면에서 쉽게 접근해줘야 한다고 생각을 하고 있지만, 어디서부터 해야하는 지에 대한 고민이 많이 있었다. 이책에서는 기본적인 품질 모니터링에 대한 예시 등을 제시해주고 있어서 이 책에 나온것을 바탕으로 현재 개발하고 있는 플랫폼에도 적용해 볼 생각을 가지게 되었다.

 데이터를 다루고 있는 분들이라면 이 책을 통해서 품질에 대한 소개를 통해서 한 층 더 업그레이드 될 수 있는 책이라고 하겠다.

 

  "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."