회사에서 빅데이터 플랫폼관련 개발을 하고 있어서 데이터 품질에 대한 관심도가 많은 편이다. 어느 플랫폼/솔루션이나 마찬가지겠자만 지속적으로 개발/수정되고 있기 때문에 데이터 수집, 정제, 변환, 테스트 등에 대한 고민이 늘 있다. 아직은 초창기라서 오류 처리등에 대해서도 미숙한 부분이 있다. 이 책에서는 각종 오픈 소스를 통해서 좀 더 편하고 체계적으로 오류처리를 하는 부분도 소개해 주고 있어서 데이터 수집부분에 대한 품질을 좀 더 높여 볼 수 있는 포인트를 잡을 수 있었다.
또한, 전체적으로 검증단계에서 데이터가 오수집으로 인한 오류 등이 발생할 수 있는 데, SQL Query에 대한 예시를 보여주면서 예시로 쉽게 접근 할 수 있어서 좋았다.
품질에 대해서는 최대한 플랫폼 측면에서 쉽게 접근해줘야 한다고 생각을 하고 있지만, 어디서부터 해야하는 지에 대한 고민이 많이 있었다. 이책에서는 기본적인 품질 모니터링에 대한 예시 등을 제시해주고 있어서 이 책에 나온것을 바탕으로 현재 개발하고 있는 플랫폼에도 적용해 볼 생각을 가지게 되었다.
데이터를 다루고 있는 분들이라면 이 책을 통해서 품질에 대한 소개를 통해서 한 층 더 업그레이드 될 수 있는 책이라고 하겠다.
"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."
'Book > IT' 카테고리의 다른 글
[리뷰] 프로덕트 매니지먼트 (0) | 2023.07.23 |
---|---|
[리뷰] 테라폼으로 시작하는 IaC (0) | 2023.06.13 |
[리뷰] 처음 배우는 NHN Cloud (0) | 2023.04.23 |
[리뷰] 프로덕트 매니저는 무슨 일을 하고 있을까 (1) | 2023.02.26 |
[리뷰] SQL로 시작하는 데이터 분석 (0) | 2022.12.30 |