데이터는 강력한 도구다. 비즈니스에 있어 특히 그렇다. 그럼에도 정작 데이터의 대응물인 메타데이터와 그것의 유용성에 대해 제대로 아는 비즈니스 리더는 그리 많지 않다.
기업이 메타데이터를 이해하고 관리 정책을 도입하면, 더 많은 인사이트를 바탕으로 보다 나은 성과를 도출할 수 있다.
데이터는 모든 기업에서 활용되는 중요 자산이며, 리더의 정보 기반 비즈니스 의사결정을 돕는다. 작은 데이터 하나가 이니셔티브의 방향성을 완전히 바꾸어 더 나은 결과로 이어질 수도 있다.
그러다 보니 기업이 데이터와, 이를 통해 얻을 수 있는 인사이트에 집착하는 것은 당연하다.
하지만, 기업 다수는 정작 데이터의 대응물인 메타데이터를 낯설어 한다. 메타데이터가 데이터에 맥락을 더해 만들어내는 가치에 대해서도 익숙하지 않다. 대체로 메타데이터가 간과되기 때문이다.
만약 메타데이터가 필요치 않거나 무엇이 메타데이터인지 모른다면, 당신은 메타데이터를 IT 자산의 부산물 정도로 치부해버릴 가능성이 높다.
메타데이터를 사용해야 하는 이유
넓은 의미에서, 메타데이터는 데이터에 대한 정보를 제공한다. 즉, 본질적으로 데이터에 관한 데이터다. 공유용 문서를 예로 들어 보자.
데이터가 문서의 내용을 의미한다면, 메타데이터는 문서의 속성에 관한 정보를 보여준다. 문서를 만든 사람, 만든 날짜, 시스템에 마지막으로 저장된 일자, 문서를 만든 이유 등을 예로 들 수 있다.
메타데이터는 사용하는 데이터에 맥락을 부여해 데이터를 더 쉽게 처리하고 이해할 수 있게 해준다.
바로 이런 점에서 메타데이터는 기업에게 매우 유용하다. 메타데이터는 잘 사용하기만 하면, 기업 운영에 필요한 인사이트를 빠르게 찾는 데 도움이 된다.
특히 데이터 거버넌스와 책임감 있는 데이터 활용이라는 측면에서 유용하다. 메타데이터가 데이터 투명성과 품질을 확실하게 해줄 수 있기 때문이다.
메타데이터를 부가적으로 활용한다는 것은, 기업 내에 메타데이터 관리 정책을 도입함으로써 많은 이점이 생긴다는 의미다.
데이터가 무엇으로 구성돼 있는지, 데이터에서 무엇을 기대할 수 있는지 등의 맥락을 제공하면, 이용자가 데이터의 가치를 빠르게 탐색하고, 비용 낭비를 줄이도록 함으로써 조직의 생산성을 높일 수 있다.
메타데이터의 또다른 이점은, 데이터를 조직화하고 구조화해 데이터가 뒤섞일 가능성을 줄여준다는 것이다. 메타데이터는 마치 엑셀 스프레드시트에 칸을 나누는 데 필요한 열(column)과 같다.
이것이 없다면 숫자와 단어만 있고 그 이면의 의미를 알 수 없는 상황이다. 이 경우 이 데이터는 오후 내내 머리를 지끈거리게 할 뿐 아니라 점점 쓸모가 사라질 것이다.
아울러 메타데이터는 데이터를 감사하는 데도 사용할 수 있다. 메타데이터의 의미를 잘 이해하면 원본 데이터를 정리하는 일은 물론 데이터를 정의하고 분류하는 작업이 훨씬 쉬워진다.
특히 메타데이터는 GDPR과 같은 컴플라이언스와 규정을 준수하는 데 중요하다. 데이터를 명료하게, 그리고 정의된 표준에 부합하게 만들 수 있다는 점에서 그렇다. 이로써 데이터의 활용도를 극대화하고 신뢰도를 높일 수 있다.
부정확하고 잘못된 정보로 의사 결정을 내리는 일을 예방하는 데 도움이 된다.
메타데이터를 관리하는 방법
메타데이터 관리를 통해 어떤 가치가 창출되는지 이해하는 일은 중요하다. 하지만 메타데이터를 관리하는 방법을 이해하는 것은 훨씬 중요하다. 결국 조직 전반에 걸쳐 메타데이터를 활용할 수 있어야 하기 때문이다.
대다수 IT 리더들은 각종 포인트 솔루션을 가장 먼저 떠올린다. 대개 커스텀 코드나 API를 사용해 한 애플리케이션을 중앙 데이터 웨어하우스를 거쳐 다른 애플리케이션과 연결해준다.
기업에서 자주 사용하는 이 방법은, 모든 메타데이터를 한 곳에 모아준다는 점에서 쓸 만하다. 하지만 이 API를 변경해야 하거나 코드가 제대로 작동하지 않는다면 어떻게 될까?
특히나 오늘날처럼 IT 리더들이 IT 관리 업무보다는 비즈니스 가치를 제공하는 일에 시간을 더 쏟고 싶어한다면 말이다.
한 가지 대안으로, 통합을 하는 데 플랫폼을 이용하는 방법이 있다. 플랫폼 기반의 접근법을 통해 메타데이터를 수작업으로 업데이트하고 수정하는 번거로움 없이도 메타데이터의 이점을 활용할 수 있는 방법이다.
아울러, 플랫폼 기반 접근법은 데이터를 조직 전반으로 이동시킬 수 있는 단일 레이어를 제공해 불분명한 데이터로 인한 혼란과 오류를 줄여준다.
한편 로우코드 기술이 점차 메타데이터 관리와 분석을 지원하는 덕분에, IT 초심자들도 메타데이터에서 가치있는 인사이트를 얻을 수 있는 가능성이 열리고 있다. 복잡한 기술을 익힐 필요가 없다.
플랫폼 내의 메타데이터는 출처, 변환 및 목표에 관한 인텔리전스를 제공하므로 IT 팀의 업무 부담을 덜어준다.
더 나은 메타데이터로의 움직임
종종 간과되는 것은, 메타데이터가 비즈니스의 중요한 토대라는 사실이다. 메타데이터는 데이터를 명료하게 만들어 나은 결과를 도출한다. 데이터가 지속적으로 증가하는 가운데, 기업이 사용할 수 있는 정보도 늘어나고 있다.
이는 메타데이터를 효과적으로 사용해 데이터를 이해하는 것이 그 어느 때보다 중요해지고 있다는 의미다.
메타데이터를 통해 기업은 보유하고 있는 데이터의 의미와 그 연관 관계를 명료하게 이해할 수 있다.
덕분에 데이터만으로는 얻기 힘든, 훨씬 우수하며 신뢰할 만한 인사이트를 얻을 수 있다.
그런 점에서, 메타데이터는 제대로만 사용된다면 성공적인 결과 도출을 지원하는 맥락을 제공해준다. 아직 메타데이터를 사용하지 않은 기업이라면, 기본적인 메타데이터 방침부터 도입하는 것을 진지하게 고려할 필요가 있다. [email protected]
*Craig Stewart는 스냅 로직(SanpLogic)의 CTO다. 회사의 기술 전략과 제품 로드맵을 주도하고 있다. 그는 20년 이상 데이터 통합과 데이터 관리 기술을 이끌어온 경험이 있다.