Por Alan Dayley*
Quando se trata de gerenciamento de dados e governança de dados, a “descoberta de dados” tem sido historicamente um termo vago. É simplesmente a capacidade de conectar e criar um inventário dos ativos de dados de uma empresa ou há mais coisas envolvidas no processo?
Como analista do Gartner por 14 anos, recebi centenas de ligações sobre descoberta de dados. Quando um cliente perguntava sobre fazer descoberta de dados, eu inevitavelmente indagava: “Para quê?” Por que a empresa estava interessada em fazer a descoberta em primeiro lugar? Alguns indicavam que queriam criar um inventário para ver quais ativos de dados possuíam — e isso sempre foi uma indicação importante de que o projeto não iria muito longe. Por quê?
Inventário de dados x catálogo de dados
Vamos começar com o que acontecerá com os resultados da descoberta: para onde eles irão? Muitas vezes me perguntavam sobre a diferença entre um inventário de dados e um catálogo de dados, o que me levou a criar uma analogia dos meus tempos de faculdade, quando a internet estava a poucos anos de sua fase embrionária.
Na época, a “pesquisa” consistia em ir à biblioteca e buscar informações em livros reais e material de referência. Um inventário de dados seria semelhante a uma lista direta e completa de todos os livros da biblioteca. E isso é melhor do que nada, mas quando você está falando de centenas de milhares a milhões de livros, essa abordagem é impraticável e de pouco valor.
As bibliotecas usam o Sistema Decimal de Dewey, que é uma maneira de classificar e correlacionar livros em uma segmentação lógica para que todos os livros sobre finanças, digamos, estejam localizados em uma área e possam ser facilmente “descobertos” e localizados consultando um catálogo de fichas disponível. Esta é basicamente a mesma ideia do catálogo de dados de hoje — com o último em formato eletrônico.
A descoberta começa com a necessidade do negócio
Um inventário de dados em si tem pouca utilidade, exceto para mostrar uma lista díspar de ativos. As organizações precisam saber mais sobre seus ativos de dados do que simplesmente o que eles têm para que esses ativos tenham algum valor. Essa iniciativa não começa com a consulta dos dados, mas no extremo oposto da organização – em iniciativas de negócios. Por que descobrir e inventariar dados se o esforço não está vinculado às metas de negócios e, uma vez aplicado, ajuda a alcançá-las?
Como analista do setor, quando perguntado sobre o inventário dos dados, eu imediatamente perguntava a qual KPI (indicador de desempenho) de negócios a iniciativa estava vinculada. Eu recebia uma variedade de respostas, mas muito raramente uma delas era uma meta tangível ou KPI que respondesse, por exemplo, a uma das seguintes perguntas:
- Como os dados de inventário ajudaram especificamente as vendas a atingir os números trimestrais ou o marketing para atingir as metas da campanha?
- Como o inventário ajudou a atender às solicitações de privacidade DSAR?
- Como o inventário protegeu melhor a organização?
Uma vez que começamos a entender por que estamos fazendo a descoberta e o que é exigido do negócio, podemos começar a fazer perguntas importantes sobre os próprios dados, como:
- Como os dados são inter-relacionados?
- Como os dados são usados?
- Onde se originou?
Um conjunto profundo de recursos além do inventário
Para entender as respostas a essas perguntas é preciso:
- deixar de simplesmente fazer um inventário como parte da descoberta e começar a aprofundar os metadados, incluindo metadados inferidos e implícitos;
- entender rótulos e tags de dados, como os dados são classificados e como devem ser classificados com tags adicionais;
- correlacionar dados para vermos todos os elementos de dados vinculados a uma entidade – como um único indivíduo — para que possamos comercializar efetivamente para essa pessoa ou proteger sua privacidade de forma holística;
- encontrar dados de cluster, por exemplo, todos os documentos de hipoteca em compartilhamentos de arquivos ou números de contas de clientes em vários bancos de dados em toda a organização;
- cobrir todos os dados corporativos — a média de 20% estruturada e 80% não estruturada;
- criar um catálogo de dados moderno como parte do gerenciamento ativo de dados como parte do processo geral.
Portanto, a descoberta de dados é mais do que simplesmente inventariar os dados e esperar que a organização encontre um uso para eles. A descoberta de dados começa na outra extremidade da organização — nos negócios, nos KPIs de marketing e vendas, nas iniciativas de privacidade e segurança — como algo que pode ser vinculado a KPIs, metas ou iniciativas estabelecidas.
Uma vez que sabemos para que queremos descobrir os dados, podemos ir além de apenas encontrá-los para transformá-los em valor real que pode ser medido.
*Alan Dayley é diretor de análise e pesquisa da BigID.
Conhecendo seus dados
Para ajudar as empresas nesse desafio, a Century Data disponibiliza sua consultoria em privacidade e segurança de dados, formada por uma equipe de especialistas capacitados em data discovery. A Century Data apoia clientes no desenvolvimento de estratégias que envolvem governança, segurança, proteção e privacidade de dados.
Aproveite para saber mais sobre o tema assistindo ao vivo a mesa redonda “Conhecendo seus Dados” que contará com a participação de especialistas e clientes que falarão de suas experiências sobre a descoberta de dados.
Será também uma oportunidade para saber como a plataforma da BigID vem impulsionando a jornada de data discovery de grandes companhias dos mais variados segmentos, no Brasil e no mundo, bem como a indústria de dados vem encarando esse desafio.
O evento será realizado no próximo dia 22 de junho, às 10h. Faça sua inscrição clicando na imagem abaixo.