Como escolher a estrutura de BI ideal para a sua empresa?
Uma das etapas mais importantes para uma implantação de BI bem-sucedida é selecionar o tipo de arquitetura de BI que funciona melhor para sua empresa. Considerando que soluções tradicionais de BI são construídas em cima de um Data Warehouse, as estratégias modernas de BI e Analytics precisam não apenas da opção do poder central de um Data Warehouse, mas também de uma abordagem de autoatendimento, ou o chamado BI Self-Service.
Uma solução verdadeiramente robusta oferecerá ambos.
Assim como o BI vem em diferentes tipos e formas, a arquitetura que o compõe também é diversificada. É por isso que é fundamental entender a diferença entre cada uma das opções e como determinar qual é a certa para sua empresa.
Qual é a abordagem tradicional de BI?
Em estratégias tradicionais de BI, os dados de sistemas distintos – CRM, ERP e outras fontes de dados – são carregados em um Data Warehouse. Pode haver centenas, senão milhares, de tabelas de dados em um Data Warehouse. Dados de marketing, informações do cliente, números de vendas, dados financeiros e assim por diante são armazenados aqui.
A partir daí, os desenvolvedores de BI selecionam quais dimensões e medidas eles acham mais úteis para análises e as consolidam em cubos de processamento analítico online (OLAP) predefinidos. A plataforma de BI então extrai desses cubos para processar relatórios e análises nas métricas da empresa.
Benefícios de se tornar tradicional
Data Warehouses são repositórios robustos que garantem que todos tenham a mesma versão de dados para analisar e compartilhar em toda a empresa. Um Data Warehouse mantém alta qualidade e consistência de dados, à medida que os dados são reestruturados para atingir a excelência no desempenho de consulta dentro dos cubos.
Não importa de onde as informações venham, o Data Warehouse garante que elas serão entregues aos consumidores de forma consistente a partir de um único modelo de dados.
Desvantagens do BI tradicional
Embora a configuração de um Data Warehouse seja extremamente poderosa, também é altamente complicada. Para manter a qualidade, todos os novos dados devem ser testados e verificados antes de serem movidos para o Data Warehouse. Este é o território do TI altamente qualificado. Alterar ou ajustar qualquer coisa dentro do Data Warehouse é muito parecido com abrir o capô de um carro e trabalhar. Você não pode fazer isso se você não for um especialista. E se você fizer isso, é fácil criar problemas significativos.
Isso torna a experimentação difícil. A prototipagem de dados normalmente recebe prioridade mais baixa para problemas ou discrepâncias de dados, portanto, de um ponto de vista prático, projetos experimentais regularmente são eliminados da fila do Data Warehouse de TI. Claramente, isso não é muito útil quando as decisões precisam ser feitas em tempo real.
A solução
Uma ferramenta de Analytics Self-Service como o módulo Data Discovery atualizado da TARGIT é um complemento para uma plataforma de BI tradicional e combina os benefícios do armazenamento de dados seguro com a flexibilidade moderna e experimentação que os usuários desejam e precisam.
Essa ferramenta serve como um potenciômetro de mistura, permitindo que você extraia e combine dados sobre os dados que existem dentro do Data Warehouse em um único relatório ou análise. Com esse tipo de ferramenta, a análise de sandbox e a prototipagem de dados podem ser feitas fora do Data Warehouse e, se forem valiosas, adicionadas ao Data Warehouse em modelos de dados predefinidos posteriormente pela TI.
Quando você deve escolher a arquitetura de BI de Data Warehouse?
Este é um passo crucial para as organizações – especialmente empresas corporativas – que possuem dezenas de sistemas ERP dos quais extraem dados. As empresas precisam de tempo e recursos para gerenciar um Data Warehouse, mas se beneficiam da garantia da qualidade dos dados o tempo todo.
O que é uma abordagem de BI Self-Service
A principal diferença entre o BI tradicional e o moderno é a capacidade dos usuários de extrair dados externos por conta própria e realizar análises sem grande ajuda do TI. Este é o BI Self-Service.
Para acomodar esses dados externos, uma plataforma de BI moderna é estruturalmente projetada de maneira diferente. Ao contrário do Data Warehouse que armazena dados em discos físicos ou virtuais, muitas empresas hoje escolhem um banco de dados na memória que depende principalmente da memória (RAM) para armazenamento de dados. Ler e gravar da memória é significativamente mais rápido do que ler e gravar de discos rígidos, portanto, as consultas em execução em um banco de dados na memória – mesmo dados grandes ou externos – serão mais rápidas.
Muito parecido com um modelo de Data Warehouse, os bancos de dados In-Memory armazenam dados de sistemas distintos, como ERP e CRM. A diferença, porém, é que In-Memory também pode puxar diretamente das fontes de dados de estruturas open source de softwares e data lakes.
Benefícios do BI Self-Service
Essa abordagem de BI leva a percepções mais rápidas e flexibilidade. As velocidades do processo de trabalho aumentam significativamente, pois os usuários podem carregar dados sob demanda e combiná-los com as fontes de dados existentes. A maioria das ferramentas de Self-Service também é, geralmente, mais amigável do que uma configuração típica de Data Warehouse. Não é necessário um treinamento significativo para adquirir as habilidades necessárias para trabalhar diretamente no sistema.
Mais importante ainda, os sistemas de Self-Service permitem a experimentação quase em tempo real com dados fora do Data Warehouse. Isso pode ser qualquer coisa, desde planilhas do Excel em um desktop até repositórios de big data como o Hadoop.
Isso é incrivelmente útil não apenas para usuários de negócios individuais, mas também para departamentos que desejam criar modelos por conta própria.
Desvantagens do BI Self-Service
Como é bastante fácil para os usuários de BI sujar as mãos com um modelo de BI de Self Service, é significativamente mais fácil que algo dê errado. Sem um método estrito e documentado para adquirir e manter a qualidade adequada dos dados, um sistema In-Memory / Self-Service pode rapidamente se tornar caótico.
Lacunas nos dados de exclusões ou inconsistências podem distorcer as análises. Isso ocorre porque as ferramentas de Self Service não têm a capacidade de incorporar a validação de dados. Fazer isso eliminaria o aspecto de “autoatendimento” desse modelo.
Como tal, o Self Service é um método significativamente mais ágil, mas também é significativamente mais frágil. As empresas de pequeno e médio porte, em particular, costumam ser insinuadas por uma opção de aplicativo de Self Service porque se preocupam em ter dificuldades para fazer cumprir os protocolos e as práticas recomendadas necessários.
A solução
Um modelo de loop fechado resolve o problema de um ambiente caótico e garante a Governança de Dados de uma forma que o BI Self Service direto não pode. O BI de loop fechado realimenta as informações, o que permite aos usuários ver se há inconsistências nos dados.
A análise de sandbox permite aos usuários criar protótipos de novos dados com segurança sem a ajuda de TI. Esses dados são então distribuídos para teste do usuário, onde inconsistências são descobertas, ou são enviados para a produção.
A partir daí, mais sandboxing é inspirado e o ciclo de experimentação e descoberta de dados começa novamente. Este sistema de loop fechado permite que os usuários verifiquem os dados antes que as coisas entrem em produção sem assistência técnica. A garantia de qualidade aumenta e os usuários assumem maior propriedade sobre seus dados.
Além disso, a maioria dos problemas de lacuna de dados pode ser resolvida com um pouco de fita adesiva, por assim dizer. Correções rápidas com o Excel podem ser obtidas diretamente e usadas para fechar lacunas até que uma maneira melhor de enviar dados ao sistema de origem seja implementada e / ou corrigida. Como o carregamento de dados é muito rápido, os usuários são incentivados a corrigir os problemas rapidamente. Em comparação, qualquer tipo de mudança em um Data Warehouse é tedioso e consome muito tempo.
Quando você deve escolher a arquitetura de BI Self-Service?
Empresas que buscam uma abordagem flexível e amigável para BI que desejam colher os benefícios do BI imediatamente e não necessariamente já possuem um Data Warehouse instalado.
O melhor dos dois mundos: BI bimodal
A importância e o poder da abordagem de BI Self Service são evidentes. No entanto, não recomendamos que as empresas com um Data Warehouse existente façam uma varredura em seu sistema de Data Warehouse para ficar totalmente In-Memory / Self-Service. Em vez disso, sugerimos uma correção que é realmente o melhor dos dois mundos para aqueles completamente novos em BI e aqueles que estão trabalhando para desenvolver sua estratégia atual: um ambiente de BI bimodal.
Se sua empresa já possui um Data Warehouse instalado, a adoção de uma estratégia de BI bimodal preencherá a lacuna entre as duas arquiteturas da solução. A integridade dos dados será mantida e a agilidade de um sistema moderno entrará em ação. O bimodal também permite uma certa quantidade de autossuficiência do sistema de Data Warehouse que normalmente envolve o controle do TI.
Uma estratégia de BI bimodal não deve apenas facilitar a operação tradicional de negócios – o Data Warehouse clássico – mas também a descoberta e a inovação. Para fazer isso, uma ferramenta como o módulo Data Discovery da TARGIT é necessária no topo da plataforma de BI tradicional, como mencionado acima.
Essa ferramenta complementar torna possível extrair esses dados externos e combiná-los com os dados que já estão no Data Warehouse. Isso permite a prototipagem e experimentação de dados fora do Data Warehouse com a velocidade e flexibilidade de uma solução In-Memory. Ele remove o TI do processo de incorporação de novos dados e coloca a exploração de dados complexos e externos nas mãos dos usuários de negócios diários.
Além da ferramenta de descoberta de dados da TARGIT, a Microsoft também oferece uma solução que preenche a lacuna entre os sistemas de solução tradicionais e modernos com seus modelos de Analysis Services Tabular. Este é um banco de dados na memória que elimina a necessidade de processos ETL complexos, pois os dados podem ser carregados diretamente nele.
Ao contrário do TARGIT Data Discovery, montar um modelo tabular ainda é uma tarefa para um recurso técnico, portanto, esta não é realmente uma ferramenta de Self Service. A vantagem, porém, é que ele permite os benefícios do BI moderno com a velocidade de execução na memória, mas ainda mantém a integridade total dos dados.
Veja também
As 10 melhores práticas de Business Intelligence
Matéria original em Inglês no site oficial TARGIT Int. Clique aqui.
Autor: Soren Block Olsen