O planejamento de dados e a síndrome de fadiga de informações

Leia este artigo para aprender sobre planejamento de dados e síndrome da fadiga da informação:

Os volumes de informação estão aumentando em progressões geométricas e está se tornando cada vez mais difícil lidar com a explosão de informações que está ocorrendo.

Imagem Cortesia: engazegypt.com/uploads/services/136853078516158773-internet-a.jpg

O planejamento de dados também deve se concentrar nesse problema. Os parágrafos a seguir abordam esse problema e a resposta da tecnologia de banco de dados a esse problema.

Síndrome de Fadiga da Informação:

Uma recente pesquisa internacional 'Dying for Information' fez uma revelação surpreendente de que metade de todos os gerentes reclama de sobrecarga de informações que tem o efeito de aumentar os níveis elevados de estresse que resultam em problemas de saúde. em um dilema executivo na era dos faxes, correio de voz e Internet.

Eles também sentem que não podem operar bem sem altos níveis de informação. Mas essa carga pesada de dados muitas vezes irrelevantes afeta sua eficiência e obstrui a máquina corporativa. 'Perda de tempo, atrasar decisões e tensão pode ser atribuída à sobrecarga de informação'.

'Ter muita informação pode ser tão perigosa quanto ter muito pouco' resume o dilema enfrentado pelos gerentes hoje. Este fenômeno está sendo denominado como "Síndrome da Fadiga da Informação" e é "agora uma parte da vida de um executivo". A famosa citação "Água em toda parte, não uma gota para beber" do Antigo Marinheiro pode se tornar apta para informação também.

Ultimamente, tentativas foram feitas para enfrentar o desafio proposto pela Síndrome da Fadiga da Informação. Uma variedade de técnicas de software, como tecnologia de banco de dados, linguagens de consulta, 4GLs, OOPs, sistemas de informações executivas, sistemas de informações especializadas etc., estão disponíveis para disponibilizar informações de boa qualidade aos gerentes.

No entanto, essas técnicas foram consideradas inadequadas para a tarefa devido à taxa substancial de crescimento no conjunto de informações. A principal razão para isso é que os dados disponíveis nos bancos de dados foram orientados para transações e não para assuntos.

Os dados referentes às operações atuais levam a maior parte da atenção de um administrador de banco de dados. Uma consulta simples sobre qual é a relação entre a venda de cigarros, refrigerantes e alimentos para bebês; ou qual é o aumento esperado na venda, se a loja do departamento ficar aberta até tarde da noite também, pode enviar ondas de choque aos gerentes de informações de hoje.

As consultas sobre questões como essa exigem o uso de um vasto conjunto de dados atuais e passados ​​sobre o comportamento dos clientes em diferentes situações. Ele requer um armazenamento de dados especialmente preparado para atender a essas consultas. A fim de reduzir o tempo e o custo de análise e armazenamento, os dados em tal caso devem ser armazenados após certa quantidade de agregação e análise básica.

Determinar o grau de agregação e eliminar a redundância representa um grande desafio para os gerentes de informação. Como a natureza das consultas em tais casos não pode ser antecipada, a tarefa se torna ainda mais desafiadora. A abordagem do Information Warehouse foi desenvolvida para enfrentar esse desafio.

Abordagem de Data Warehousing:

A abordagem de data warehouse (também às vezes chamada de abordagem de armazenamento de informações) sugere que as informações devem ser adquiridas, mantidas e atendidas seguindo a abordagem básica usada no caso de armazéns para outros insumos físicos.

As instalações gerais de armazenamento são desenvolvidas, entendendo que qualquer saída de estoque prejudicaria o processo de produção e teria implicações para o resultado final. Assim, os itens necessários são adquiridos, processados ​​e mantidos regularmente e deliberadamente em condições prontas para uso o tempo todo.

A característica distintiva da abordagem de armazenamento de informações é que ela cria um data warehouse, diferente dos bancos de dados normais que estão sendo mantidos por uma empresa.

A suposição, aqui, é que os dados coletados, consolidados e adquiridos de diferentes fontes, como produção, marketing e finanças, são importantes demais para serem interferidos em consultas analíticas complexas dos usuários. Assim, as consultas são feitas em um banco de dados extraído especificamente organizado para atender consultas analíticas. Esse banco de dados também é chamado de metadados.

Esta abordagem combina as ferramentas analíticas, sistemas paralelos de alta velocidade e multiprocessamento com algoritmos especializados e ferramentas de software. As características distintivas da abordagem podem ser melhor compreendidas pelas etapas do processo que ela adota para atender às consultas analíticas. Essas etapas são:

uma. Captura de dados, também denominada como coleta ou coleta de dados de várias fontes executando diferentes aplicativos;

b. Limpeza de dados (depuração de dados) para garantir consistência e integridade. Envolve também a remoção de itens de dados redundantes;

c. Organizar os dados em bancos de dados especialmente projetados para análise de dados. Esses designs de bancos de dados são diferentes daqueles usados ​​para registrar e relatar operações em uma empresa. Eles estão livres das preocupações de fonte, autenticidade, trilhas de auditoria etc.

d. Disponibilidade de Processadores Analíticos On-Line (OLAPs), Ferramentas de Mineração de Dados, Ferramentas de Visualização de Dados, Ferramentas de Habilitação da Internet, Sistemas de Informações Executivas (EIS) e outras ferramentas de análise e relatório de dados para atender às exigentes consultas analíticas dos usuários.

Uma decisão crítica que precisa ser tomada está relacionada à seleção dos dados a serem armazenados nos bancos de dados de informações. Caso seja possível prever as necessidades de informação para o futuro, um modelo de duas caixas será suficiente.

Neste modelo, os dados das operações são resumidos e os dados que podem ser necessários no futuro podem ser copiados para o banco de dados de informações. No caso, não é possível prever as necessidades futuras de informação, um modelo de três caixas pode ser mais apropriado. Nesse modelo, todos os dados de operações são primeiro armazenados no que é chamado de banco de dados histórico e, em seguida, uma parte selecionada dele também é mantida em um banco de dados de informações. A Figura 9.9 mostra os dois modelos.

A abordagem de armazenamento de dados está ganhando terreno, conforme indicado por sua maior aceitação entre os principais fabricantes de software. Agora, as principais empresas de software de banco de dados, como Oracle, Sybase, Informix e IBM, defenderam abertamente essa abordagem. O Informix estabeleceu vínculos com a Prism Solutions, uma empresa criada por Bill Inmon, considerado o pai da abordagem de data warehousing.

Benefícios da abordagem de data warehousing:

O data warehousing está se tornando popular pelos seguintes motivos:

uma. Aumenta a velocidade da análise de dados à medida que os agregados de dados são armazenados e as transações do dia a dia não impedem o processo de análise.

b. Oferece flexibilidade em termos da natureza da consulta e concentra-se em assuntos e atividades em vez de transações.

c. Ele ajuda a entender vários processos de negócios e padrões de comportamento de clientes, fornecedores, investidores, etc.

Algumas das histórias de sucesso em uso de data warehousing incluem a cadeia de lojas de varejo Wal-Mart, que processa 7, 5 terabytes de armazenamento de dados de diferentes aspectos das operações de lojas de varejo. As tendências de vendas são analisadas e o impacto de várias mudanças, como descontos e outras decisões sobre vendas, é avaliado regularmente para orientar o curso de ação futuro.

Outro exemplo é o da Reuters, provedora de serviços de informação financeira que desenvolveu uma nova série de serviços de informação como o Money 3000, Securities 3000 e Treasury 3000. A empresa agregou valor às informações financeiras ao fornecer aos usuários acesso às informações históricas sobre os mercados. e instrumentos.

Ele usa a abordagem de armazenamento de dados para armazenar e permitir o acesso a dados armazenados em vários computadores em todo o mundo. Os dados são coletados de 4600 fontes diferentes, incluindo 236 mercados, 241 analistas e 50 novos feeds de terceiros e uma equipe própria de 1860 jornalistas. Para dados tão grandes, a abordagem de data warehousing foi considerada mais adequada.

Fatores Críticos de Sucesso no Data Warehousing:

Para obter todos os benefícios de um sistema de data warehousing, é essencial levar em consideração fatores críticos para a eficácia de tais sistemas.

Alguns desses fatores são:

a) A abordagem de data warehousing requer grandes investimentos em hardware e software. Essa abordagem, portanto, faria sentido apenas em empresas de grande porte, onde o potencial do sistema pode ser totalmente explorado.

b) O data warehousing requer grandes mudanças arquitetônicas nas bases de dados já bem estabelecidas. Tais mudanças podem causar obstruções no funcionamento dos sistemas existentes ou os sistemas existentes precisariam ser paralelos com os novos sistemas por algum tempo.

Da mesma forma, existem outros obstáculos tecnológicos e de negócios que podem inibir a implementação bem-sucedida desses sistemas. O manuseio de obstruções durante o período de implementação, que varia entre 18 e 24 meses, será um fator importante para o sucesso do sistema de armazenagem.

c) O potencial total desta abordagem pode ser realizado somente quando uma matriz de ferramentas de análise de dados é empregada para gerar informações. A seleção e o uso de ferramentas de análise de dados dependem da disponibilidade de tais ferramentas, bem como da cultura corporativa. A abordagem de data warehousing seria bem-sucedida se uma cultura de trabalho adequada prevalecesse em uma empresa.

d) Essa abordagem assume um tipo muito maduro de ambiente de TI, onde o grau de penetração de TI nas atividades diárias é muito alto. A empresa do usuário deve ter uma grande quantidade de dados históricos já armazenados na mídia magnética. Assim, é um processo evolutivo e não revolucionário.

O retorno sobre o investimento nessa abordagem é uma área cinzenta e, portanto, uma análise de custo-benefício precisa ser realizada antes de entrar no movimento do data warehousing.