Hadoop Analytics: ainda mais difícil com fontes externas

Autor: Laura McKinney
Data De Criação: 1 Abril 2021
Data De Atualização: 15 Poderia 2024
Anonim
Hadoop Analytics: ainda mais difícil com fontes externas - Tecnologia
Hadoop Analytics: ainda mais difícil com fontes externas - Tecnologia

Contente


Fonte: Agsandrew / Dreamstime.com

Leve embora:

Dados externos podem ser uma fonte valiosa de informações, mas devem ser adequadamente integrados aos dados internos.

Na minha postagem, Hadoop Analytics: Não é tão fácil em várias fontes de dados, discuti os problemas que as organizações enfrentam ao tentar usar o Hadoop para armazenar e analisar dados de várias fontes internas. Nesta postagem, falarei sobre os desafios e benefícios da adição de dados externos ao mix.

Adicionar dados externos melhora a análise preditiva

As organizações querem cada vez mais analisar dados de terceiros porque essas fontes aumentam sua visibilidade no mercado mais amplo, ajudam a prever ações futuras e a gerar leads de vendas adicionais. Somente a análise de dados internos fornece uma perspectiva histórica sobre os clientes e suas compras, o que é útil para análise de tendências e padrões, mas possui valor preditivo limitado. Essas fontes internas fornecem dados geralmente chamados de indicadores de atraso porque seguem eventos passados. Embora os indicadores atrasados ​​possam confirmar que um padrão está ocorrendo ou prestes a ocorrer, eles não podem prever facilmente o que ocorrerá ou detectar mudanças no mercado.


As organizações desejam combinar os principais indicadores de mercado de fontes externas com dados históricos internos e informações do canal de vendas. Essa combinação fornece a eles melhores idéias sobre padrões e tendências e ajuda a melhorar sua confiança nos modelos preditivos que eles estão alavancando para programas de vendas e marketing, detecção de fraudes, análise de riscos e muito mais.

O varejo é um setor que pode se beneficiar claramente da adição de dados externos ao Hadoop para melhorar os resultados dos negócios. Por exemplo, uma cadeia de varejo pode combinar arquivamentos recentes de registros de propriedades públicas de fontes de dados externas com dados de clientes internos para identificar indivíduos que compraram uma casa recentemente. Eles poderiam usar essas informações para oferecer imediatamente a esses clientes anúncios e promoções direcionados para itens que os novos proprietários provavelmente comprarão em suas lojas.


Mesclar fontes de dados externas apresenta desafios

No entanto, a integração de fontes de dados externas apresenta desafios técnicos ainda maiores que os dados internos. Os dados externos geralmente são fragmentados ou sujos e podem vir de fontes estruturadas, semiestruturadas ou não estruturadas. Adicionar dados externos a modelos analíticos existentes é difícil porque os dados contêm informações que não podem ser diretamente correlacionadas a fontes internas. Os dados externos também incluem informações sobre os clientes de uma organização e de seus concorrentes, o que torna difícil determinar se os dados são sobre os clientes atuais de uma organização. Por fim, apesar de sua utilidade quando combinada com fontes internas para um determinado conflito, a maioria das organizações não deseja administrar dados externos ou adicioná-los aos sistemas operacionais.

Superando desafios com novas tecnologias

As organizações podem superar os desafios de adicionar fontes de dados externas ao Hadoop com novas tecnologias projetadas especificamente para simplificar esses processos sem afetar os sistemas de registro, outros aplicativos corporativos críticos ou fluxos de trabalho. As novas tecnologias resolvem entidades sem a necessidade de chaves estrangeiras ou identificadores internos específicos e lidam com todos os tipos de dados, incluindo fragmentados, sujos, estruturados, semiestruturados ou não estruturados.

Antes do Hadoop, não havia lugar para as organizações pousarem e processarem dados externos ou internos de maneira fácil e econômica. O Hadoop mudou isso com uma plataforma que facilitou a ingestão e a execução rápidas de análises em uma ampla variedade de fontes de dados individuais. No entanto, o ecossistema do Hadoop carece de ferramentas para combinar e analisar facilmente dados de diferentes fontes e formatos para fornecer análises mais ricas e melhores resultados de negócios. Fique ligado no meu terceiro post desta série para obter detalhes sobre como essas novas tecnologias devem se parecer.

Este artigo foi publicado originalmente em Novetta.com. Foi reed aqui com permissão. Novetta mantém todos os direitos autorais.

Sem erros, sem estresse - seu guia passo a passo para criar software que muda vidas sem destruir sua vida

Você não pode melhorar suas habilidades de programação quando ninguém se importa com a qualidade do software.