A maioria das empresas identificar todos os dados como quer estruturados ou não. Tal como o nome indica, os benefícios de dados estruturados sejam estruturados e configurar para consultas rápidas através de olhar para as técnicas relativamente simples. Dados não estruturados não tem construído em estrutura (embora possa ser "pouco estruturada") e, muitas vezes contradiz esforços para gerar simples o olhar para os motores de procura. Os dados estruturados dá-se a pesquisa simples por vantagem de sua empresa e uma informação homogênea.
Por exemplo, muitos planilhas Excel e todos os diretórios relacionais, pois ambos são retrieveable por tipo e pode, assim, informações para o indivíduo rapidamente existente. Todos os detalhes são proporcionais entre si e relacionais técnicas de controle de fonte de dados (RDBMS) são reforçadas a resposta inquéritos individuais sobre os detalhes. Dados não estruturados contém pouca ou nenhuma estrutura familiares, geralmente devido às características divergentes dos detalhes. Relata a comunidade empresarial que 80% de todos os dados úteis da empresa define em um estado não-estruturados.
Um e-mail fornece um exemplo. Enquanto a informação às vezes são estruturados dentro de uma fonte de dados, os artigos reais do conceito não é. É possível organizar um coordenador de informações por emailer, dados, etc., mas não é possível realizar uma pergunta sobre seus artigos. Todos os dados não estruturados podem ser categorizados como quer as coisas de bitmap ou coisas textuais.
Coisas bitmap envolver todos os dados não centrada na terminologia, como vídeo, som e imagens, enquanto as coisas textuais estão de acordo com a terminologia publicada geralmente encontrados em arquivos de dados conceito de marca e informação, entre outros. Para ser razoável, a frase "dados não estruturados" pode ser algo de um nome impróprio, como muito do que pode realmente ser semelhante a "dados semi-estruturados" que, entretanto, não depressa trabalhar com um RDBMS.
O obstáculo de exploração de dados não estruturados define tanto no seu potencial para o tamanho e seu déficit de estrutura familiar. RDBMSs não podem existente os detalhes em qualquer tipo significativa, de modo que o quer fazer dados não estruturados úteis levou a sistemas como o Hadoop Cloudera e. "Big Data" e dados não estruturados não são condições associadas, mas detalhes Big é quase sempre não estruturados.
Se uma empresa como a Google ou Myspace precisa de uma forma de avaliar o surf