Captura de dados Os dados podem ser capturados manualmente por sistemas ECM de: Os documentos em papel que podem ser analisados em termos de suas imagens, ou para detalhes essenciais dentro do conteúdo do documento a ser transcrito em uma entrada de dados eletrônica formam documentos de escritório eletrônicos, tais como correspondência, planilhas, apresentações, e assim por diante criado originalmente em um formulário eletrônico e-mails enviados ou recebidos objetos multimídia, como conteúdo de áudio ou vídeo, animação e interatividade Dados microfilme também pode ser arranjado para ser capturado automaticamente a partir de EDI ou XML documentos, aplicativos de ERP, e outros aplicativos de linha de negócios, como contabilidade ou CAD.
Interfaces automatizados pode ser construído com estas fontes. Processamento de documentos digitalizados preliminares e faxes digitais não são de texto legível. Para convertê-los em caracteres legíveis por máquina, diferentes tecnologias de reconhecimento de caracteres são usadas. Actualmente, estes incluem: Optical Character Recognition - OCR - usado para converter imagens de documentos digitados em documentos de texto com caracteres legíveis e editáveis de caracteres manuscritos Reconhecimento - HCR - usado para converter texto manuscrito ou letras em caracteres de texto.
A tecnologia ainda não foi aperfeiçoada Optical Mark Recognition - OMR - usar para ler marcações em caixas e outros campos pré-definidos em formulários, etc. códigos de barras padronizados, permitindo a extração de informações de código de barras utilizando os leitores Ambos OCR e HCR têm sido continuamente melhorados usando recursos de inteligência artificial, como listas de comparação, lógicos e de referência. Documento técnicas de imagiologia ajudar a melhorar a qualidade das imagens digitalizadas, melhorando a legibilidade e ajustar imagens que foram capturadas em um ângulo estranho.
ECM pode entender dados capturados por meio de formulários externos se o sistema de captura conhece a estrutura ea lógica das formas. Agregação e indexação sistemas de gerenciamento de conteúdo corporativo conteúdo captura em vários formatos a partir de inúmera