Este índice é classificado em ordem alfabética pelo termo de pesquisa, com cada entrada de índice armazenar uma lista de documentos em que o termo aparece ea localização dentro do texto onde ela ocorre. Esta estrutura de dados permite o acesso rápido aos documentos que contêm os termos da consulta do usuário. Para melhorar o desempenho da pesquisa, ignora Google (não indexa) palavras chamadas palavras de parada (como a, é, em, ou, de, como, porquê, bem como alguns dígitos e letras individuais).
Palavras de parada são tão comuns que eles fazem pouco para restringir uma pesquisa e, portanto, eles podem ser seguramente descartada. O indexador também ignora alguns sinais de pontuação e espaços múltiplos, bem como converter todas as letras em minúsculas, para melhorar o desempenho do Google. 3. do Google processador de consultas O processador de consultas tem várias partes, incluindo (caixa de pesquisa) a interface do usuário, o "motor" que avalia as consultas e os compara aos documentos relevantes, e o formatador resultados. PageRank é o sistema do Google para o ranking de páginas web.
Uma página com um PageRank mais elevado é considerada mais importante e é mais provável a ser listado acima uma página com um PageRank mais baixo. Google considera mais de cem fatores na computação um PageRank e determinar quais documentos são mais relevantes para uma consulta, incluindo a popularidade da página, a posição eo tamanho dos termos de pesquisa dentro da página, ea proximidade dos termos de pesquisa para o outro na página.
O Google também aplica técnicas de aprendizado de máquina para melhorar seu desempenho automaticamente por relacionamentos e associações dentro dos dados armazenados aprendizagem. Por exemplo, o sistema de correção de ortografia usa tais técnicas para descobrir o provável ortografias alternativas. Google guarda de perto as fórmulas que ele usa para calcular relevância; eles estão ajustados para melhorar a qu