Pesquisar este blog

Breaking News
recent

Significado de Deep Web - O que é, conceito e definição

Deep Web (também chamada de Deepnet, Web Invisível, Undernet ou Web Oculta) se refere ao conteúdo da Word Wide Web que não é indexado pelos mecanismos de busca padrão, ou seja, não faz parte da Surface Web

O que é, e o significado da Deep Web e qual seu lado Obscuro

O que é, e o significado da Deep Web e qual seu lado Obscuro
Você sabe o que é Deep Web?
Não deve ser confundida com a Dark Internet, que está relacionada à porção da Internet que não pode ser acessada ou que se tornou inacessível por meios convencionais. Também não confunde com a Darknet, que não é uma simples rede de compartilhamento de arquivos, mas uma rede subjacente ou em camadas, onde existem grandes esforços no sentido de se manterem anônimos os dados de seus utilizadores.
Mike Bergman, fundador da BrightPlanet e autos da expressão, afirmou que a busca na Internet atualmente pode ser comparada com o arrastar de uma rede superfície do oceano: Pode-se pesca um peixe grande, mas há uma grande quantidade de informação que está no fundo, e, portanto, faltando. A maior parte da informação da Web está enterrada profundamente em sites gerados dinamicamente, não sendo encontrada pelos mecanismos de busca padrão. Estes não conseguem ‘’enxergar’’ ou obter o conteúdo na Deep Web – aquelas páginas não existem até serem criadas dinamicamente como resultado de uma busca específica. A Deep Web possui um tamanho muito superior ao da Surface Web.
O risco da Deep Web é, basicamente, a intenção com o usuário a acessa. Por conter páginas com conteúdo ilegal, as mesmas podem conter vírus, prejudicando a segurança do computador. Vale lembrar que ela também, por ser criptografada e anônima, é muito usada por criminosos.

Tamanho da Deep web

Estimativas baseadas em extrapolações de um estudo feito na Universidade da Califórnia em Berkeley em 2001 especularam que a Deep Web possui 7.500 terabytes de informação. Estimativas feitas por He et AL, em 2004, detectaram cerca de 300.000 sites da deep Web e, de acordo com Shestakov, cerca de 14.000 destes eram da parte russa de Web em 2006. Em 2008, a web chamada “Deep Web”, não referenciada pelos motores de busca representa 70 a 75% do total, ou seja, cerca de um trilhão de paginas não indexado.
Nomenclatura 
Para referir-se aos websites que não estavam registrados em nenhum mecanismo de busca. Bergman citou um artigo de janeiro de 1996 por Frank Garcia, no qual ele afirma que estes:
“Seriam sites projetados propositalmente, mas que não se teve o interesse de registrá-lo em nenhum mecanismo de busca. Então, ninguém pode encontrá-los! Estão escondidos. Eu os chamo de Web Invisível.”
Outro uso antigo do termo Web Invisível foi feito por Bruce Mount e Matthew B. Koll do Personal Library, Software, descrevendo a ferramenta da deep Web “@1”, na edição de dezembro de 1996.
O primeiro uso do termo específico deep Web, agora reconhecido, ocorreu no estudo de 2001 de Bergman, mencionado anteriormente. 
O conteúdo da deep web pode ser classificado em uma ou mais das seguintes categorias:

Classificação da Deep web

Conteúdo dinâmico: páginas dinâmicas que são retornadas em resposta a uma requisição ou através de um formulário.
Conteúdo isolado: páginas que não possuem referencias ou ligações vindas de outras páginas, o que impede o acesso ao seu conteúdo através de web crawlers. Diz-se que essas páginas não possuem backlinks. 
Web privada: sites que exigem um registro e um login (conteúdo protegido por senha).
Web contextual: página cujo conteúdo varia de acordo com o contexto de acesso (por exemplo, IP do cliente ou sequência de navegação anterior). Muitos sites estão escondidos e não há possibilidade de acesso, propositadamente. 
Conteúdo de acesso limitado: sites que limitam o acesso às suas páginas de modo técnico (usando CAPTCHAS por exemplos). 
Conteúdo de scripts: páginas que são acessíveis apenas por links gerados por JavaScript, assim como o conteúdo baixado dinamicamente através de aplicações em Flash ou Ajax. 
Conteúdo não-HTML/texto: conteúdo textual codificado em arquivos multimídia (imagem ou vídeo) ou formatos de arquivo específicos que não manipulados pelos motores de busca. Conteúdo que utiliza o protocolo Gopher ou hospedado em servidores FTP, por exemplo, não é indexado pela maioria dos mecanismos de busca. O Google exemplo, não indexado páginas fora dos protocolos HTTP ou HTTPS. 

 Clique no link logo abaixo e conheça muitos Posts bizarros da Deep Web 

Referência: 
"Exploring a 'Deep Web' That Google Can’t Grasp" 
"The Deep Web: Surfacing Hidden Value"

Empresas de sucesso

Empresas de sucesso

Nenhum comentário:

Postar um comentário

Deixe seu Comentario

Fabiano . Tecnologia do Blogger.