A pesquisa do Google só piorou após a morte de “Googlewhacks”

O Google é de longe o mecanismo de pesquisa mais dominante do planeta, com uma parcela enorme do mercado de mecanismos de pesquisa. Só porque a pesquisa do Google é dominante, no entanto, não significa que é necessariamente bom. De fato, o oposto é verdadeiro; A qualidade da pesquisa do Google está ficando cada vez pior, e é possível identificar o momento em que tudo deu errado.

Nos velhos tempos, o Google era um mecanismo de busca lexical

A pesquisa do Google nem sempre é horrível. Naquela época, fazia exatamente o que deveria fazer. Você digitaria uma consulta de pesquisa e o Google procuraria as palavras -chave exatas em sua consulta de pesquisa na Internet. Ele retornaria apenas os resultados que continham as palavras -chave que você pesquisou.

Crédito: Joe Fedewa / How-To Geek

Isso é conhecido como pesquisa lexical. A pesquisa lexical não tenta entender sua intenção; Ele simplesmente tenta corresponder às palavras específicas que você insere em sua consulta. Se você digitar “Altura do Everest” em um mecanismo de busca lexical, não ache que você provavelmente queira saber a altura do Monte Everest. Ele apenas procura páginas da web que tenham as palavras “Everest” e “altura” nelas.

A maioria das páginas da web que contém informações sobre o quão alto é o Mount Everest terá as palavras “Everest” e “altura” sobre elas em algum lugar; portanto, os resultados dessa consulta de pesquisa em um mecanismo de pesquisa lexical quase sempre serão úteis. Você pode obter o resultado estranho que continha essas palavras, mas não estava totalmente relacionado à montanha, mas sempre foi garantido para obter resultados que continham suas palavras -chave em algum lugar.

Pesquisa lexical tornou possível o Googlewhacks

A maneira como o Google costumava funcionar como mecanismo de pesquisa lexical significava que você poderia se divertir tentando encontrar o Googlewhacks. Um Googlewhack era uma consulta de pesquisa do Google contendo exatamente duas palavras de dicionário válidas, que quando inseridas sem cotações, retornaram apenas um único resultado. Em outras palavras, o jogo era tentar encontrar uma combinação de duas palavras que apareceram apenas em uma única página em toda a Internet.

Por exemplo, alguns ex -Googlewhacks incluíram “Ambidextrous Scallywags”, “Dervixes de esquilos” e “Armadillo fetichizado”. O Googlewhacks tendia a ter uma vida muito curta, pois a ação de postar uma que você encontrou on-line significaria que uma segunda página da web conteria agora essas duas palavras, e o GoogleWhack não seria mais válido.

O comediante britânico Dave Gorman recebeu um livro inteiro e um show do Googlewhacks. A premissa era que ele queria criar uma cadeia de 10 Googlewhacks, onde o proprietário do site onde cada Googlewhack foi encontrado teria que encontrar o próximo Googlewhack na cadeia. Ele viajou pela América, Europa, Austrália e China, conhecendo hosts da web e ficando um pouco loucos. Se você não leu o livro, definitivamente vale a pena conferir Aventura do Googlewhack de Dave Gorman.

Googlewhacks realmente morreu quando o Google mudou como funcionou

À medida que mais pessoas procuravam pelo Googlewhacks, elas se tornaram mais difíceis de encontrar, pois adicioná -las à lista de Googlewhacks descobertos instantaneamente os removeram da existência. No entanto, a idade do Googlewhack realmente chegou ao fim quando o Google mudou fundamentalmente a forma como seu mecanismo de pesquisa funcionou.

O Google se afastou da pesquisa lexical e, em vez disso, começou a se concentrar na pesquisa semântica, que é quando um mecanismo de pesquisa tenta entender a intenção por trás de uma consulta, em vez de apenas procurar palavras -chave. Tudo começou em 2012 com a introdução do gráfico de conhecimento. Este é um enorme banco de dados de informações que o Google usa para conectar palavras em consultas de pesquisa em “coisas, não strings”.

O exemplo que o Google deu no lançamento foi a consulta “Taj Mahal”. Um mecanismo de busca lexical procuraria a palavra “Taj” e também procuraria a palavra “Mahal”. Usando o gráfico de conhecimento, no entanto, é possível entender que essas duas palavras juntas se referem a uma coisa específica, seja o famoso monumento ou o músico de mesmo nome.

Crédito: Google

Em 2013, o Google introduziu seu novo algoritmo Hummingbird. Esse algoritmo de pesquisa se concentrou no processamento da linguagem natural e tentou descobrir a intenção da consulta de pesquisa em vez de apenas corresponder às palavras -chave.

Foi nesse ponto que o Googlewhack realmente morreu, porque quando você digita duas palavras em um mecanismo de pesquisa semântica, não está procurando páginas que contenham essas duas palavras -chave exatas. Está procurando o que acha que essas duas palavras significam. Uma busca por “Armadillo fetichizada” repentinamente produz resultados muito menos inocentes que o Googlewhack original.

Desde então, a pesquisa do Google ficou cada vez pior

O Google mudou para a pesquisa semântica em um esforço para melhorar a pesquisa. Infelizmente, isso está longe de ser o caso; A pesquisa do Google agora está muito, muito pior do que costumava ser, e a qualidade dos resultados da pesquisa continua se deteriorando. Se você usar um pouco o Google, quase certamente terminou frustrado com o quão difícil é fazer com que o Google retorne resultados úteis para consultas aparentemente simples.

O problema é que o Google levou as coisas longe demais. Quando você entra em uma consulta de pesquisa agora, o algoritmo está tão com a intenção de pesquisar o que pensa que você quis dizer que ele mudará ativamente sua consulta de pesquisa para outra coisa.

Parte disso acontece nos bastidores, mas muito é esfregado na sua cara. Recentemente, vi um meme que estava em inglês, mas continha a palavra sueca “Solidaritetersättning”. Pesquisei a palavra para descobrir o que isso significava, mas o Google decidiu que eu realmente não queria saber o que essa palavra significava; O que eu realmente pretendia procurar foram as duas palavras separadas “SolidariTet” e “ersättning”, com o topo da página de resultados, orgulhosamente afirmando que “esses são resultados para o Solidaritet Ersattning”.

De acordo com o Google Traduz, essas palavras se traduzem separadamente como “solidariedade” e “substituição”, quando a palavra como um todo significa “pagamento de solidariedade”. O Google agora estava procurando algo diferente do que eu havia pedido explicitamente, e isso é algo que faz muito.

Se você acha que colocar sua consulta de pesquisa nas cotações resolverá o problema, pense novamente. Coloquei citações em torno da única palavra “Solidaritetersättning” e tentei novamente. Mais uma vez, o Google ignorou minha clara intenção de procurar essa palavra específica e me deu resultados para as duas palavras separadas, nenhuma das quais foi usada.

Sinto falta dos dias em que os resultados da pesquisa do Google foram para você, em vez do Google

É incrivelmente frustrante quando a pesquisa do Google ignora ativamente partes importantes de sua consulta para trazer resultados que são completamente irrelevantes. Tantas vezes, vejo os resultados na primeira página que têm uma das palavras mais importantes da consulta atingida por baixo do resultado, indicando que o resultado é para uma consulta reformulada que omitiu a palavra crucial. Não é realmente surpresa quando esses resultados de pesquisa acabam sendo completamente inúteis.

Tudo isso traz à tona meu lado cínico. Por que os resultados da pesquisa do Google estão piorando e não melhores? Existe uma razão para além da lei de que os bons serviços de tecnologia sempre pioram eventualmente?

n
n””>
Crédito: Jason Montoya / How-To Geek

Se a Pesquisa do Google estiver reescrevendo nossas consultas em segundo plano, não há nada para impedir que ele mude essas consultas para aquelas que provavelmente produzirão mais lucros. O Google ganha dinheiro com os anunciantes que pagam para que seus anúncios apareçam juntamente com os resultados da pesquisa para palavras -chave específicas, e algumas palavras -chave valem muito mais do que outras. Será que o Google está reformando nossas consultas de pesquisa para não melhorar os resultados da pesquisa (porque eles claramente não são), mas para tornar a consulta mais lucrativa?

Isso é pura especulação, e não estou dizendo que é definitivamente o que está acontecendo. A pesquisa do Google pode ser simplesmente pior porque a Internet ficou muito maior, ou porque seus algoritmos simplesmente não são tão bons quanto costumavam ser. Apenas o Google realmente sabe.


Sempre tendemos a olhar para trás no passado com óculos cor de rosa, mas no caso da pesquisa do Google, não há como negar que é muito, muito pior do que costumava ser. O conceito por trás do uso de pesquisa semântica em vez de pesquisa lexical pode ter sido boa inicialmente, mas foi tão longe o contrário que é quase impossível fazer o Google procurar o que você realmente deseja. Infelizmente, não parece que isso mudará tão cedo, então todos ficamos sonhando com os bons velhos tempos em que o Googlewhack ainda era uma coisa.

Este artigo foi útil?
Gostei0Não Gostei0

Related posts

Este hack de e-mail resolve a maioria dos meus problemas de caixa de entrada

PSA: o Google Fotos está diminuindo a qualidade de suas memórias

Como evitar que suas contas sejam hackeadas