Google Analytics – Ghost Spams, o que é e como bloquear?

Se você acompanha suas estatísticas no Google Analytics, talvez tenha notado uma incidência cada vez maior dos ‘ghost spam referrals’ que são sites que simulam uma visita ao seu site, apenas para ficarem registrados em suas estatísticas, e com isso levar você (e qualquer outro curioso) a clicar nestes links. 

Os spammers farão qualquer coisa para direcionar mais tráfego para os seus sites. Uma das táticas que eles empregaram para esse efeito é encontrar maneiras de aparecer no Google Analytics, esperando que os proprietários de sites cliquem em um site para ver por que ele está enviando tráfego para eles.

Apesar de parecerem inofensivos, podem prejudicar e muito o seu posicionamento, já que mesmo com a ‘visita’ registrada, não houve interação deste site (ghost) com o seu, o que leva o Google a crer que seu site não possui conteúdo interessante (alta taxa de vistas fantasmas X nenhuma interação).

 


Uma das maneiras de evitar este prob
lema é bloquear os Ghost Spams em sua conta no Google Analytics.

Tipos de spam

O spam no Google Analytics pode ser categorizado em dois tipos: ghosts e crawlers.

Ghosts

A grande maioria dos spams é deste tipo. Eles são chamados de ghosts porque nunca acessam o seu site. É importante manter isso em mente, pois é a chave para criar uma solução mais eficiente para o gerenciamento de spam.

Tão incomum quanto parece, este tipo de spam não tem qualquer interação com seu site. Você pode se perguntar como isso é possível, já que um dos principais objetivos do GA é rastrear visitas aos nossos sites.

Eles fazem isso utilizando o protocolo de medição, que permite que as pessoas enviem dados diretamente para os servidores do Google Analytics. Usando esse método, os códigos de controle provavelmente são gerados aleatoriamente (UA-XXXXX-1), bem como os spammers deixam uma marca da “visita” com dados falsos, sem sequer saber que eles estão marcando essas informações.

Crawlers

Este tipo de spam, o oposto do ghost spam, acessa seu site. Como o nome indica, estes spam bots rastreiam suas páginas, ignorando as regras como as encontradas em robots.txt, que são supostamente criados para impedi-los de ler o seu site. Quando saem do seu site, eles deixam um registro em seus registros que são muito semelhantes a uma visita legítima.

Crawlers são mais difíceis de identificar porque eles sabem suas metas e utilizam dados reais. Mas também é verdade que novos spams raramente aparecem. Então, se você detectar uma referência em sua análise que pareça suspeita, pesquise-a no Google ou verificar suas referências contra nesta lista poderá ajudá-lo a responder à questão de saber se é ou não spam.

Você só precisa de um filtro para lidar com ghost spam

Normalmente, recomenda-se adicionar o referral para um filtro de exclusão depois de ser descoberto. Embora isso seja útil como uma ação rápida contra o spam, ele tem três grandes desvantagens.

  • Fazer filtros a cada semana para cada novo spam detectado é tedioso e demorado, especialmente se você gerenciar muitos sites. Além disso, pelo tempo que você aplicar o filtro, e ele começar a funcionar, você já tem alguns dados afetados.
  • Alguns dos spammers usam visitas diretas, juntamente com referrals.
  • Esses ataques diretos não serão interrompidos pelo filtro, então, mesmo que você estiver excluindo a referral, você ainda receberá o tráfego inválido, o que explica por que algumas pessoas têm visto um aumento excepcional no tráfego direto de dados.

Felizmente, há uma boa maneira de evitar todos esses problemas. A maioria dos spams (ghosts) trabalha marcando dados aleatórios de rastreamento-IDs do GA, ou seja, o infrator não sabe realmente quem é o alvo, e por isso quer o nome do host que não está definido ou usa um falso (veja relatório abaixo).

spam4

Você pode ver que eles usam alguns nomes estranhos ou não se incomodam mesmo em definir um. Embora existam alguns nomes conhecidos na lista, eles podem ser facilmente adicionados pelo spammer.

Por outro lado, o tráfego válido sempre usará um nome de host real. Na maioria dos casos, ele será o domínio. Mas também pode resultar em serviços pagos, serviços de tradução, ou qualquer outro lugar onde você inseriu o código de tracking do GA.

spam5

Com base nisso, podemos fazer um filtro que vai incluir apenas os acessos que usam nomes de máquinas reais. Isso vai excluir automaticamente todos os acessos a partir do ghost spam, se ele se mostra como uma referral, palavra-chave ou visualização de página; ou mesmo como uma visita direta.

Para criar esse filtro, você terá que encontrar o relatório de nomes de host. Veja como:

  1. Vá para a guia Relatórios no GA.
  2. Clique em Audiência, no painel esquerdo.
  3. Expanda Tecnologia e selecione Rede.
  4. Na parte superior do relatório, clique no nome do host.

spam6

Você verá uma lista de todos os nomes de host, incluindo os hosts que o spam usa. Faça uma lista de todos os nomes de host válidos que você encontrar, como segue:

  • yourmaindomain.com
  • blog.yourmaindomain.com
  • es.yourmaindomain.com
  • payingservice.com
  • translatetool.com
  • anotheruseddomain.com

Para sites pequenos e médios, essa lista de nomes de host provavelmente vai consistir no domínio principal e em alguns subdomínios. Após certificar-se de que você tem todos eles, crie uma expressão regular semelhante a esta:

 

yourmaindomain\.com|anotheruseddomain\.com|payingservice\.com|translatetool\.com

 

Você não precisa colocar todos os seus subdomínios na expressão regular. O principal domínio vai corresponder a todos eles. Se você não tem uma visualização criada sem filtros, crie uma agora.

Em seguida, crie um filtro personalizado.

Certifique-se de selecionar Incluir, em seguida, selecione “Nome” no campo de filtro, e copie a sua expressão na caixa de Padrão de filtro.

spam7

Você pode querer verificar o filtro antes de salvar para verificar se tudo está bem. Assim que estiver pronto, configure-o para salvar e aplicar o filtro a todos as visualizações que você quer (exceto a visualização sem filtros).

Esse único filtro vai se livrar de futuras ocorrências de ghost spams que usam nomes de host inválidos, e ele não exige muita manutenção. Mas é importante que cada vez que você adicionar o código de acompanhamento a qualquer serviço, você deve adicioná-lo até o fim do filtro.

Agora você só precisa cuidar dos crawler spams. Como crawlers acessam seu site, você pode bloqueá-los, adicionando estas linhas no arquivo .htaccess:

 

STOP REFERRER SPAM
 RewriteCond %{HTTP_REFERER} semalt\.com [NC,OR]
 RewriteCond %{HTTP_REFERER} buttons-for-website\.com [NC]
 RewriteRule .* - [F]

É importante notar que esse arquivo é muito sensível, e perder um único caractere pode derrubar todo o seu site. Portanto, certifique-se de criar uma cópia de backup de seu arquivo .htaccess antes de editá-lo.

Se você não se sentir confortável em brincar com seu arquivo .htaccess, você pode, alternativamente, fazer uma expressão com todos os crawlers, e adicioná-los a um filtro de exclusão por fonte da campanha.

Implemente essas soluções combinadas, e você vai se preocupar muito menos com o spam contaminando seus dados do Google Analytics. Isso terá a vantagem de liberar mais tempo para você passar realmente analisando seus dados válidos.

Depois de parar o spam, você também pode obter relatórios limpos a partir dos dados históricos usando as mesmas expressões do Segmento Avançado para excluir todos os spams.

 

Esse artigo foi útil?

Artigos relacionados