A otimização semântica de conteúdos em SEO passa pela avaliação dos termos de um corpus. Um dos métodos para determinar a relevância das palavras em um texto é a análise da frequência dos termos. A frequência dos termos (TF: term frequency) é apenas uma parte do famoso método TF-IDF para a recuperação de informações. A outra parte é a frequência inversa dos documentos (IDF: inverse document frequency), vamos focar no IDF. O artigo desta semana explica como o IDF funciona. Meu objetivo é mostrar a importância de criar conteúdo que seja único. Claro, existem muitas outras razões além do SEO: reputação, notoriedade...
🤔 O que é a frequência inversa de documento (IDF)?
Vamos a um exemplo:
Na prática, o primeiro passo é medir a frequência de ocorrência dos termos no corpus (um conjunto de documentos). Neste exemplo, vemos que a palavra "os" aparece em cada documento, isso não oferece nenhuma informação para distinguir os documentos.
No entanto, a palavra "criança" aparece em apenas 1000 dos documentos. Obviamente, essa palavra oferece um elemento de diferenciação para os documentos que a contêm. É uma medida da raridade de um termo.
A frequência dos documentos mede a semelhança (o fato de os documentos possuírem termos semelhantes em seu conteúdo), aqui preferimos medir a raridade.
A fórmula se parece com isto:
Não se preocupe, aqui está a explicação. Para cada termo, pegamos o número total de documentos no corpus e o dividimos pelo número de documentos que contêm nosso termo. Isso nos dá a medida da raridade do termo. No entanto, não queremos que o cálculo resultante indique que a palavra "criança" é 500 vezes mais importante que a palavra "jogo", então pegamos o Log Base 10 do resultado, para linearizar este cálculo. Do ponto de vista do motor de busca, "Criança" é, portanto, 10x mais relevante que o termo "jogo" neste corpus.
Aqui está a tabela de IDF para os termos:
Você pode ver que a melhor pontuação vai para o termo que é mais raro. Interessante...
❓ Para que serve o IDF?
"O IDF como uma medida de unicidade": nesse sentido, os motores de busca podem identificar o que torna um documento específico único e especial. Para mim, o IDF traz muito mais valor e informação do que a frequência de ocorrência dos termos (densidade de palavras-chave).
Vamos a um exemplo:
Você quer se posicionar entre um dos 36 milhões de sites da internet que aparecem para a consulta de pesquisa "jogos ao ar livre"? Então você tem milhões de sites como concorrência! Suas chances de ser posicionado no TOP10 no Google para este termo baseado na qualidade do seu conteúdo são quase nulas. A única maneira de você ser classificado nesta SERP competitiva é trabalhar em outros fatores de SEO como linkagem externa, redes sociais...
Se você é novo neste mercado, não tem chance de se destacar assim contra seus concorrentes! Meu conselho é procurar uma alternativa diferente: você deve usar termos adicionais para complementar a demanda do usuário. Em nosso exemplo, se adicionarmos a palavra "ideia" para "ideia de jogos ao ar livre", o número de resultados é apenas de 340.000. Admita, é muito menos competitivo!
Contornando o assunto principal com palavras raras, você finalmente tem uma chance de aparecer na primeira página da SERP. Esta é a razão pela qual o uso de palavras-chave de cauda longa é tão importante hoje! Faça as perguntas certas, responda à intenção de busca, e você será visível na Web!
🔎 Como encontrar palavras raras em SEO?
O IDF destaca a importância da unicidade nos conteúdos que criamos. Sim, essa estratégia de unicidade não gera tantos visitantes quanto se você estivesse classificado em uma palavra-chave mais genérica. Mas se você é novo em um mercado competitivo, você não será capaz de se posicionar no TOP 10 apenas com seu conteúdo.
Na ferramenta semântica SEOQuantum, usamos um índice em nossas análises WORDPRINT baseado em Okapi BM25, uma versão avançada do TF*IDF e provavelmente usada pelo Google. Este índice é medido de 0 a 10.000, um valor de 10.000 significa que a lexia está onipresente na análise. Foi graças a esta análise do Wordprint para "jogo ao ar livre" que encontrei as seguintes palavras raras:
- Ideia
- Proteção
- Escada
- Rede
- etc.
Se você puder escolher um número menor de palavras-chave (ou expressões) com muito menos concorrência e criar conteúdo em torno dessas demandas, você pode começar a se posicionar mais facilmente e assim obter visitantes e monetizar seu público: esta é uma estratégia SEO ROIsta. Porque mesmo que o volume de pesquisa mensal seja baixo, o tráfego que você atrai é altamente qualificado, o que aumenta significativamente suas chances de converter seus prospects em clientes!
Quando comecei em 2003, estava convencido de que a análise e a estratégia de palavras-chave se baseavam no volume de pesquisas. Com o tempo, essa estratégia se mostrou longa, dolorosa e incerta. Rapidamente, entendi a importância de sair do "caminho comum" diferenciando-se através da frequência inversa de documento (IDF). A criação de conteúdo que traz uma nova perspectiva é muitas vezes uma maneira muito poderosa de começar sua estratégia de SEO e atrair rapidamente tráfego qualificado.
🙏 Fontes usadas para escrever este artigo
Need to go further?
If you need to delve deeper into the topic, the editorial team recommends the following 5 contents: