SEOQuantum Open Nav

Por qué el TF*IDF no permite optimizar tus contenidos

Par
le Martes 15 Octubre 2019 - Mise à jour Sábado 02 Marzo 2024
Temps de lecture : 10 minutes

Muchas herramientas o consultores SEO basan sus creaciones y/o optimizaciones de contenido en el método TF*IDF. Aunque el TF IDF nos da la impresión de mejorar nuestros contenidos, en realidad no resuelve los problemas de posicionamiento.

Al aprender más sobre su uso y funcionamiento, descubrirás que el uso del TF-IDF puede llevar a errores en tus optimizaciones de contenido.

¿Qué es el TF*IDF?

El TF-IDF (para Term Frequency e Inverse Document Frequency) es una medida utilizada para determinar la relevancia de un término en un documento. La fórmula tiene en cuenta la frecuencia de un término (TF) en un documento dado, así como el número de documentos que contienen esta palabra (IDF). El TF IDF permite distinguir los elementos diferenciadores (en este caso, las palabras) de un documento a otro.

Para obtener más información sobre el método y su cálculo, visita aquí https://www.seoquantum.com/billet/optimisez-vos-contenus-mots-rares

¿Google utiliza el método TF IDF? ¿Es esta medida todavía relevante?

Google (a través de John Mueller) ha insinuado que el uso de este método por el motor de búsqueda es limitado. Menciona el TF-IDF por primera vez cuando aborda el tema de la exclusión de las palabras vacías.

Esto no es sorprendente dado el avance de la base de datos del Knowledge Graph y los algoritmos de Colibrí y Rankbrain. Google está en constante evolución. Su comprensión del lenguaje mejora constantemente a medida que aprende a lidiar con las ambigüedades del lenguaje humano.

Google también mejora su capacidad para manejar consultas con múltiples significados. Sin embargo, el algoritmo está lejos de ser perfecto. Como veremos, esto plantea un serio desafío para aquellos que utilizan el método de análisis TF-IDF para la optimización de contenidos.

En un mundo donde la IA, las redes neuronales y el aprendizaje automático son la norma, el TF-IDF está obsoleto. Es un poco como comparar un Renault 4L con un Tesla.

¿Por qué el TF-IDF nos da la impresión de que funciona?

A pesar del uso limitado de esta tecnología anticuada por parte de Google, muchos consultores SEO y herramientas semánticas aprecian el TF-IDF. ¿Por qué?

El TF-IDF es un concepto relativamente desconocido dentro de la comunidad SEO. Debido a que este método de análisis no les es familiar, muchos expertos SEO o herramientas piensan erróneamente que se trata de una tecnología de vanguardia. Esto le confiere cierto prestigio.

Pocos conocen la historia del TF-IDF. La mayoría no conoce ni su verdadera edad (los años 1970) ni su verdadero objetivo. Pista: este método no fue creado para la optimización de contenidos. Para obtener más información, visita los trabajos de G. Salton y K. Spärck Jones.

Los expertos SEO piensan que el TF-IDF juega un papel importante en el funcionamiento de los algoritmos de búsqueda de Google. Debido a que varios patentes y algunas publicaciones hacen referencia a él, existe una suposición errónea sobre el papel que juega esta tecnología.

El TF-IDF aparece como un método sofisticado para la mayoría de los consultores SEO. Es raro que estos últimos hayan sido formados en ciencia de datos. Por eso, es fácil para ellos suponer que la complejidad aparente de este método se traduce en su eficacia.

¿A quién no le gustaría utilizar una tecnología sofisticada y revolucionaria para optimizar los motores? ¡Eso suena tan prometedor!

Excepto que no lo es.

6 dificultades encontradas con el TF IDF

Existen una serie de herramientas SEO, gratuitas o de bajo costo, que prometen ayudarte a optimizar tus contenidos utilizando el método de análisis TF-IDF. Todas estas herramientas presentan los siguientes problemas.

El TF-IDF es un enfoque primitivo

El TF-IDF permite medir la importancia de un documento dentro de un corpus, en función de un término dado. Sus habilidades son limitadas, especialmente cuando se utilizan sinónimos. De hecho, un documento considerado muy relevante para "bebé" puede ser ignorado para el término "infante".

Google, por su parte, sabe que las palabras "bebé" e "infante" están fuertemente relacionadas (son sinónimos). Comprende que una página relevante para uno probablemente sea relevante para el otro, a menos que haya indicios de contexto en el resto de la consulta que demuestren lo contrario. Esto se basa en la co-ocurrencia, así como en la probabilidad de que ambos se utilicen en contextos similares.

El uso del TF para determinar la importancia de un término es una medida imperfecta

Determinar la importancia de un término en función de su frecuencia de uso en una SERP es una medida imperfecta.

Si las intenciones de búsqueda de la mitad del corpus difieren de la otra mitad, el peso del término (su importancia) será del 50%. Sin embargo, si todos los documentos de este corpus utilizan una palabra común, esta última será considerada como el término más importante sin distinción de intención.

Por lo tanto, tendrás que elegir y concentrarte en una sola intención. Pero la herramienta te disuadirá de hacerlo, ya que sólo cinco resultados utilizan el término. Te indicará que sólo hay cinco resultados de 10.

El IDF, por su parte, permite contrarrestar la medida del TF para determinar la rareza (los elementos diferenciadores) de una página.

El uso del método se basa en las SERP de Google

Las herramientas semánticas que utilizan TF-IDF generalmente explotan los 10 o 20 primeros resultados de una SERP sin estudiar las razones por las que estas páginas contienen estos temas, lo que plantea dos sesgos:

  1. Las páginas pueden deber su "buen" posicionamiento a factores distintos del contenido, como la construcción de enlaces, por ejemplo.
  2. El uso de un número pequeño de documentos afecta significativamente la calidad de los resultados. Estas herramientas no tienen en cuenta los contenidos de calidad mediocre o los textos cortos.

El margen de error es tan alto que incluso teniendo en cuenta las debilidades de estas herramientas, no tendrás la información necesaria para tomar decisiones informadas.

Te sugiero que ahorres tiempo utilizando otras herramientas más eficaces. Es importante analizar todos los contenidos que abordan tu tema.

El método de análisis TF-IDF y las herramientas que calculan la densidad de palabras clave no lo permiten. Si sigues sus consejos, tendrás tantas posibilidades de éxito como si hubieras jugado a la lotería.

El TF-IDF analiza y agrupa páginas con objetivos diferentes

Seleccionar todas las páginas que aparecen entre los primeros resultados de Google crea otros problemas. Puedes incluir páginas demasiado generales, demasiado específicas o relacionadas con un sector de actividad diferente al tuyo.

Además, el TF-IDF no comprende las intenciones de búsqueda.

En otras palabras, si tienes un contenido de calidad, centrado en una intención de búsqueda diferente, serás llevado a error.

Si tienes un contenido de mala calidad cuyo posicionamiento fuera del sitio web ha sido bien optimizado, también serás dirigido por el camino equivocado. Si dudas entre varias intenciones, la herramienta tampoco será eficaz.

En azul, las páginas con un objetivo informativo, en verde las páginas con un objetivo comercial y en amarillo un objetivo transaccional.

Las herramientas que utilizan el método TF-IDF sólo tienen en cuenta las páginas

Al limitarse a las páginas, estas herramientas no son conscientes de la totalidad de tu sitio web.

Escribir una sola página sobre un tema generalmente no es suficiente para optimizar los contenidos. Para hacerlo bien, tendrás que crear otros contenidos que aumentarán tu relevancia temática y permitirán el uso de textos de anclaje y enlaces internos.

En SEOQuantum, hemos creado el rastreador semántico para ayudarte en esta tarea.

Una nota que no tiene ningún significado

Dar una nota a una página en función de su conformidad con el TF-IDF parece a primera vista una buena idea. Pero si no puedes aprender más sobre el sitio web o la página, esta información carece de sentido y no es explotable.

Ten en cuenta que la página con la nota más alta puede:

  • tener un objetivo diferente al tuyo
  • Tener mucha más o mucha menos autoridad
  • Tener varios objetivos
  • Cubrir varios temas

Creemos en la IA y en su valiosa ayuda en el enriquecimiento de los contenidos, especialmente a través de conceptos clave. Aquí para el babyphone, la IA ha distinguido 3 conceptos: las funciones del aparato, la emisión de ondas y finalmente la distancia del emisor.

Socorro, mi redactor utiliza el TF IDF

Las herramientas que utilizan el método TF-IDF fomentan malos hábitos en los redactores y expertos SEO. Intentan construir los contenidos alrededor de palabras que no son adecuadas o añaden secciones que no corresponden a la intención de búsqueda.

Aunque es posible encontrar inspiración gracias a esta lista, está lejos de ser una verdadera solución.

¿Qué pasa cuando creas una lista de palabras clave utilizando esta metodología? Los temas y las intenciones de los diferentes términos variarán. La persona que reciba esta lista no sabrá qué hacer con ella. Es simplemente ineficaz.

El TF-IDF: las ventajas

A pesar de su ineficacia e inexactitud, parece que hay valor en utilizar este tipo de enfoque. Este método permite, entre otras cosas, inspirarte o hacerte descubrir un tema en el que no habías pensado. Pero también puede ayudarte a darte cuenta de que has sobreoptimizado tu página (demasiadas palabras clave...).

Conclusión

¿El método TF-IDF proporciona suficiente información para optimizar tus redacciones de contenido? En absoluto.

Esta metodología tiene más de 50 años y juega un papel muy limitado en el funcionamiento de los algoritmos de búsqueda de Google. No es una tecnología de vanguardia.

Tus páginas deben ser completas y de calidad (principio del contenido pilar).

El modelo TF-IDF no te ayudará a alcanzar este objetivo.

Los motores de búsqueda a veces utilizan el modelo TF-IDF en complemento de otros factores.

Es sólo uno de los elementos que permiten hacer búsquedas en el marco de la optimización de contenidos. Las herramientas SEO que utilizan TF-IDF no son soluciones completas. No te proporcionarán la información necesaria para tomar decisiones informadas.

Podrías confiar igualmente en tu redactor para tomar estas decisiones.

Otras recursos:

Need to go further?

If you need to delve deeper into the topic, the editorial team recommends the following 5 contents:

Promedio: 3.7 (6 votos)

Alors, prêts à booster votre référencement naturel ?

Testez notre version d'essai

Essayer pendant 7 jours
SEOQuantum