TF IDF pentru a testa rezultatele seo
Există posibilitatea să fiți întâlnit termenul TF * IDF fiind utilizat pe alocuri în ultimul an, dar nimeni nu v-ar putea învinui dacă nu i-ați acordat atenție până acum.
O mulțime de capricii SEO vin și pleacă, iar unele dintre cele mai interesante sfârșesc prin a atrage penalizări, nu-i așa?
Însă TF * IDF este ceva diferit.
Nu este o metodă prin care se urmărește manipularea motoarelor de căutare; este o metodă de analiză a subiectelor din conținut și este construită pe aceleași principii ca motoarele de căutare în sine.
Din această cauză, are un potențial uimitor pentru SEO, care au nevoie de o metodă cu adevărat obiectivă pentru a putea măsura și îmbunătăți conținutul.
De curând a fost prezentat un studiu de caz pentru a vedea exact de ce este capabilă această metodă, iar rezultatele au fost destul de interesante.
În cazul în care unii dintre dumneavoastră se situează în situația în care am fost eu acum câteva luni, vreau să mă asigur că am acoperit tot ceea ce am învățat despre TF * IDF și cum este folosit înainte de a ajunge la ceea ce am învățat din experimentele personale.
Ce este de fapt
Este un acronim?
O ecuație?
În termeni literari înseamnă : Term Frequency times Inverse Document Frequency
TF * IDF este o ecuație care combină aceste două măsurători – Cât de des este folosit un termen pe o pagină ( TF ) și cât de des apare acel termen în toate paginile unei colecții ( IDF ) – pentru a atribui un punctaj sau o greutate , pentru importanța termenului respectiv pentru pagină.
Știu, nerg alert, nu?
Vom analiza motivul pentru care acest lucru este atât de important pentru SEO, dar mai întâi, să vedem de unde a apărut.
Ecuația în sine are o istorie foarte lungă în mediul academic, unde cercetătorii din foarte diverse, precum lingvistica sau arhitectura informațională au folosit-o ca o modalitate de a analiza bibliotecile masive de documente într-un timp scurt.
Este folosită și de programele de preluare a informațiilor ( inclusiv toate motoarele de căutare ) pentru a sorta și cataloga în mod eficient relevanța a milioane de rezultate.
Este o diferență destul de mare între ceea ce doriți dumneavoastră să faceți cu acele informații și ceea ce dorește motorul de căutare să facă cu ele.
Motorul de căutare dorește să ia în considerare o colecție formată din toate rezultatele de pe web, în timp ce dumneavoastră doriți să comparați o pagină sau un site web doar cu site-urile care sunt în top 10.
Ecuațiile care duc spre TF * IDF
Trebuie să folosiți mai multă matematică pentru a obține ambele măsurători, respectiv TF și IDF. dar nu va fi dificil. În funcție de aplicație, ecuațiile pentru TF * IDF pot fi mult mai complicate decât exemplele pe care le găsiți mai jos.
Simplificat sau nu, în general nu doriți să fiți prinși făcând acest lucru manual dacă încercați să optimizați un site. Aceste ecuații vă vor ajuta să înțelegeți modul în care funcționează TF * IDF.
Rezolvați prima, Frecvența Termenilor – TF – îl aflați calculând de ori pe care apare un termen pe o singură pagină. Apoi, conectați acest număr la ecuația de mai jos:
TF = numărul termenilor / numărul total de cuvinte din document
IDF = log (numărul documentelor / documentele care conțin keyword)
Pentru mai multe informații despre seo puteți citi și articolele Trenduri importante in SEO in 2020 dar și 6 Tehnici SEO Black Hat care ar trebui evitate in 2020