主页 > SEO知识 > SEO实战 >

分析SEO这个关键词百度前40名 tf-idf词频权重

2019-02-12 14:10 阅读:111 来源:智宇SEO自媒体

  先来看看百度百科对tf-idf的解释:

  TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。TF-IDF加权的各种形式常被搜索引擎应用,作为文件与用户查询之间相关程度的度量或评级。
分析SEO这个关键词百度前40名 tf-idf词频权重

  花了一早上用python爬取SEO这个关键词百度排名前40名,用tf-idf算法计算“SEO”这个词的词频权重。有一些网站可能是程序的问题,分析不出权重。没关系,少几个也不影响我们总结结果。从上图可以看到就附子SEO比较突出达到5,其他都很一般。

  早期tf-idf算法对百度非常有效果,所以很长一断时间,SEO界流行堆积关键词增加该词tf-idf词频权重。现在的百度不可能只靠一个词频权重来给这个关键词排名了。不然早被我们这批屌丝seo虐成狗啦。

  总结:我们做页面的时候tf-idf还是要考虑的,正常布词就好,没必要堆积。