TF-IDF关键词用法

作者: 阅读数:

简介什么是TF-IDF关键词?
本文通俗易懂的介绍TF-IDF的概念、算法、以及应用,为大家揭开TF-IDF关键词的神秘面纱,为更好得布局关键词做好基础准备,实现网页稳定、快速排名。

什么是TF-IDF关键词?

tf关键词=某个关键词在文中出现的次数=某个词在文中出现的次数/文章的总次数

(语料文档总数/(包含该词文档数+1))

语料文档总数可以理解为:互联网中的文档索引总数,这是一个常量,是一个固定值,也是无限大,比如搜索“网站”,百度出现了1亿次。

文档总数

包含该文档数可以理解为:搜索引擎收录得页面总数量,如下图,+1是因为不能让分母为0。

包含关键词的文档总数

搜索西安网站优化出现了6330000个相关页面,这就是包含该词的文档总数。

词频(tf)*逆文档频率(idf)

一头雾水了?让我们举个栗子,通俗易懂的说明一下问题。

词频(tf)举例:假如一篇关于“西安seo优化”的文章的总词语数是1000个,而“西安seo优化”出现了10次,那么词频为:

,即词频为1%。

idf举例:假如再谷歌搜索“了”,发现包含“了”的中文文章总数为20万张,这就是语料文档总数(大约收录得中文文章总数为20万张),其中包含西安seo优化的文章总数又为1000张,那么idf为:

结论和应用:

一般来说tf-idf值越小,包含该词的文档总数越大,则越不好竞争。

相反包含该文档总数越小则越好竞争。

提升tf-idf关键词的办法,就是增加tf关键词密度,但是一定要自然而不能乱堆砌关键词。

站长简介:

华山SEO,擅长seo和网站优化推广,目前任职于西安一家制造企业集团,负责企业的信息化管理工作,日常工作有网络推广、ERP实施建设、网络数据安全、外贸规划、运维等,借助互联网,通过知识分享输出,实现自己的价值,为社会做出贡献,帮助到更多的人。

相关文章