北京SEO百度排名_网络推广_网站建设_专业网站优化【启点网络】

网站制作SEO优化推广10年,客户1200+

清洗按_词根扩展后的词库并_聚类分析_长尾关键词前后缀

文章分类: SEO方案资讯 文章来源: 北京启点网络 文章作者: 北京SEO顾问 时间: 2018-05-14 12:49:37浏览热度:


[导读]:

众所周知,从事SEO的第一步是准备关键词词库。而获得关键词的方法有很多种,比如采集下拉框及相关搜索,采集竞争对手词库,乃至更高效的直接通过搜索引擎的API来建立词库等等。

  今天看到基友夜息写的SEO聚合频道中有提到关键词清洗及过滤,所以想到了我博客的这第一篇文章。

  众所周知,从事SEO的第一步是准备关键词词库。而获得关键词的方法有很多种,比如采集下拉框及相关搜索,采集竞争对手词库,乃至更高效的直接通过搜索引擎的API来建立词库等等。

  假设你现在需要新建一个词库,则最起码你需要有一批词根,以此做第一轮的相关关键词扩展。对于绝大部分朋友来说,词根其实就是产品名,比如mp3,iphone,galaxy s3等等。本文不讨论这类词根的纵向拓展(纵向拓展词的定义:类似mp4作为mp3的相关搜索词,北京旅游作为南京旅游的相关搜索词,我们在此定义为纵向扩展词;横向拓展词的定义:类似mp3 player price作为mp3的相关搜索词,南京旅游景点作为南京旅游的相关搜索词,也就是扩展词A中包含词根B,我们在此定义为横向扩展词),而只讨论第一轮横向拓展后,如何清洗结果数据,得到可在所有同一属性词根上套用的长尾关键词前后缀。

  在整理好属性相同的一批词根列表(比如mp3,mp4,mp5他们同作为视频播放器,是可以视为统一聚类进行分析的,因为搜索的用户是同一群人。其他的如北京水魔方,常州恐龙园,苏州乐园也属于属性相同的词根)之后,我们可以通过一些工具(如光年百度推广关键词获取工具)来对词根进行扩展,在得出结果之前我们都是很happy的,但是得到结果之后绝大部分人就崩溃了。因为绝大部分人的词根列表少则几千多则上万,而扩展得出的结果少说也有10万条,数据量少的时候我们可以通过手动提取单个词的长尾前后缀,但是词库扩展后的结果显然完全没法人工来做。。。

  至此,如果我们要分析长尾关键词前后缀,第一步就是剔除横向扩展后词库当中的词根,得到前后缀部分。批量剔除词根的方法有很多,比如shell,但是我本人更亲睐于excel,毕竟他很方便而且直观。

  在打开的excel表格中,我们假设sheet1存放了关键词词库,sheet2存放了1000个词根如下图所示。

  示例扩展后的关键词词库如下图:

  

清洗按词根扩展后的词库并聚类分析长尾关键词前后缀 1

 

  示例用于扩展的词根如下图:

  

清洗按词根扩展后的词库并聚类分析长尾关键词前后缀 2

 

  接下来我们在sheet1的C1单元格中输入为包含什么词根,在C2单元格中输入以下数组函数{=INDEX(sheet2!$A$2:$A$1000,MATCH(TRUE,ISNUMBER(FIND(sheet2!$A$2:$A$1000,A2,1)),0))}(注意match_type=0是一定要写的,不然这段程序会出错),然后双击填充所有下方单元格。当当当当,所有词根横向扩展出来的长尾关键词就全部出现鸟。接下来要做的就是筛选,勾选掉#N/A的部分,得出的就是所有横向扩展出的长尾关键词啦,成果如下图所示:

  

清洗按词根扩展后的词库并聚类分析长尾关键词前后缀 3

 

  接下来我们要做的是在sheet1中的D1,E1单元格分别输入长尾词前缀,长尾词后缀。然后在D2,E2单元格分别输入以下函数:=LEFT(A2,FIND(C2,A2)-1)以及=RIGHT(A2,LEN(A2)-FIND(C2,A2)-LEN(C2)+1)。然后双击向下填充所有单元格即可。至此我们已经得到了所有长尾关键词的前后缀了,终于快完工了哦!

  【本篇文章来自道哥博客http://www.seodug.com/,您看到的可能只是采集的结果,原主题会不断更新以提供高质量的内容,如果您想看到更多100%原创,高质量,一线实战SEO的分享和分析请到道哥博客】

  但是这边还有一点需要考虑到的是,尽管词根列表都是唯一的,但是其中有可能会有自我包含的情况的。比如在我的词根当中会有这么两行数据,“西湖”以及“瘦西湖”,这两个词语代表的是两个不同的景点,但是其中都包含了同一词语也就是“西湖”。那么如果我们不对词根所在的sheet2做任何处理的话,有可能在去词根时出现偏差,比如在sheet1中的“瘦西湖门票价格”该行进行词根匹配的时候,词根“西湖”以及“瘦西湖”的命中都为TRUE,这个时候MATCH函数会从两者中返回第一个出现的词语所在sheet2中的行数,那如果在词根列表中“西湖”行数小于“瘦西湖”行数,那返回的结果就是“西湖”,那么剔除词根的时候,后缀长尾词倒是不会受到影响,但是前缀长尾词就悲剧的变为“瘦”了。。。

  那么如何避免这个问题呢,其实很简单,首先,我们对词根所在的sheet2进行自包含的查询,新建一列数据,假设是B列,在B2中填入以下数组函数公式做自包含查询,然后向下填充:{=COUNT(FIND(A2,$A$2:$A$1000))}

  该函数得到的数字可以理解为这样一个过程:你ctrl+c复制该单元格然后ctrl+f调出查找选项框,然后ctrl+v粘贴最后点击查找全部后结果中得出来的行数。

  还有尽可能将选中的绝对列数据拉长点以避免将来表格中有新数据加入。然后进行筛选,查看其中是否存在自我包含。如果词根不存在自包含,那就谢天谢地啥都不用干了,但如果存在的话,则再新建一列,假设是C列,在C2中填入以下公式:=LEN(a2),然后向下填充。最后对表格内所有数据按照该列字符串长度进行降序排列即可。

  这么做能解决上面提到的西湖、瘦西湖问题的原理是:长词优先。

  最后一步就是利用excel自带的数据透视图就OK了,操作很简单的,所以直接上图了,至此我们就全部完成了词库从获取,到筛选出横向长尾关键词,到剔除词根截取到长尾关键词前后缀,到生成数据报告的全过程了。至于如何分析这最终的数据,我想应该不用我教了吧?。。。

  

清洗按词根扩展后的词库并聚类分析长尾关键词前后缀 3

 

  如今在互联网上面到处可以见到很多企业的网站,这些网站对于企业的推广和营销起着至关重要的作用,因此在当今互联网时代,网站制作也就关系着企业的未来。不论是大型的公司,还是刚成立的公司,对于网站建设都是十分重视的,想要将自己企业的产品给很好的推销出去,那么就要进行网络的推广,这都是属于网站建设的一部分。那么到底网站制作对于企业的作用有多大呢?

  其实对于网站制作,是有着很大的潜力存在的。网站制作不仅仅只是一个网页,更是企业的外在形象,也是一个企业的产品服务。首先来说,网站也就是一个企业的形象展示。互联网有着独特的优势,作为一个媒体的平台,它可以全天候的进行宣传,这是其他的媒体不可比拟的。如果一个企业想要通过网络展示出自己的形象,让更多的用户了解自己,那么就要在互联网上面建站,使企业的知名度得到很大的提升。在如今的互联网时代,如果企业想要把产品推向全国各个地域,那么最好的方法就是好好的利用互联网,进行信息的传递和分享。一旦时机成熟的时候,这些信息也就会转化成为最有效的潜在的交易,这也就是为什么很多的企业都会时不时的进行一些产品展览、交易。除此之外,互联网这个平台是最廉价的宣传平台,而且沟通起来十分的方便,内容量更大,信息传递的更加高效。

  到底网站制作对于企业的作用有多大,其实除了关乎着企业的形象之外,对于企业的自动化管理,像常见的信息流、资金流和物流,都有着十分高效科学的管理。通过网站,可以对一般的客户、订货、员工和采购等等进行系统化的管理,大大的减轻了劳动力,又提高了效率。现在很多用户购买自己需要的产品的时候,网络是第一选择,因为可以足不出户就能买到自己喜爱的产品。那么用户就要在互联网上面搜寻产品,看企业的网站。如果一个企业网站制作的合理,能够吸引人,那么这就对最后的交易产生了推波助澜的作用。

  其实我们可以看到,网站是企业一个很好的推广方式,虽然说它不可能十全十美,但是在如今信息化高速发展的时代,一个好的网站建设对于企业的生存和发展是起着至关重要的作用的。只有做好了网站建设,企业才能够不断的壮大,走向辉煌!

标题:清洗按_词根扩展后的词库并_聚类分析_长尾关键词前后缀
地址:http://www.seozoe.com/news/zx/62.html _北京SEO
声明:非特殊说明,本文为本站原创(翻译)文章,转载请注明:本文转自:北京SEO启点网络_启点


请您留下您的小脚印:

服务支持

我们珍惜您每一次在线询盘,有问必答,用专业的态度,贴心的服务。

让您真正感受到我们的与众不同!

合作流程

合作流程

网站制作流程从提出需求到网站制作报价,再到网页制作,每一步都是规范和专业的。

常见问题

常见问题

提供什么是网站定制?你们的报价如何?等网站建设常见问题。

常见问题

售后保障

网站制作不难,难的是一如既往的热情服务及技术支持。我们知道:做网站就是做服务,就是做售后。