北京SEO百度排名_网络推广_网站建设_专业网站优化【启点网络】

网站制作SEO优化推广10年,客户1200+

Screaming Frog SEO Spider直观地了解您的网站结构和外部链接权重的影响

文章分类: SEO方案资讯 文章来源: 北京启点网络 文章作者: 北京SEO顾问 时间: 2018-04-21 18:48:32浏览热度:


[导读]:

寻找不易通过电子表格和原始数据收集的洞察力?如何使用Gephi(一种数据可视化工具)为入站链接强度创建站点结构的可视化表示。

北京SEO

  他们说一张图片胜过千言万语 - 哇,他们是对的!

  今天,我要说明强大的方法来可视化您的网站结构,特别是它涉及获取传入链接的网页; 不过,我们还会使用分析指标或其他第三方数据来讨论此技术的其他应用。

  有很多原因需要你去做,其中包括为数据提供一个可视上下文。正如我们将在下面看到的那样,数据的可视化表示可以帮助快速识别网站结构中的模式,这些模式在查看电子表格或原始数据时可能不明显。您还可以使用这些视觉材料向客户和其他利益相关方解释网站结构中发生了什么。

  为了构建我们的网站结构与传入链接相关的视觉表示,我们将:

  运行Screaming Frog来收集内部页面数据和链接结构。

  将每个页面的反向链接数添加到页面的度量标准中。

  使用Gephi创建这些数据的可视化表示。

  对于那些不熟悉Gephi的人来说,这是一个开源的数据可视化工具 - 基本上,它将数据转化为交互式图片。

  获取核心数据

  无论您是想将您的网站结构相对于您的网站流量或其他指标进行可视化,该流程基本上都是相同的。所以,让我们开始...

  收集你的内部链接结构

  第一步是下载Screaming Frog,如果你还没有安装。对于500个URL以下的网站,免费版本就足够了; 那些网站较大的用户可能想要购买高级版本,尽管他们仍然可以使用免费版本来获得关于他们的网站结构在做什么的一些粗略的想法。

  现在,使用Screaming Frog抓取您想要映射的网站。您不需要收集图像,CSS,JavaScript等,因此蜘蛛配置应该看起来像下面的屏幕截图。(但是,您需要根据自己的需求和网站结构自行决定是否要抓取子域等。)

尖叫的青蛙

  输入您想要检查的域名并单击“开始”。一旦爬网完成,是时候导出数据并清理一下了。要做到这一点,只需转到:

  批量导出>响应代码>成功(2xx)链接

  下载后,打开文件并执行以下操作:

  删除包含“所有链接”的第一行。

  删除第一列“类型”。

  重命名“目标”列“目标”。

  删除“源”和“目标”以外的所有其他列。

  保存编辑后的文件。你可以随心所欲地命名它,但我将在整篇文章中将它指向working.csv。

清理Excel中的Screaming Frog数据

  我强烈建议您扫描源列和目标列以查找异常情况。例如,我为下面的屏幕截图抓取的网站包含大量页面上的锚链接。我在Target列中快速搜索了哈希标签,并删除了这些哈希标签,这样他们就不会歪曲我的链接流信息。

  有了这个,我们剩下一个电子表格,应该看起来像这样:

  在他的文章中,斯托克斯使用Gephi来可视化网站页面之间的关系,并查看哪些页面是最强的(基于网站的内部链接图)。

Gephi模块化

  你可以阅读他的文章中的方向和描述,但总之,我们看到的是不同的“聚类”页面(基于哪些页面最常连接 - 不完美但不坏),按颜色分组,内部链接(链接最多的页面显示较大)。

  当然,这个信息很方便。但是如果我们想要更多呢?如果我们想根据他们的网站部分真实地着色页面,以及如果我们希望按入站外部链接的数量来确定页面的大小,该怎么办?

  要实现此目的,您首先需要从Google Search Console下载您的顶级链接页面。如果您之前没有这样做,只需登录到Search Console帐户并执行以下操作:

  点击左侧导航栏中的“搜索流量”。

  在打开的菜单中点击“链接到您的网站”。

  点击“最常关联的内容”栏下的“更多>>”。

  和“下载此表格”。

  下载数据时唯一的问题是出于我们的目的,我们需要域名形式的URL,而表格只显示路径。为了解决这个问题,你可以简单地:

  打开电子表格。

  在URL路径之前插入一个新的列A.

  将您的域名https://www.yourdomain.com/放入单元格A3(假设B2包含您的域名,这是唯一可以完全显示的URL),以便您不会创建https://www.yourdomain.com/https ://www.yourdomain.com/。

  用您最近添加的域双击单元格的右下角,将域复制到电子表格的底部。

  从列A和B(域和路径)中选择数据并将其复制到记事本。

  用“/”查找并替换“/ /”(不包括引号)。

  在记事本中选择全部。

  将其过去到B列并删除A列。

  现在您拥有相同的列表,但具有完整的网址。

  将数据导入Gephi

  在这里,我们将上传我们之前创建的源/目标CSV文件,并命名为working.csv。这将创建Gephi创建图形所需的边和节点。(为了我们的目的,节点是一个页面,一个 边 代表页面之间的链接。)要导入电子表格,只需打开Gephi并进入:文件>导入电子表格。

  将打开一个新窗口,您将选择您的working.csv文件并选择“Edges table”(因为我们正在导入页面之间的连接)。它看起来像:

将边缘导入Gephi

  在下一个屏幕中,您将看到几个选项(在此示例中非常有限)。只需确保选中“创建缺失节点”框,然后单击下一步。

将边缘导入Gephi

  假设它打开到“概览”选项卡(它应该在首次使用时),您将看到如下所示的内容:

Gephi进口

  有点混乱,我们不打算把它清理干净。首先,我们将前往数据实验室并导出节点(请参阅:页面)。

Gephi数据实验室

  一旦进入数据实验室,请确保您通过单击左上角附近的节点按钮来查看节点。一旦出现,只需导出表格,以便您拥有所有节点的csv。

  当你打开csv时,它应该有以下列:

  ID

  标签

  Timeset

  您将添加第四列,并以您要插入的任何度量标准命名。这里,我将根据Search Console中的报告提取引荐域,因此我将标记第四列(D)“引用域。 “第五个将是”modularity_class“。

  您需要暂时将第二张表添加到电子表格中,并将其命名为“搜索控制台”。

  在单元格D2中(右侧D列标题下),输入以下公式:

  = IFERROR(INDEX('search console'!$ C $ 2:$ C $ 136,MATCH(A2,'search console'!$ A $ 2:$ A $ 136,0),1),“0”)

  在我的示例中,我的Search Console数据中有136行。你可能会有所不同,在这种情况下,上面公式中的136应该更改为列表中的行数。此外,如果您想列出链接数量而不是引用域名,则应将Cs更改为Bs,以便搜索跨越列B而不是C.

  完成后,您需要复制引用域列并使用“粘贴值”命令,该命令将从包含公式的单元切换为包含引用域数量的值作为整数。

  该过程如下所示:

将引荐域添加到节点

  现在,最后,你想添加一个标题为“modularity_class”的第五列。尽管Gephi 内置了模块化功能,它将根据内部链接结构将类似的页面聚合在一起,但我更喜欢更明确定义页面类别的手动方法。

  在我的示例中,我将基于页面类别将以下值之一分配给modularity_class列中的每个页面:

  0 - 其他/其他

  1 - 博客文章

  2 - 资源页面

  3 - 公司信息

  4 - 服务

  5 - 主页

  当然,如何分类您的类别将取决于您的网站(例如,您可能会按产品类型划分电子商务网站,或按地点划分您的旅行网站)。

  一旦将这个文件保存为名为nodes.csv的csv,您只需使用导出的数据实验室屏幕上的导入电子表格按钮将该电子表格导入当前的Gelphi项目。

将节点导入Gephi

  在下一个屏幕上,您将确保“引用域”和“modularity_class”设置为“浮动”,并确保“强制节点创建为新的”框未选中。然后点击“下一步”。导入后,您将看到如下页面:

DATA实验室进口齐全

  然后,您会再次点击Gephi顶部的概述。在这一点上,你会注意到并没有改变很多......但它即将到来。

  你可以用Gephi做很多事情。我建议运行PageRank模拟,您可以在右侧的设置中找到它。默认设置工作正常。现在是时候使用所有这些数据了。

  首先,我们将根据页面类型对颜色节点进行着色(modularity_class)。在左上角,选择“节点”,然后选择“属性”。从下拉菜单中选择“模块级”,然后选择代表每种颜色。从我上面的示例中,我选择了以下颜色:

  杂项/其他 - 橙色

  博客文章 - 淡紫色

  资源页面 - 浅绿色

  公司信息 - 深绿色

  服务 - 蓝色

  主页 - 粉红色

  这会给你一些接近的东西:

Gephi中的颜色模块化

  现在,让我们使用这些引用域来调整节点的大小。这一次,我们需要选择尺寸属性“引用域”。为此,请选择尺寸图标; 然后在属性中选择“引用域”并设置最小和最大尺寸。我喜欢从10和50开始,但每个图都是独一无二的,所以请找到适合你的东西。

  如果您发现“推荐域名”不在列表中(有时会发生这种情况),这是一个奇怪的小故障,具有同样奇怪的解决方法 - 并且在Github上赞同rbsam 的说法:

  在按颜色出现/属性时,可以将该属性设置为窗口左下角的“分区到排序”。如果该属性设置为分区,则它不会出现在Size属性中。如果它被设置为排名,它将出现在尺寸属性上。

  这意味着什么...

添加引用域解决方法

  好吧,现在我们已经按照网站的各个部分对事物进行了颜色编码,并根据传入页面的链接级别进行了调整。它看起来有点混乱,但我们还没有完成!

  下一步是选择左下方的布局。它们看起来有点不同并且有不同的功能。我最喜欢的两个是Fruchterman Reingold(如下图所示)和Force Atlas 2.你也可以玩弄重力(也就是边缘将节点拉到一起的程度)。当前网站显示为:

北京SEO

  只要这些信息可以给你一个关于你的网站发生了什么的非常有趣的观点。重要的是要知道,当你右键点击任何节点时,你可以选择在数据实验室中选择它。想知道那个单独的页面是什么,为什么它只有一个孤独的链接?右键单击并在数据实验室中查看(这是一个站点地图,FYI)。你也可以做相反的事情。如果您没有看到单个页面出现,您可以在数据实验室中找到它,并右键单击它并在概览中选择它。

  这种可视化为我们提供了快速定位网站异常情况的能力,找出哪些网页以特定方式分组,并找到改善PageRank流量和内部链接权重的机会。

  你不是这个有限的

  在这篇文章中,我们只看了一个应用程序,但还有很多其他应用程序 - 我们只需要使用我们的想象力。

  为什么不把你的Moz Page Authority或Google Analytics传入的有机流量,并用它作为尺寸指标来查看你网站的哪些部分获得最多流量,并帮助发现内部链接结构中的问题?

  为什么不把Patrick Stox在他的文章中使用的页面重量指标 与他们的传入流量合并为一个页面大小?通过正确的调整,您可以了解内部页面强度计算和流量之间的关联。

  如果有一个可以分配给页面或链接的度量标准,则可以在此处使用它。想想看,它是如何有意义地显示,并按照上面的过程,并做到这一点。

  这只是冰山一角。我使用这个工具最强大的功能之一就是帮助预测一个网站在内部链接结构发生重大变化后会发生什么。但这是下个月的文章的主题!

标题:Screaming Frog SEO Spider直观地了解您的网站结构和外部链接权重的影响
地址:http://www.seozoe.com/news/js/205.html _北京SEO
声明:非特殊说明,本文为本站原创(翻译)文章,转载请注明:本文转自:北京SEO启点网络_启点


请您留下您的小脚印:

服务支持

我们珍惜您每一次在线询盘,有问必答,用专业的态度,贴心的服务。

让您真正感受到我们的与众不同!

合作流程

合作流程

网站制作流程从提出需求到网站制作报价,再到网页制作,每一步都是规范和专业的。

常见问题

常见问题

提供什么是网站定制?你们的报价如何?等网站建设常见问题。

常见问题

售后保障

网站制作不难,难的是一如既往的热情服务及技术支持。我们知道:做网站就是做服务,就是做售后。