文档章节

SEO数据分析:如何改善网站收录

王尘宇
 王尘宇
发布于 2017/09/07 00:08
字数 1899
阅读 6
收藏 0
注:搜索引擎做为网站流量的重要来源,网站的收录量自然是大部分网站运营人员关心的问题。   先明确一些基本点,一个网页被收录与否,有两个因素
是否被爬虫爬过 页面质量是否过关
  上一篇文章已经提过了收录率这么一个指标,很多网站都懒得去做这个指标,“我看看site的数据不就行了!”,事实上没有这个指标,很多工作就无从下手。从数据中找出问题,利用数据指导解决方案,分析数据验证工作成果。 最近看了《深入浅出数据分析》这个本,觉得不错,把数据分析的方法讲得很生动,建议有兴趣的从事数据分析的同学可以买本看看。 任何数据分析由,目标->分析->评估->决策,四个环节组成。 目标:我们想看一下网站的收录情况如何,在SEO方面是否还有提高的机会。 分析:收录情况什么算好什么算坏,是不是用一些指标来衡量?网站的收录情况是不是过于笼统,是不是应该细分下各个页面的收录情况? 评估:于是我们需要下面一些数据 > 网站的页面层级关系 SEO的数据分析:如何改善网站收录 > 各个层级页面带来的SEO流量 > 各个层级页面的收录情况如何 SEO的数据分析:如何改善网站收录 SEO流量的占比可以从Google Analytics中过滤出来。 页面数量可以从数据库获得,或者通过火车头or自制小脚本抓取统计。 收录率可以将获取的页面通过工具进行搜索,火车头也可以。   问题立马凸显!     1+2级目录页带来了大量的流量,收录率不是很好,优化收录的流量提升突破口在此! SEO的数据分析:如何改善网站收录   产品页面数量很多,收录也不是很理想,但是带来的流量有限,除了收录问题,还有页面内容的问题,本文中先不管它了。 决策:我们的结论是立刻展开行动对目录页面进行收录的优化。 看到这边,似乎刚开始的目标:“通过优化收录提升流量” 演变成了新的目标:“如何提高目录页面的收录量” 这边能不能再次通过数据分析的方法进行SEO呢? 答案是肯定的! 我们再来重新走一遍 目标->分析->评估->决策 的过程 目标:提高目录页面的收录量 分析:通过本文开始的有关收录的两个因素,我们需要检查一下,网页是否被爬虫爬行过,网页的质量是不是过关。 1. 关于爬虫的情况,我们需要分析日志,才能确定。于是我们从日志中拆分一系列数据看看页面是否真的被爬行过。 2. 由于页面质量似乎是一个很难衡量的值,于是我们可以用相同模板下的: 已被爬行的页面数量/已被爬行并且被收录页面数量 来评估该模板页面质量对收录的影响大小。如果被爬的页面都被收录了,那至少说明这套页面的内容搜索引擎还算认可。(实际情况远比这个复杂,而且收录后也有可能因为质量问题被删除,但总比什么参照都没有要好,对吧!) 评估:(敏感信息用编号代替,均为真实数据) 先看一下爬虫日志的情况,通过Shell脚本,我们可以分析出。 目录总计被爬行的次数为13000次左右 不重复的目录爬行次数为5500次左右 频道A下的目录几乎被100%抓取过至少1次,频道B的目录抓取也不错,有70%被至少抓过一次。 其余频道下的目录被抓取的覆盖率不到30% 小议SEO的数据分析II – 如何改善网站收录 不要觉得这个结果很神奇,其实很多网站都会面对这样的糟糕问题,只要你把数据不断的细分,细分,再细分,总会观察出一些端倪的。 关于日志分析,不要迷信任何的日志分析软件,那都是给懒人用的,自制脚本+Excel才是王道,可以拆分显示出任何你想要的数据,当然,甚至可以连Excel都不要。 然后,我们统计了一下被抓得最频繁的频道A和频道B,目录页的收录率 小议SEO的数据分析:如何改善网站收录 频道A和B是很让人放心的,说明页面质量没问题,但是余下的收录情况就让人比较担心了。 决策:通过上面的数据评估,我们已经得到了如下结论。 页面质量并不是影响收录的原因。 频道A,B的抓取量异常的高,通过调查了解,原来是首页上的目录页,显示的全是频道A下的目录页,首页又拥有全站最高的权重。频道B拥有比其他频道强大的外链资源,权重也非常高。 除了A, B频道,其他频道的抓取情况不容乐观,抓取入口太少,太深,进而影响了收录情况。 很明显,现在频道A从站内的角度来说太强大了,必须进行一些“劫富济贫”的运动来降低频道A的抓取量,转移到其他频道中去。同时,需要给爬虫提供更多的入口抓取频道页。 现在问题变得清晰起来,我们开始把工作分成两部分:1.提供更多的入口 2.将资源平分给各频道而不是集中在少数几个频道上。 提供入口工作: 1.把目录页的URL制作成sitemap。提交给搜索引擎,并且将其设置为比较高的抓取权重。 2.完善面包屑导航,将面包屑导航划分得更加细致,以提供更多入口 3.在其他产品中推荐目录页 资源平分工作:(一些概念:任意页面都有可能成为爬虫入口,百度爬虫抓取深度有限,页面相对入口越浅,被抓取的概率越高。) 1.原先首页指向的都是频道A的目录页+产品页,将其全部nofollow,确保从首页进入的爬虫,全部抓取到频道页,通过频道页再进入目录页(其实这个不算太重要) 2.原先频道页指向自身的产品页,将其全部nofollow(确保从频道页入口的爬虫,最大程度的抓取目录页) 3.从目录页返回到首页的链接,将其全部nofollow。 4.减少一些页面上无关链接。(什么情况下这么做都是非常有效的。) 现在可以开始动手了。。 成果 这么做到底有什么效果呢,我们来看看修改后1个月后的数据。 小议SEO的数据分析 目录页的收录率提高了100%! 产品页的收录率也有一定程度的提高,这是归功于目录页对于产品的良好展现。 目录页的SEO表现: SEO流量占比上升了15% 增长10%的到访关键词数量(新页面的收录) SEO流量增长了50%以上。(包含一些季节因素)

© 著作权归作者所有

共有 人打赏支持
王尘宇
粉丝 1
博文 450
码字总数 469557
作品 0
西安
结合案例教你如何做好SEO搜索引擎优化

这是一个很很普通老生常谈的标题,没有任何的吸引力,但是真正能做好的草根站长估计少之又少,我问我一个做了多年草根站长的朋友,我说如何做好SEO搜索引擎优化,他给我的答复是很难,范围太...

卢松松博客
07/03
0
0
【案例】爆老师拆解同步网络seo分析思路

小伙伴们好,这个提案是2年前做的,但诊断内容和策略并不过时。趁这次机会和大家聊聊【SEO项目管理】理念下的SEO吧。 首先,这份提案为简版,是我参加一个演讲会时帮赞助商快速的诊断报告,平...

卢松松
2015/10/20
59
0
SEO中11个最常见的问题解答

初学者最经常会提到这些问题: 1、帮我看看我的站点 XXX.XXX.com SEO 得怎么样? 简单的 SEO 评估,我们主要从这几个方面: 网站导航和链接是否采用 Html 方式实现。 是否实现 URL 静态化。 ...

开源中国段子手
2015/11/23
36
0
权重6老站SEO诊断,我的网站突破口在哪里?

SEO在中国互联网起步不足十年,当下SEO市场混象横生、门派体系混乱,一个短期的SEO培训收费一万八,一个不足10页内容的网站SEO诊断收费破两万,这些都反映出SEO在国内曾经如何疯狂扩张。 如今...

卢松松
2015/11/09
0
0
友链依旧重要:移动互联网背后的SEO优化技巧

移动互联网发展这么快,将来还需要网站吗成为很多站长的疑问,那做SEO优化的站长不是将走向失业,实际上,在2010年中国移动互联网开始至今,移动化SEO不仅没有让这个市场失去活力,反而在各种...

卢松松
2015/08/30
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

异步化,高并发大杀器

今天来聊聊如何让项目异步化的一些事。 在进入正文之前,顺便给大家推荐一个Java架构方面的交流学习群:698581634,里面会分享一些资深架构师录制的视频录像:有Spring,MyBatis,Netty源码分...

Java大蜗牛
16分钟前
0
0
织梦dedecms安全设置

网站本身做好防范: 1、修改默认后台名。 打开网站根目录,找到[dede],这个文件夹就是后台的路径,可以随意修改,比如修改为[adminbuy],此时后台登陆的路径为:http://www.*****.com/admi...

雨季2014
16分钟前
0
0
完美Python入门基础知识点总结,看完你的Python就完全入门了!

Python标识符 在 Python 里,标识符有字母、数字、下划线组成。 在 Python 中,所有标识符可以包括英文、数字以及下划线(_),但不能以数字开头。 Python 中的标识符是区分大小写的。 以下划线...

糖宝lsh
22分钟前
0
0
Java关于前后台传输中文乱码以及Excel下载乱码解决

针对乱码,一般情况是前后台以及中间件编码格式不同导致.故需要保证编码格式相同即可. 1.前台页面格式指定,这里用的是jsp,故需要将pageEncoding指定为"UTF-8" 2.指定服务器编码格式,比如用的t...

勤奋的蚂蚁
25分钟前
0
0
Flutter组件 - Flexible

Flexible是一个控制Row、Column、Flex等子组件如何布局的组件。 Flexible组件可以使Row、Column、Flex等子组件在主轴方向有填充可用空间的能力(例如,Row在水平方向,Column在垂直方向),但是...

一箭落旄头
28分钟前
1
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部