文档章节

如何让你的网站符合搜索抓取习惯

王尘宇
 王尘宇
发布于 2017/09/07 00:08
字数 854
阅读 2
收藏 0
前面给大家介绍了搜索抓取系统工作原理,根据该工作原理今天简要介绍一下如何建立网站是符合搜索引擎抓取系统习惯的。要有简单明了的网站结构、简洁美观的url规则和其他一些注意事项。
  编者按:前面给大家介绍了搜索抓取系统工作原理,根据该工作原理今天简要介绍一下如何建立网站是符合搜索引擎抓取系统习惯的。 建立符合搜索抓取习惯的网站 1、简单明了的网站结构 Spider抓取相当于对web这个有向图进行遍历,那么一个简单明了结构层次分明的网站肯定是它所喜欢的,并尽量保证spider的可读性。 (1)树型结构最优的结构即“首页—频道—详情页”; (2)扁平首页到详情页的层次尽量少,既对抓取友好又可以很好的传递权重。 (3)网状保证每个页面都至少有一个文本链接指向,可以使网站尽可能全面的被抓取收录,内链建设同样对排序能够产生积极作用。 (4)导航为每个页面加一个导航方便用户知晓所在路径。 (5)子域与目录的选择相信有大批的站长对此有疑问,在我们看来,当内容较少并且内容相关度较高时建议以目录形式来实现,有利于权重的继承与收敛;当内容量较多并且与主站相关度略差时建议再以子域的形式来实现。 2、简洁美观的 url 规则 (1)唯一性网站中同一内容页只与唯一一个url相对应,过多形式的url将分散该页面的权重,并且目标url在系统中有被滤重的风险; (2)简洁性动态参数尽量少,保证url尽量短; (3)美观性使得用户及机器能够通过url即可判断出页面内容的主旨; 我们推荐如下形式的url:url尽量短且易读使得用户能够快速理解,例如使用拼音作为目录名称;同一内容在系统中只产生唯一的url与之对应,去掉无意义的参数;如果无法保证url的唯一性,尽量使不同形式的url301到目标url;防止用户输错的备用域名301至主域名。 3、其他注意事项 (1)不要忽略倒霉的robots文件,默认情况下部分系统robots是封禁搜索引擎抓取的,当网站建立后及时查看并书写合适的robots文件,网站日常维护过程中也要注意定期检查; (2)建立网站sitemap文件、死链文件,并及时通过百度站长平台进行提交; (3)部分电商网站存在地域跳转问题,有货无货建议统一做成一个页面,在页面中标识有无货即可,不要此地区无货即返回一个无效页面,由于spider出口的有限性将造成正常页面无法收录。 (4)合理利用站长平台提供的robots、sitemap、索引量、抓取压力、死链提交、网站改版等工具。

© 著作权归作者所有

共有 人打赏支持
王尘宇
粉丝 1
博文 450
码字总数 469557
作品 0
西安
网站要怎样为越来越流行的语音交互而优化

网站要怎样为越来越流行的语音交互而优化 优设-UISDC2017-12-281 阅读 网页设计教程 仔细审视最近几年的趋势变化,你会发现Alexa、Siri 这样的语音助理服务已经润物细无声地影响着我们日常的...

优设-UISDC
2017/12/28
0
0
8招教你将内容营销与SEO完美合一

三四年前,就有不少分析师预见SEO会被内容营销这一新兴营销方式取代。的确,许多搜索机构已经重塑品牌,增加了自身拥有的专业知识内容权重。但这并不是说内容营销与SEO是背道而驰的。事实上,...

Cashcow
2016/11/24
0
0
在网站建设过程中主要在哪几个方面为后期的网站优打好根基?

虽然说网站的搭建和网站优化是前后关系,但是我们企业要在网站搭建的过程中,就要把后期网站优化的工作全部在一起规划。 有些企业网站建设上线,可是搜索引擎几个月都没有收录,而就算收录了...

desingse
2017/12/11
0
0
你的网站受到搜索引擎青睐了吗?

如果你是一位从事SEO工作的人员,相信很多人都会去深思一个问题,什么样的网站会受到搜索引擎的青睐?也是很多网站建设推广者绞尽脑汁的一个问题。现在笔者就为大家分析一下,到底什么样的网站...

laishaohe
03/01
0
0
【2015更新】修改Host文件,让你的Google跑起来 2015 Google hosts

近期,相信大家都发现了,国内Google访问狠不给力,基本上打不开,谷歌在相关的服务器也被搬到了美国,这不禁让人感慨,谷歌难道要全面退出中国的节奏? 作为一名“IT界”的淫才,百度往往会让...

Nori
2015/03/06
0
0

没有更多内容

加载失败,请刷新页面

加载更多

同样是工作3年程序员,为什么别人每月25K你却只有15K?

你有没有静下心来思考过:同样是做了x年Java开发,为什么你的技术比别人差很多?为什么别人每月26K你却只有15K? 其实技术水平的高低和个人智商关系不大(毕竟能做Java编程开发大家都不会差)...

Java填坑之路
5分钟前
0
0
跨域问题:解决跨域的三种方案

当前端页面与后台运行在不同的服务器时,就必定会出现跨域这一问题,本篇简单介绍解决跨域的三种方案,部分代码截图如下,仅供参考: 方式一:使用ajax的jsonp 前端代码 服务器代码 使用该方...

rechardchensir
5分钟前
0
0
linux学习-1012

8.6 管道符和作业控制 8.7/8.8 shell变量 8.9 环境变量配置文件 扩展 bashrc和bash_profile的区别 http://ask.apelearn.com/question/7719 简易审计系统: http://www.68idc.cn/help/server/...

wxy丶
6分钟前
0
0
springboot dubbo 在程序初始化完成前 使用回声测试对服务依赖检测

<dubbo:consumer timeout="10000" check="false" /><dubbo:service delay="-1" /> @Component@Order(2)public class PrkServiceInit implements ApplicationListener {private Logge......

林伟琨
8分钟前
0
0
“网红架构师”解决你的Ceph 运维难题

Q1. 环境预准备 绝大多数MON创建的失败都是由于防火墙没有关导致的,亦或是SeLinux没关闭导致的。一定一定一定要关闭每个每个每个节点的防火墙(执行一次就好,没安装报错就忽视): CentOS s...

编程SHA
11分钟前
0
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部