文档章节

设置好wordpress的“更新服务”功能,提高收录速度

topdogs
 topdogs
发布于 2012/01/29 09:36
字数 1088
阅读 1643
收藏 1

       搜索引擎会按照某个规律定期的来抓取网站的内容,其抓取你网站的频率一般和网站的更新速度有关,如果网站内容更新频繁,那么网络蜘蛛也会频繁的访问网站。

        以自己的博客为例,有段时间,博客的更新频率在3天左右发表一篇博文的那段时间里,查看apache的日志,发现google搜索引擎每天大概会访问5次左右;同时我在google Reader(谷歌阅读器)里订阅自己的博客,每次文章发布后,大概在若干个小时内就会出现在阅读器里面。

        后来有段时间,文章更新频率变少了,很久才更新一篇。就会发现,google爬虫的访问频率变低了,同时博文在阅读器里出现的时间变久了,甚至发布两天后都无法在阅读器中看到更新。

        那么如何让内容及时的被搜索引擎收录呢?其中一个办法就是不停的更新你的网站内容,显然这对一般个人博主来说有难度。另一个方法就是每当我们发表了文章后自己去通知搜索引擎。

Update Services(更新服务)

         wordpress中的更新服务是一种让别人知道你的博客有更新的工具。在你每次创建或者更新博客时通过XML-RPC ping会让WP自动的通知给一些流行的更新服务商(如Technorati,Sphere,rssfeeds这些内容聚合网站)。相应的更新服务商会处理ping并更新他们的索引。这样别人再浏览更新服务商网站时便能看到你的博客更新。

        简单的说,就是每当你发布文章后,wordpress就会自动的向预先设定好的地址发送消息,而这些地址有些就是搜索引擎提供的服务,通过这样的方法来主动要求搜索引擎抓取更新内容。

在wordpress的控制台,“设置->撰写”菜单下。有一个“更新服务”的选项,下面有一个多行文本输入框,文本框的上面有一行注解:

当您发表一篇新文章时,WordPress 将会向下面的站点发出通告。更多关于“更新服务”的信息,请查看 Codex 文档。一行一个通告服务的 URL

在文本框里输入以下内容:

http://ping.baidu.com/ping/RPC2
http://blog.youdao.com/ping/RPC2
http://blogsearch.google.com/ping/RPC2

这3行分别是百度、有道、谷歌的ping服务。当然ping服务远不止这三个。

通过这样设置后,在文章发布后第一时间,wordpress会通知他们。

设置完后,我们可以来看看效果。以apache日志为证据。

 

xx.xx.xx.xx - - [28/Jan/2012:13:48:17 +0000] "GET /blog/wp-includes/wlwmanifest.xml HTTP/1.1" 304 - "-" "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; Windows Live Writer 1.0)"
xx.xx.xx.xx - - [28/Jan/2012:13:56:26 +0000] "POST /blog/xmlrpc.php HTTP/1.1" 200 716 "-" "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; Windows Live Writer 1.0)"
66.249.67.21 - - [28/Jan/2012:14:02:51 +0000] "GET /blog/feed HTTP/1.1" 200 17120 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.67.21 - - [28/Jan/2012:14:02:52 +0000] "GET /blog/ HTTP/1.1" 200 11117 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.67.21 - - [28/Jan/2012:14:03:10 +0000] "GET /blog/2012/01/28/29213 HTTP/1.1" 200 6519 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"


xx.xx.xx.xx - - [27/Jan/2012:15:16:09 +0000] "POST /blog/xmlrpc.php HTTP/1.1" 200 443 "-" "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; Windows Live Writer 1.0)"
220.181.108.117 - - [27/Jan/2012:15:57:38 +0000] "GET /robots.txt HTTP/1.1" 404 239 "-" "Baiduspider+(+http://www.baidu.com/search/spider.htm)"
209.85.238.100 - - [27/Jan/2012:16:03:48 +0000] "GET /blog/feed HTTP/1.1" 200 14516 "-" "Feedfetcher-Google; (+http://www.google.com/feedfetcher.html; 2 subscribers; feed-id=11704572731530923401)"
66.249.67.21 - - [27/Jan/2012:16:14:53 +0000] "GET /robots.txt HTTP/1.1" 404 239 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.67.21 - - [27/Jan/2012:16:35:43 +0000] "GET /blog/2012/01/08/29152 HTTP/1.1" 200 5474 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"

 

可以发现,每次文章发布后,不久,谷歌和百度的网络爬虫便来抓取了该文章,其中一篇只发布了6分钟就被抓取。


华丽丽的分割线


就在本文发布后,三分钟后就发现有google爬虫来了,4分钟的时候发现百度的爬虫也来了。打开google reader,发现该文已经出现在了,收录时间和发布时间刚好相差3分钟。

google-reader

© 著作权归作者所有

共有 人打赏支持
topdogs

topdogs

粉丝 41
博文 39
码字总数 12877
作品 2
汕头
高级程序员
私信 提问
400电话办理选号系统

软件名称:400电话办理选号系统 版本:1.0 开发环境:PHP+MySQL5.x+Memcache 1.2.1 运行环境:Windows Server 2003/2008、Linux/CentOS/Solaris/Ubuntu WEB环境 :IIS 6/7、Apache、Nginx 声...

曾志伟
2012/05/09
2.4K
1
WordPress 4.9 RC3 发布,正式版往后推迟

WordPress 4.9 正式版原计划于2017 年 11 月 14 日晚上 11点(世界协调时)发布,也就是北京时间 11 月 15 日早上 7 点发布,但由于发现小工具内短代码等问题,开发团队决定将 4.9 正式版发布...

王练
2017/11/15
306
1
WordPress 5.1 首个 RC 版发布,正式版下周推出

WordPress 5.1 首个 RC 版已发布,这是一个重要的里程碑,“Release Candidate(发布候选版)” 意味着新版本已准备好发布,但 WordPress 拥有数百万用户和数千个插件和主题,所以正式发布前...

局长
02/13
0
0
XXL-CONF v1.5.0 发布,分布式配置中心

v1.5.0 新特性 1、配置中心Agent服务增强:针对非Java应用提供Agent服务获取配置,提供同步、异步两种Http请求方式,原生支持 long-polling(Http) 的方式获取配置数据、并实时感知配置变更...

许雪里
2018/06/20
768
4
速度围观 | 如何用大数据拆散一对异地恋情侣

在北京做程序员的小王和和在上海做产品经理的小李网恋了,一时间山盟海誓干柴烈火,可是有一道难题摆在这对情侣面前:小王不想去上海,说上海互联网的发展并没有北京成熟;小李不想去北京,觉...

勿忘初心321
2016/03/22
63
0

没有更多内容

加载失败,请刷新页面

加载更多

Android Studio Unable to resolve dependency for错误的排查

记录一次Android Studio Unable to resolve dependency for错误的排查 Android Studio 3.2.1 错误提示 Unable to resolve dependency for... 原因:在gradle中设置的代理并没有gradle 4.6的版......

Gemini-Lin
6分钟前
0
0
java常用设计模式

设计模式; 一个程序员对设计模式的理解: “不懂”为什么要把很简单的东西搞得那么复杂。后来随着软件开发经验的增加才开始明白我所看到的“复杂”恰恰就是设计模式的精髓所在,我所理解的“...

呵呵哒灬
40分钟前
3
0
Kafka入门

1、Kafka使用背景 在我们大量使用分布式数据库、分布式计算集群的时候,是否会遇到这样的一些问题: 我们想分析下用户行为(pageviews),以便我们设计出更好的广告位 我想对用户的搜索关键词...

watermelon11
昨天
0
0
Cannot list resources Permission denied: user=Administrator, access=READ_EXECUTE, inode="/tmp"

Cannot list resources Permission denied: user=ÁõÎĺÁ, access=READ_EXECUTE, inode="/tmp":root:supergroup:drwx-wx-wx windows系统 Spring boot 整合hadoop时报错。 java.lang.Ille......

lwenhao
昨天
2
0
【结构型】- 享元模式

享元模式 作用:利用共享技术有效地支持大量细粒度对象的复用 享元模式状态 内部状态:在享元对象内部不随外界环境改变而改变的共享部分,存储于享元对象内部 外部状态:随着环境的改变而改变...

ZeroneLove
昨天
3
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部