文档章节

计算ITEYE博文在百度的收录与排名情况

杨尚川
 杨尚川
发布于 2015/04/04 04:00
字数 1889
阅读 176
收藏 0

rank是一个seo工具,用于分析网站的搜索引擎收录排名。


计算ITEYE博文在百度的收录与排名情况的代码来自rank项目:https://github.com/ysc/rank/blob/master/src/main/java/org/seo/rank/impl/BaiduRanker.java


本文我们分析ITEYE博客:http://yangshangchuan.iteye.com 在搜索引擎百度中的收录与排名情况,我们以结果1 APDPlat的系统启动和关闭流程剖析(-1) 为例子来说明,表示的意思是用关键词:APDPlat的系统启动和关闭流程剖析 在百度中进行搜索,看搜索结果中有没有用这个关键词做标题的ITEYE博文,如果有,还要知道位于搜索结果中的第几条,括号里面的数字就是排名,最好的排名是1,数字越大排名越低,越位于搜索结果页面下方或后几页。


这里需要注意的是,我们只分析了搜索引擎返回结果的前15页,括号中的数字为0表示被搜索引擎收录但是不在15页之内,数字为-1表示未被搜索引擎收录。下面列出了博文在搜索引擎中的收录与排名情况:


  1. APDPlat的系统启动和关闭流程剖析(-1)

  2. 配置Cygwin支持无密码SSH登陆(-1)

  3. 1208个合成词(-1)

  4. 30个JDK类库源代码中最频繁出现的词的深度分析(-1)

  5. 分析996个词根在各大考纲词汇中的作用(五)总结精选篇(-1)

  6. 根据76大细分词性对单词进行归组(二)(-1)

  7. The Future of Compass & ElasticSearch(-1)

  8. Apache Nutch v1.8发布,Java实现的网络爬虫(-1)

  9. APDPlat v2.5正式发布,开源的Java应用级产品开发平台(-1)

  10. 给LUKE增加mmseg4j分词器(-1)

  11. APDPlat中领域模型的自描述机制与事件通知机制(-1)

  12. 根据76大细分词性对单词进行归组(一)(-1)

  13. 大数据系列7:Storm – 流计算(-1)

  14. 分析在各大考纲词汇中同时拥有前缀后缀和词根的词(一)(-1)

  15. 自动更改IP地址反爬虫封锁,支持多线程(-1)

  16. 动态索引结构和索引更新机制(-1)

  17. 词组习语3054组(-1)

  18. APDPlat的日志国际化实现方式(-1)

  19. 二百多部软件著作中最重要的9224个英语单词(-1)

  20. 使用CountDownLatch来模拟马拉松比赛(-1)

  21. [置顶] Nutch视频(-1)

  22. Hadoop分布式文件系统HDFS和OpenStack对象存储系统Swift有何不同?(-1)

  23. APDPlat旗下10大开源项目,欢迎大家一起来参与(-1)

  24. 大数据系列3:用Python编写MapReduce(-1)

  25. 2000个软件开发领域的高频特殊词及精选例句(一)(-1)

  26. JDK源代码中最重要的4646个英语单词(-1)

  27. JDK源代码以及200多部软件著作中出现的以连字符构造的1011个合成词(-1)

  28. JAVA调用CSDN接口发博文(-1)

  29. 分析在各大考纲词汇中既没有词根也没有前缀和后缀的独立单词(-1)

  30. 分析113个前缀在各大考纲词汇中的作用(二)总结精选篇(-1)

  31. 运行nutch提示后退出:Generator: 0 records selected for fetching, exiting ...(-1)

  32. 分析151个后缀在各大考纲词汇中的作用(三)总结精选篇(-1)

  33. 大数据系列4:Hive – 基于HADOOP的数据仓库(-1)

  34. Java应用系统中自动实时检测资源文件内容变化(-1)

  35. 中文分词算法 之 词典机制性能优化与测试(-1)

  36. 中文分词效果对比(-1)

  37. NUTCH公开课:从搜索引擎到网络爬虫(-1)

  38. 基于Nutch+Hadoop+Hbase+ElasticSearch的网络爬虫及搜索引擎(-1)

  39. Amazon Dynamo的NWR模型(-1)

  40. 采集电子报纸(-1)

  41. 利用1189个精选句子彻底掌握2190个单词(-1)

  42. 搜索引擎的分片(shard)和副本(replica)机制(-1)

  43. 大数据系列12:Hadoop2 – 全新的Hadoop(-1)

  44. Java开源项目cws_evaluation:中文分词器分词效果评估(-1)

  45. QuestionAnsweringSystem v1.1 发布,人机问答系统(-1)

  46. 使用JSoup+CSSPath采集和讯网人物信息(-1)

  47. APDPlat拓展搜索之集成ElasticSearch(-1)

  48. 软件业的奥斯卡奖:JOLT奖 之 最好的书(-1)

  49. Nutch的发展历程(-1)

  50. Java中的null引用,超乎你想象(-1)

  51. 大数据系列11:Gora – 大数据持久化(-1)

  52. Java8全新打造,英语学习supertool(-1)

  53. 分布式搜索算法(-1)

  54. APDPlat中的用户密码安全策略(-1)

  55. 软件熵:软件开发中推倒重来的过程就是软件熵不断增加的过程(-1)

  56. Nutch抓取需要登录的网站(-1)

  57. APDPlat拓展搜索之集成Solr(-1)

  58. APDPlat中业务日志和监控日志的设计与实现(-1)

  59. 对Nutch2.1抽象存储层的一些看法(-1)

  60. 技术框架太多,多的眼花缭乱,如何在众多选择中找到自己的方向?(-1)

  61. 192本软件著作用词分析(五)用词最复杂99级(0)

  62. 大数据系列8:Sqoop – HADOOP和RDBMS数据交换(0)

  63. Cygwin运行nutch报错:Failed to set permissions of path(0)

  64. nutch2.1+mysql报错及解决(0)

  65. 如何在你的应用中集成人机问答系统QuestionAnsweringSystem?(0)

  66. HBase on CAP(0)

  67. 如何解决BUG?(0)

  68. The Design of HDFS(0)

  69. APDPlat中备份文件异地容灾机制之FTP上传(0)

  70. APDPlat如何自动建库建表并初始化数据?(0)

  71. Java实现的基于模板的网页结构化信息精准抽取组件:HtmlExtractor(0)

  72. 大数据系列6:HBase – 基于Hadoop的分布式数据库(0)

  73. 大数据系列1:在win7上安装配置Hadoop伪分布式集群(0)

  74. 大数据系列9:Mahout – 机器学习(0)

  75. new一个Object对象占用多少内存?(0)

  76. 中文分词算法 之 基于词典的正向最大匹配算法(0)

  77. 大数据系列2:建立开发环境编写HDFS和Map Reduce程序(0)

  78. word分词器、ansj分词器、mmseg4j分词器、ik-analyzer分词器分词效果评估(0)

  79. 给JAVA源代码文件统一地添加licence信息头(0)

  80. 中文分词算法 之 基于词典的逆向最小匹配算法(0)

  81. 大数据系列10:Spark – 内存计算(0)

  82. 运行nutch报错:failed with: java.io.IOException: unzipBestEffort returned null(0)

  83. Ubuntu上安装HADOOP单机伪分布式集群(0)

  84. Windows上安装HADOOP单机伪分布式集群(0)

  85. Java中文分词组件 - word分词(0)

  86. 使用Java调用谷歌搜索(0)

  87. 使用Java调用百度搜索(0)

  88. 网络爬虫面临的挑战 之 链接构造(0)

  89. 大数据系列5:Pig – 大数据分析平台(0)

  90. 一个月的时间让你的词汇量翻一翻(1)

  91. APDPlat中的机器码生成机制(1)

  92. SOLR4.2+NUTCH1.6(1)

  93. SOLR3.6.2+NUTCH1.6(3)

  94. Ubuntu上安装HADOOP多机完全分布式集群(5)

  95. APDPlat中数据库备份恢复的设计与实现(5)

  96. 模拟浏览器的神器 - HtmlUnit(6)

  97. 英语单词前缀规则总结(6)

  98. 英语单词音近形似转化规律研究(31)

  99. 中文分词算法 之 基于词典的逆向最大匹配算法(35)

  100. 英语单词后缀规则总结(70)

  101. 配置Nutch模拟浏览器以绕过反爬虫限制(81)

  102. Hadoop发行版的比较与选择(124)

  103. 中文分词算法 之 基于词典的正向最小匹配算法(130)

  104. Nutch相关框架安装使用最佳指南(134)

© 著作权归作者所有

杨尚川

杨尚川

粉丝 1103
博文 220
码字总数 1624053
作品 12
东城
架构师
私信 提问
网站遭到恶意刷流量点击怎么办?

近日听到有网友反馈说自己用心做的站好不容易做到首页排名,却突然被别人恶意刷量,导致跳出率达到90%上,担心会被百度K掉。 在这里我们先来分析一下恶意刷流量有什么危害: 2.联系主机商,让...

aqquchina
2018/05/23
0
0
网站降权被K的原因全面解析【附解决方案】

一、网站降权表现形式 1.site:主网址,不在首位 这是最简单的的一个查看网站健康情况的方法,主域名不在首位说明网站很可能已经被降权了;若是不在首页那么你就要小心了,网站随时都有被k的可...

amao0712
2018/05/29
0
0
SEO实战干货:网页建库与未建库的标准规则!

很多SEO人稍微有点基础就都知道降权这个词语,但是在搜索引擎规范标准指南里面并未提到站点降权一说,严格来讲用建库这个说法更加准确。 首先我们不妨来回顾一下搜索结果排序的过程,从蜘蛛的...

卢松松博客
2018/01/02
0
0
SEO中11个最常见的问题解答

初学者最经常会提到这些问题: 1、帮我看看我的站点 XXX.XXX.com SEO 得怎么样? 简单的 SEO 评估,我们主要从这几个方面: 网站导航和链接是否采用 Html 方式实现。 是否实现 URL 静态化。 ...

开源中国段子手
2015/11/23
56
0
SEO优化:关于网站优化效果的判断方法

SEO网站优化如果做的好的话,就会对网站的建设和推广起到非常大的推动作用,但是这里有一个前提,那就是SEO网站优化的效果必须要好。 对于SEO优化的效果如何,必须有一个明确而合理的考核标准...

rongshang
2016/12/23
2
0

没有更多内容

加载失败,请刷新页面

加载更多

BootStrap

一、BootStrap 简洁、直观、强悍的前端开发框架,让web开发更加迅速、简单 中文镜像网站:http://www.bootcss.com 用于开发响应式布局、移动设备优先的WEB项目 1、使用boot 创建文件夹,在文...

wytao1995
12分钟前
4
0
小知识:讲述Linux命令别名与资源文件的区别

别名 别名是命令的快捷方式。为那些需要经常执行,但需要很长时间输入的长命令创建快捷方式很有用。语法是: alias ppp='ping www.baidu.com' 它们并不总是用来缩短长命令。重要的是,你将它...

老孟的Linux私房菜
57分钟前
4
0
《JAVA核心知识》学习笔记(6. Spring 原理)-5

它是一个全面的、企业应用开发一站式的解决方案,贯穿表现层、业务层、持久层。但是 Spring 仍然可以和其他的框架无缝整合。 6.1.1. Spring 特点 6.1.1.1. 轻量级 6.1.1.2. 控制反转 6.1.1....

Shingfi
58分钟前
5
0
Excel导入数据库数据+Excel导入网页数据【实时追踪】

1.Excel导入数据库数据:数据选项卡------>导入数据 2.Excel导入网页数据【实时追踪】:

东方墨天
今天
5
1
正则表达式如何匹配一个单词存在一次或零次并且不占捕获组位置

正则表达式如何匹配一个单词存在一次或零次并且不占捕获组位置 今天要用正则表达式实现匹配一个词出现一次或者不出现的情况,但是又不仅仅是这么简单的需求。先详细说下我这种情况吧,也许有...

Airship
今天
6
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部