摘要和理解:
- 搜索引擎的搜索结果排名取决于两组信息:关于网页的质量信息及这个查询与每个网页的相关性信息。
- PageRank的核心思想:在互联网中,如果一个网页被很多其他网页所链接,说明它受到普遍的承认和信赖,那么他的排名就高。
- 网页和查询的相关性 TF_IDF: 关键词的频率TF
TF1 + TF2 + TF3 + ...
词的权重IDF
TF1 * IDF1 + TF2 * IDF2 + TF3 * IDF3 +...
TF1 + TF2 + TF3 + ...
词的权重IDF
TF1 * IDF1 + TF2 * IDF2 + TF3 * IDF3 +...
© 著作权归作者所有