文档章节

搜索引擎起源

anlve
 anlve
发布于 2017/09/28 18:23
字数 1084
阅读 29
收藏 1
点赞 0
评论 0

搜索引擎发展历史:

1萌芽:Archie,Gopher

Archie:1990年,加拿大蒙特利尔的麦吉尔大学的一个学生只做了一个自动索引互联网上匿名FTP网站文件的程序,称Archie。如今提供Archie服务的网站已经很少。

Gopher:受Archie启发,美国明尼苏达大学的一个学生Mark McCahill,于1991年发明了Gopher的搜索协议,其命名来自该校的吉祥物,与Archie最大的不同是,Archie仅能够索引网络上的文件,而Gopher却可以对网页也进行索引。直到今天,网上仍然有一些Gopher的服务器运行着,许多Gopher协议的狂热者依然维护着它们。

2起步:Robot(网络机器人)的出现与spider(网络爬虫)

第一个用于检测互联网发展规模的机器人程序诞生于1993年,由美国麻省理工学院的Matthew Gray 开发,名字叫做world wide web wander。最初它只是用来统计互联网上的服务器数量,监测网络规模。

英国软件工程师Martijin Koster 创建了ALIWEB(Archie-Like Indexing of the web),事实上是一个Archie的互联网版本。网站管理者若希望自己的的网页被索引,需要提交每一个网页的索引信息。有点类似Yahoo。网址:http://www.aliweb.com/

 

3发展:excite、galaxy、yahoo

1993年2月,6个斯坦福大学生开发出了Excite,不到一年时间,组成公司,并在1995年12月上市,不过2002年被Infospace(http://www.infospace.com/)收购的Excite停止了自己的搜索服务,改用元搜索Dogpile(http://www.dogpile.com/)。

1994年斯坦福的两名博士生,杨致远jerry yang和David Filo共同创建了雅虎。(http://www.yahoo.com/)

 

1994年初,美国华盛顿大学计算机工程系的学生Brian Pinkerton 开始了他的小项目webCrawer,1994年4月20日,webCrawer(http://www.webcrawler.com/)正式亮相。后来被AOL(http://www.aol.com/)和excite(http://www.excite.com/)收购,现在和excite一样,改用元搜索引擎dogpile。

 

1994年7月20日,数据量为54000个文档的lycos(http://www.lycos.com/)搜索引擎正式发布,是美国卡耐基梅隆大学的Michael Mauldin 将john Leavitt开发的网络机器人程序与其创建的索引程序组合在一起创建的。

 

4繁荣:infoseek,altaVista,Google和baidu

1994年infoseek(http://go.com/)公司搜索引擎与公众见面,其突出特点是其友好的用户界面、大量附加服务使它声望日益增减。1995年与netscape(http://isp.netscape.com/)的战略性协议,使它成为一个强势搜索引擎。

 

 

AltaVista(http://us.altavista.com/)是1995年12月时推出的,大量的创新功能使其迅速达到了搜索引擎的顶峰。最突出优点是搜索速度。

 

Google:1998年10月google正式推出,迅速成为业界领头羊。之前google只是斯坦福大学的一个小项目BackRub。1995年博士生Larry Page开始学习搜索引擎设计,并与1997年注册了google.com的域名。1999年2月,google完成了从alpha版到beta半的蜕变,google则把1998年9月27作为自己的生日。直到2000年中数据库升级后,又借助被yahoo选作搜索引擎的东风一飞冲天。

 

Baidu:2000年1月,超级链接分析专利发明人,前infoseek资深工程师李彦宏与好友徐勇(加州伯克利分校博士)携120万美金从美国硅谷回过,在北京中关村创立了百度(baidu)。创立之初,百度就将自己定位于打造中国人自己的搜索引擎。2000年5月百度首次为门户网站“硅谷动力”提供搜索技术服务。之后它迅速占领中国搜索引擎市场。2001年8月百度公司发布了baidu.com搜索引擎beta版,从后台服务转向了独立提供搜索服务。2001年10月22日,正式发布baidu搜索引擎。2005年8月5日,百度在纳斯达克上市,成为2005年全球资本市场上最引人注目的上市公司,中国的搜索引擎市场也由此进入了一个崭新的阶段。

 

 

,,,,,,,,

© 著作权归作者所有

共有 人打赏支持
anlve
粉丝 9
博文 188
码字总数 151927
作品 0
其它
其他
中文分词软件包--LibMMSeg

LibMMSeg 简介 LibMMSeg 是Coreseek.com为 Sphinx 全文搜索引擎设计的中文分词软件包,其在GPL协议下发行的中文分词法,采用Chih-Hao Tsai的MMSEG算法。 MMSEG: A Word Identification Syste...

蔡志浩
2009/05/31
12.5K
0
管中窥豹看 Google

任何对 Google 历史感兴趣的人都应该读读 Steve Levy 的“In The Plex:How Google Thinks,Works,and Shapes Ours Lives”,他花了五年的时间,访谈上百位 Google 员工,获得了许多公司内部...

红薯
2011/05/19
1K
5
中国科学家证实: 是世界大麦起源中心之一

中国是世界大麦起源中心之一 原始链接: 大麦青稞起源 1926年,N ·瓦维洛夫(Vavilov,N.)在研究从全世界收集的16000份大麦样本后,从他所提出的八个作物起源中心中确定了三个是大麦起源中心,即中...

FreeBlues
2016/05/24
84
0
亚马逊老板再试飞火箭,“梦幻版”太空旅行即将登场

  沉寂了一年之后,亚马逊公司老板贝索斯旗下的私营航天企业“蓝色起源”(Blue Origin)昨日在得克萨斯州的场地内再次发射并回收新谢泼德号(New Shepard)亚轨道火箭。      与此同时...

DeepTech深科技
2017/12/14
0
0
初创企业如何用SEO打造百度品牌专区

品牌对于企业的重要性不言而喻。为打造品牌而花去的市场费用,占去了公司营销费用的大部分。而作为网络营销中的一个非常有效的渠道,百度也成为多数公司,宣传品牌的一个首选平台。 对于创业...

卢松松
2015/11/19
0
0
为培养女程序员 ,谷歌斥资五千万美元

原文出处:凤凰科技 据时代网站报道,为了招募更多女生到硅谷工作,谷歌为“Made With Code”项目投资了5000万美元,该项目主要用于教育女生进行编程。文章表示如果谷歌希望提高它的招募女生...

凤凰科技
2014/06/23
0
0
时隔一年,向往太空的杰夫·贝索斯又把火箭送上了天

摘要 时隔一年,蓝色起源火箭再次发射成功,贝索斯和他的梦想更进一步了。 本周早些时候(12 月 13 日),伴随德克萨斯西部一片荒漠中的一声轰鸣,私人航空公司蓝色起源(Blue Origin)成功发...

谁是大英雄
2017/12/15
0
0
[Linux发行版] 常见Linux系统下载

本专题页汇总最受欢迎的Linux发行版基本介绍和下载地址,如果您是一位刚接触Linux的新手,这里的介绍可能对您有所帮助,如果您是以为Linux使用前辈,也可以在评论处留下您宝贵意见和经验,以...

awbeci
2013/11/07
0
0
Spring Event是什么鬼

一、什么是程序世界里的事件? 最常见的点击操作是一种事件,刷新操作是一种事件,类似的还有很多,在程序的世界里,事件的起源是输入设备的一个信号(比如中断响应),进而将事件(或者说信...

八月下沙
2016/03/31
153
0
怎样打造一个DOM元素位置引擎 (一)

碎碎念 这是一篇早就应该写的文章,但是由于过年前项目紧张,一直没有时间,这个周末决定把这笔债换了。这个项目开始于两个月前,也是花了比较多时间的一个项目,不像前段时间写的 Hexo 主题...

forsigner
2016/03/07
13
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

代码生成利器:IDEA 强大的 Live Templates

代码生成利器:IDEA 强大的 Live Templates

qwfys
14分钟前
1
0
spring boot使用通用mapper(tk.mapper) ,id自增和回显等问题

最近项目使用到tk.mapper设置id自增,数据库是mysql。在使用通用mapper主键生成过程中有一些问题,在总结一下。 1、UUID生成方式-字符串主键 在主键上增加注解 @Id @GeneratedValue...

北岩
18分钟前
0
0
告警系统邮件引擎、运行告警系统

告警系统邮件引擎 cd mail vim mail.py #!/usr/bin/env python#-*- coding: UTF-8 -*-import os,sysreload(sys)sys.setdefaultencoding('utf8')import getoptimport smtplibfr......

Zhouliang6
21分钟前
0
0
日常运维--rsync同步工具

rsync命令是一个远程数据同步工具,可通过LAN/WAN快速同步多台主机间的文件。rsync使用所谓的“rsync算法”来使本地和远程两个主机之间的文件达到同步,这个算法只传送两个文件的不同部分,而...

chencheng-linux
25分钟前
1
0
Java工具类—随机数

Java中常用的生成随机数有Math.random()方法及java.util.Random类.但他们生成的随机数都是伪随机的. Math.radom()方法 在jdk1.8的Math类中可以看到,Math.random()方法实际上就是调用Random类...

PrivateO2
37分钟前
1
0
关于java内存模型、并发编程的好文

Java并发编程:volatile关键字解析    volatile这个关键字可能很多朋友都听说过,或许也都用过。在Java 5之前,它是一个备受争议的关键字,因为在程序中使用它往往会导致出人意料的结果。在...

DannyCoder
昨天
0
0
dubbo @Reference retries 重试次数 一个坑

在代码一中设置 成retries=0,也就是调用超时不用重试,结果DEBUG的时候总是重试,不是0吗,0就不用重试啊。为什么还是调用了多次呢? 结果在网上看到 这篇文章才明白 https://www.cnblogs....

奋斗的小牛
昨天
0
0
数据结构与算法3

要抓紧喽~~~~~~~放羊的孩纸回来喽 LowArray类和LowArrayApp类 程序将一个普通的Java数组封装在LowArray类中。类中的数组隐藏了起来,它是私有的,所以只有类自己的方法才能访问他。 LowArray...

沉迷于编程的小菜菜
昨天
0
0
spring boot应用测试框架介绍

一、spring boot应用测试存在的问题 官方提供的测试框架spring-boot-test-starter,虽然提供了很多功能(junit、spring test、assertj、hamcrest、mockito、jsonassert、jsonpath),但是在数...

yangjianzhou
昨天
0
0
rsync工具介绍/rsync通过ssh同步

rsync工具介绍 数据备份是必不可少,在Linux系统下数据备份的工具很多,其中重点介绍就是rsync工具,rsync不仅可以远程同步数据,还可以本地同步数据,且不会覆盖以前的数据在已经存在的数据...

Hi_Yolks
昨天
1
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部