计算机技术论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

  • 欢迎访问 计算机技术论坛-电脑迷与初学者的家园!由于论坛管理严格,新注册会员可能遇到各种问题,无法解决的请发邮件 admin@jsjbbs.cn
查看: 934|回复: 0

搜索引擎的起源之科学史话克伦·施拜克·琼斯对网络搜索的贡献

[复制链接]
发表于 2021-4-10 02:32:20 | 显示全部楼层 |阅读模式
#111723#<p>迷信史话 克伦·施拜克·琼斯: 每次收集搜寻背地 都离不开她的奉献
<p>克伦·施拜克·琼斯(Karen Sp?rck Jones)1935年8月26日生于英国哈德斯菲尔德市,一个纺织业较兴旺的都会。在她小时间,她的父亲在大学里担负化学讲师,晚上还要打工挣钱;母亲是挪威人,曾去伦敦为挪威亡命当局任务。因为怙恃都顾不上照看她,便将她拜托给乡下的一户人家。在如许的成长情况中,琼斯从小便锤炼出了必定的自力性。
<p>从11岁到18岁这7年间,琼斯就读于一所高程度的文法女校,12岁时,她发愿要上剑桥大学,后终究如愿以偿。
<p>1956年,她在剑桥大学取得汗青学专业的文学学士学位。因为对哲学的兴致,琼斯又持续读了一年哲学。1957年,她参加了剑桥言语研讨所,开端打仗盘算机在言语研讨方面的利用。在此任务时期,她意识了Roger Needham(1935—2003,盘算机迷信家,英国皇家学会会员),两人于1958年完婚。1964年,她在剑桥大学取得哲学博士学位,但博士论文导师对她的辅助不大,她基础上是自力打拼,编程也是自学的。1968年,琼斯成为剑桥大学盘算机试验室的全职任务职员,今后当前她在这里耕作了近50载,始终从事盘算言语学和信息检索研讨。
<p>她在盘算言语学和信息检索两个范畴都作出了出色奉献。在信息检索方面,早在1958年,她就与人合著了相干文章。她的最主要奉献当数1972年提出的逆文本频率指数(IDF)的观点。这个观点的意思是:假如词w在一篇文档d中呈现的频率高,而且在其余文档中很少呈现,则能够以为词w存在很好的辨别才能,能够把文章d和其余文章较好地域离开来。IDF是互联网搜寻引擎广泛采取的思绪。能够说,没有琼斯的从前奉献,就没有谷歌搜寻引擎往后的成绩。
<p>在盘算言语学方面,她1963年实现的博士论文至今仍有代价。该文将统计退路(或谓呆板进修退路)与已有资本(做在穿孔卡片上的叙词表)联合起来,获得了当先于时期的结果。另外,她在盘算机主动择要、构造化数据库的界面、对话、语义学等多个主题上均有所建立。
<p>除了自己的学术研讨外,她还通过学术社团的运动大大推动了本事域的提高。特别是1994年她担负盘算言语学学会(ACL)会临时间。盘算言语学学会是国际性的社团,事先少数会员是美国粹者,她接办学会时,学会的财政状态欠安,本来的管库又逝世了,一时半会儿应聘不到新的管库,在这类情形下,琼斯又要兼顾部署学会的学术运动,又要管账,忙得一塌胡涂。那一阵子是ACL苦痛挣扎的过渡期,在她的无力引导下,ACL走出了窘境。除了ACL外,她仍是别的好几个学会的会士。2000—2002年时期,她担负过英国迷信院副院长。在英国有两所迷信院:英国皇家学会相称于天然迷信范畴的迷信院,而英国迷信院是人文社会迷信范畴的迷信院。因为言语学这个大类属于人文学科,琼斯就凭仗其在盘算言语学的成绩入选为英国迷信院的院士。
<p>琼斯共取得过7个主要奖项,包含2004年取得的“盘算言语学学会毕生成绩奖”和2007年取得的“英国盘算机学会勒芙蕾丝奖章”(阿达。勒芙蕾丝是英国大墨客拜伦的女儿,盘算机顺序的开创人)。
<p>她2002年操持了退休手续,但持续在试验室任务。直到2007年4月4日逝世前未几,试验室里仍有她的身影。
<p>2001年4月10日,电气电子工程师学会(IEEE)汗青研讨核心的Janet Abbate密斯采访了琼斯。在接收采访时她说:“大家都在谈职业生活之类的货色。从某种意思上说,我做到了一起向前走,但实在当时并没有显明的门路。你得应用所有存在着的机遇。从前的时间,对于女性,即便是在剑桥,任务机遇也是极为无限的。看看当初的年青女性,我是非常爱慕。当初没有几多女性具有‘我能行’的心态,但她们实在具有实现‘我能行’的机遇,而咱们当时基本就没有如许的机遇。”
<p>盼望咱们中国的职业女性以琼斯为模范,捉住机遇,奋力前行。
<p>(克伦·施拜克·琼斯 图片起源:剑桥大学网站)概述搜寻引擎的来源
<p>1.搜寻引擎的来源
<p>1990年,加拿大麦吉尔大学(University ofMcGill)盘算机学院的师生开辟出Archie。事先,万维网(World Wide Web)还没有呈现,人们通过FTP来同享交换资本。Archie能按期收集并剖析FTP效劳器上的文件名信息,供给查找分辨在各个FTP主机中的文件。用户必需输入准确的文件名停止搜寻,Archie告知用户哪个FTP效劳器能下载该文件。固然Archie收集的信息资本不是网页(HTML文件),但和搜寻引擎的基础任务方法是一样的:主动收集信息资本、树立索引、供给检索效劳。以是,Archie被公以为古代搜寻引擎的鼻祖。
<p>2.搜寻引擎的开展
<p>第一阶段
<p>Excite的汗青能够上溯到1993年2月,6个Stanford University(斯坦福大学)大先生的主意是剖析字词关联,以对互联网上的大批信息作更无效的检索。到1993年中,这已是一个完整投资名目,他们还宣布了一个供webmasters在本人网站上应用的搜寻软件版本,厥后被叫做Excite for Web Servers。注:Excite厥后曾以观点搜寻驰名,2002年5月,被Infospace收购的Excite结束本人的搜寻引擎,改用元搜寻引擎Dogpile
<p>第二阶段
<p>1994年4月,斯坦福大学的两名博士生,美籍华人杨致远和David Filo独特开办了Yahoo!。跟着拜访量和收录链接数的增加,Yahoo目次开端支撑简略的数据库搜寻。由于Yahoo!的数据是手工输入的,以是不能真正被归为搜寻引擎,现实上只是一个可搜寻的目次。Yahoo!中收录的网站,由于都附有简介信息,以是搜寻效力显明进步。注:Yahoo当前连续有 Altavista、Inktomi、Google供给搜寻引擎效劳Yahoo!--几近成为20世纪90年月的因特网的代名词。
<p>第三阶段
<p>1995年,一种新的搜寻引擎情势呈现了——元搜寻引擎(Meta Search Engine)。用户只要提交一次搜寻要求,由元搜寻引擎担任转换处置后提交给多个事后选定的自力搜寻引擎,并将从各自力搜寻引擎前往的全部查问成果,会合起来处置后再前往给用户。第一个元搜寻引擎,是Washington大学硕士生 Eric Selberg 和 Oren Etzioni的 Metacrawler。元搜寻引擎观点上十分难听,但搜寻后果一直不睬想,以是没有哪个元搜寻引擎有过强势位置。
<p>第四阶段
<p>智能检索的发生:它应用分词辞书、同义辞书,同音辞书改良检索后果,进一步还可在常识层面或许说观点层面上帮助查问,通过主题辞典、高低位辞书、相干同级辞书检索处置构成一个常识系统或观点收集,赐与用户智能常识提醒,终究辅助用户取得最好的检索后果。?
<p>综合自科技日报 ; 参考材料: 《收集营销》 杨路明等编著 机器产业出书社
更多内容阅读推荐:空调内机风扇电容坏了怎么办
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

无图版|手机版|计算机技术论坛 JSJBBS.CN @ 2008-2024 ( 鲁ICP备17021708号 )

技术支持 : 北京康盛新创科技有限责任公司

快速回复 返回顶部 返回列表