网络搜索与搜索引擎研究-《实用网络搜索》序言

网络搜索与搜索引擎研究
(代序言)
顾名思义,网络搜索就是在互联网上进行的信息搜寻。广义的网络搜索可以包括网站浏览式查找,但作为信息挖掘、图书馆学和情报学研究内容的网络搜索是狭义和主流的“网络搜索”,即利用搜索引擎进行的网络信息的搜寻与查找。

我国上网用户人数达到10,300万,搜索引擎已成为仅次于电子邮件的第二大网络应用。凡有过网络经历的人,无不对Google、Yahoo、百度、搜狗、中搜、一搜、北大天网等耳熟能详,无不有过网站、网页、新闻、图像、游戏、MP3、FTP等搜索体验。网络的发展造就了搜索引擎,搜索引擎使人们能够快捷和有效地利用网络。无论对一般网民和工程技术与学术研究人员来说,搜索引擎已成为不可或缺的网络信息检索工具。

对商家来说,搜索引擎是一种赢利的产品,而对使用者而言,搜索引擎则仅仅是一种检索工具。作为产品,搜索引擎公司和搜索技术提供商要研制和创新搜索技术;作为工具,使用者要了解搜索引擎的功用、性能,掌握其使用方法和技巧。利用搜索引擎的目的不同,构成了搜索引擎研究的不同群体和对搜索引擎不同角度不同侧重的研究。

搜索技术研究的主体是搜索引擎的创制者和搜索技术提供商,它们多为专业公司和研究团体,拥有专职的研发队伍,专门从事网络信息挖掘理论研究、搜索引擎的开发、研制和搜索技术的改进、创新,靠建立搜索网站或提供搜索技术生存和赢利。如Google拥有独特的链接评价体系和PageRank专利技术; Yahoo!在收购了Inktomi、Overture、Fast、AltaVista、Kelkoo、3721等公司后,2004年2月断然与Google决裂,推出融合各旗下公司搜索技术精华的自有搜索技术(YST),并开始成为搜索技术提供商;Metacrawler开元搜索引擎先河,它的价值不仅在于同时调用多个独立的搜索引擎分别进行搜索的创意,更体现在处理各搜索引擎的查询结果,提交统一格式结果页面的独特技术;AltaVista第一个开发了支持自然语言的搜索技术;Ask Jeeves开创智能答询搜索引擎模式;About.com推出垂直主题搜索引擎模式;hobomo独创“MFGS闪电搜索”技术和“变异再生呈现”技术;百度拥有“超链分析”专利技术;中搜开发的“划词搜索”技术;一搜依托YST的本地化搜索;HillTop算法专利技术;vivisimo公司的搜索结果自动个性化聚类技术;Blinkx公司推出号称“可以搜索200余种媒介类型,包括了Word,Excel,PowerPoint和Acrobat PDF等格式的文档,以及各种音频与视频格式”的全新的“占卜式”搜索技术;搜狐2004年8月3日推出了自主研发的第三代搜索引擎—“搜狗”.…..。由于搜索引擎具有较大的赢利空间和诱人的前景,搜索技术无时不在研发和创新之中,搜索引擎商无不具有独门产品和自主知识产权的特色技术。

网络发展的需要和自身生存的压力,促使搜索引擎商不断对搜索引擎进行改进和升级,推出新的功能,以满足不断增长的搜索需求,争取更多的用户。以Googl为例,自1998年9月7日问世以来,它从未停止过其搜索技术的创新:1999年2月增加短语搜索功能,2000年7月27日推出高级搜索功能、8月16日增加布尔逻辑符“OR”检索,2001年1月31日增加PDF搜索,10月15日增加分类目录搜索,2002年10月12日增加购物搜索,2003年8月13日Toolbar 2.0新版问世,8月20日增加单词释义功能,11月6日推出Deskbar, 2004年1月13日推出区域编码、产品代码、航班信息、车辆确认号码以及美国邮政监管号码等搜索,3月推出本地搜索,4月推出拼音汉字自动转换功能,6月24日推出中英文字典、天气、股票、邮编区号、手机号码等实用搜索功能,7月推出“实名通”,9月9日推出新闻简体中文版,10月6日增加图书搜索,11月17日推出学术搜索,2005年2月23日推出电影搜索,3月7日推出桌面搜索中文版,4月20日推出My Search History个性化功能,8月24日推出GoogleTalk即时信息和网络语音电话服务,9月推出中文本地搜索和Blog搜索……。Googl几乎每月都有新的变化,每年都有重大的改进和创新,以功能的不断改进、增强和增加,满足用户不断提高和变化的需求。其它搜索引擎无一不是孜孜以求,不断地创新技术,增强功能。为适应个性化的搜索需求和发展趋势,各搜索引擎争相展显技术优势,纷纷抢滩桌面和工具栏,一时间几乎所有的搜索引擎都推出了称谓不同的toolbar或deskbar。然而,尽管搜索技术研究竞争激烈,新的搜索搜索技术和搜索功能不断问世,但真正“智能化”和“个性化”的搜索技术还仍在人们的期待之中。

搜索方法研究属于应用研究,对搜索引擎的推广使用有着直接的影响,与搜索引擎的普及和利用水平相辅相成。网络检索的需要催生了搜索引擎,搜索引擎使用方法的研究极大地促进了网络检索技能和网络资源利用水平的提高。

搜索方法研究的群体最为庞大,广大的网络搜索爱好者是其中的生力军,高校图书情报院系和图书情报部门的科研人员是网络搜索方法研究的主力和骨干,网络搜索教学网站和搜索论坛是普及搜索知识、学习搜索方法、交流搜索经验和探讨搜索问题的主要平台,搜索引擎普及与研究网站和图书情报专业期刊是发表研究成果的主要载体。

较有影响的网络搜索教学网站有:extreme searcher(http://extremesearcher.com/handbooklinks.html)、Finding Information on the Internet: A Tutorial(http://www.lib.berkeley.edu/TeachingLib/Guides/Internet/FindInfo.html)、Anne Clyde’Weblog(http://www.hi.is/~anne/)等。研究搜索方法较为知名的论坛有:Search Engine Watch的forum(http://forums.searchenginewatch.com/)、Search Guild的forum(http://www.searchguild.com/)、中文搜索引擎指南的“搜索论坛”( http://www.sowang.com/bbs)、中国生命科学论坛的“文献与检索技巧”( http://www.bioon.net/list.asp?boardid=17)、丁香园医学论坛的“文献检索知识交流版”( http://www.dxy.cn/bbs/post/page?bid=6&sty=1&age=0)、搜狗说吧—搜索引擎吧、百度帖吧—搜索引擎吧等等。此外,搜索引擎普及与推广网站一般也都设置专栏,登载搜索引擎功能与特点、各种网络资源搜索方法与技巧等方面的文章,其中影响较大的有中文搜索引擎指南网(http://www.sowang.com/)、《搜索研究院》(http://www.9238.net/)、搜索引擎直通车(http://www.se-express.com/)等等,这些都是不可多得的研究搜索引擎、搜索技巧和学习专业文献检索的门径。

近年来,高校《文献检索》课程均增加了搜索引擎和网络信息检索的相关内容,对普及网络搜索知识起到了积极的推动作用。图书情报界同仁对网络搜索的理论和实践从不同的角度进行深入的研究和系统的总结,各具特色的研究成果亦多有问世。在维普《中文科技期刊数据库》中进行关键词检索,“搜索引擎”检索出文章3,249篇,“网络信息检索”407篇,“internet+文献检索”54篇,以“搜索引擎”、“网络信息检索”为关键词,从国家图书馆《中文普通图书数据库》分别检索出有关专著23种和14种。综观现有研究成果,搜索方法研究的范围比搜索技术研究要宽泛的多,涉及搜索引擎的检索功能、检索语法、检索策略、检索词语、检索技巧、检索工具的评价与选择、各个学科与各种类型网络资源检索等诸多方面。我们有理由相信,随着社会信息意识的增强,网民人口将快速增长,搜索引擎的使用率将逐步提高,搜索方法的研究将会受到人们更多的关注。

网络搜索离不开搜索引擎,对搜索引擎的了解和掌握影响着网络搜索的质量和效率。了解搜索引擎,很重要的一个方面就是及时获得搜索引擎的诸如版本升级、性能优化、算法改进、功能增加等动态信息。搜索引擎的动态信息有官方发布和研究者或使用者发布两种方式。前者多以新闻形式出现,可以通过新闻搜索及时获得,或在有关网站进行专题新闻查阅。设立搜索引擎专题新闻烂目(如:Search Engine News、Search Engine Update、搜索快报、搜索引擎业界动态等)的主要网站有:Search Engine News(http://www.searchengineguide.com/searchenginenews.html)、Search Engine Showdown(http://www.searchengineshowdown.com/)、ResearchBuzz(http://www.researchbuzz.com)、Search Engine Watch (http://searchenginewatch.com/)、Pandia Search Engine News(http://www.pandia.com/sew/index.php)、中文搜索引擎指南网(http://www.sowang.com/)、搜索引擎直通车(http://www.se-express.com/)等,从中可以进行专题新闻的系统浏览和回溯查找;后者多以Blog为载体,信息源较为广泛,有的是搜索引擎的研制者专注于某一搜索引擎的Blog,更多的是搜索专家或搜索爱好者的个人Blog。受人关注此类Blog有:Google Blog(http://www.google.com/googleblog/atom.xml)、Yahoo! Search blogh(http://www.ysearchblog.com/index.xml)、 msnsearch’s WebLog (http://blogs.msdn.com/msnsearch/rss.aspx)、 Ask Jeeves Blog(http://blog.ask.com/index.rdf )、SEW Blog(http://blog.searchenginewatch.com/blog/)、搜索引擎研究(http://www.wespoke.com/)、Google研究院Blog(http://www.ooone.com/blog/)等等。通常情况下,搜索引擎不会发布其测试功能和日常改进的官方信息,而有关专家的个人Blog则会对搜索引擎的细微变化有敏感的反映,利用Blog搜索引擎和RSS订阅可以及时获得搜索引擎的非官方动态信息。

我们已跨进信息社会的门槛,互联网已成为人类共享的信息平台,并正在影响和改变着我们的生活。然而,网海浩瀚资源丰富信息茫茫,从中获取我们所需要的特定的资源或信息,没有专门的检索工具是不可想象的。网络搜索与搜索引擎研究,对提高社会的网络应用水平,培养和强化信息意识,进而促进知识生产和知识创新,有着重要的意义和影响。“工欲善其事,必先利其器”,了解搜索引擎的功能、特点,探讨和研究各种网络资源的检索策略、方法和技巧,熟练掌握和使用搜索引擎,已成为现代人必不可少的基本技能。

原文链接:http://xcxzy.blogchina.com/4199742.html