
垂直搜索引擎是针对某个行业的专业搜索引擎。它是搜索引擎的细分和延伸。它集成了web库中的某种特殊信息,通过方向字段提取所需数据,然后以某种形式返回给用户。垂直搜索是一种信息量比较大、查询不准确、深度不够的新型搜索引擎服务模式。它为特定领域、特定人群或特定需求提供有价值的信息和相关服务。其特点是“专、精、深”,具有行业色彩。相对于一般搜索引擎海量信息的无序,垂直搜索引擎更加专注、具体、深入。
什么是垂直搜索引擎?垂直搜索是针对某个行业的专业搜索引擎。它是搜索引擎的细分和延伸。它是网页库中一些特殊信息的集成,通过方向字段提取所需数据,然后以某种形式返回给用户。
垂直搜索引擎与普通网页搜索引擎最大的区别在于它是从网页信息中提取结构化信息,也就是将网页的非结构化数据提取为具体的结构化信息数据,就像网页搜索以网页为最小单位,基于视觉的网页分块分析以网页分块为最小单位,垂直搜索以结构化数据为最小单位。然后将这些数据存储在数据库中,以供进一步处理,如重复数据消除、分类等。最后,分词和索引可以通过搜索满足用户的需求。
在整个过程中,数据从非结构化的数据中提取出来成为结构化的数据,经过深度加工后以非结构化和结构化的方式返回给用户。
垂直搜索引擎有很多应用,如企业数据库搜索、供求信息搜索引擎、购物搜索、房地产搜索、人才搜索、地图搜索、mp3搜索、图片搜索等.几乎各行各业的各种信息都可以进一步细化到各种垂直搜索引擎中。
比如会比较好理解。例如,一个购物搜索引擎的整体流程大致如下:抓取一个网页后,提取该网页的商品信息,提取商品名称、价格、介绍.甚至将笔记本介绍进一步细分为“品牌、型号、CPU、内存、硬盘、显示屏、……”然后对信息进行清洗、复制、分类、分析对比、数据挖掘和挖掘。
垂直搜索引擎一般需要以下技术。
1.蜘蛛;状似蜘蛛的物体;星形轮;十字叉;连接柄;十字头
2.Web结构化信息抽取技术或元数据收集技术。
3.分词和索引
4.其他信息处理技术
垂直搜索引擎的技术评价要从以下几点来判断。
1.综合性
2.更新
3.准确(性)
4.功能
垂直搜索的准入门槛低,但竞争门槛高。没有敬业精神和高超技术是不行的。行业门户有行业优势,但没有技术优势。千万不要幻想垂直搜索的所有技术都是招几个人就能搞定的。作为一个需要持续改进和运营的产品,而不是一个项目,对技术的掌控程度是垂直搜索成功的重要因素之一。
1、什么是垂直搜索引擎?
垂直搜索不仅仅是像谷歌那样的全行业搜索。以房地产行业为例。如果我们按照谷歌抓取网页的方式,它将无法建立一个房地产行业的谷歌。技术壁垒不需要解释。即使使用nutch、lucene等搜索技术,也无法提供差异化服务。没有差异化的产品是无法在互联网赢者通吃的规则下生存的,也就是不要简单的模仿,而是想办法互补。
垂直搜索在定位、内容、用户、市场策略上都不同于目前的google、百度等通用搜索。所以垂直搜索不仅仅是一个简单的行业谷歌。
用户通过关键词使用google、百度等通用搜索引擎,属于语义搜索,返回的结果倾向于知识成果,如文章、论文、新闻等。垂直搜索也提供关键词进行搜索,但放在行业知识的语境中,返回的结果更倾向于信息、消息、条目等。对于买房的人来说,他想找的关于房子供求的信息和文章、新闻是不一样的。这一特点是由它们各自的技术特点决定的。比如谷歌搜索引擎是金字塔,那么垂直搜索引擎就是倒金字塔,两者是互补的。
2、什么是垂直搜索?
我认为垂直搜索的本质是垂直门户信息提供方式的简化整合。
搜索领域有一句很明确的话:用户除非看到他要找的东西,否则无法描述他要找的东西。这个过程有点像找对象,碰运气是用户搜索行为的最大特点。垂直搜索引擎是为了提高和给用户提供更好的运气。
垂直搜索是服务于某种功能的,比如:用户搜索租房、买房信息都是垂直搜索。无论是结构化数据还是非结构化数据,对信息进行再加工都是非常重要的。
3、垂直搜索的内容来源:
门户自己的资源
b行业用户以开放接口方式提供的资源。
普通用户发布的资源
d抢行业用户资源
微软亚洲研究院一位负责搜索的技术专家说:75%的内容是一般搜索引擎搜索不到的。这包含两层意思:
(1)网站结构不合理,页面对搜索引擎不友好;
(2)由于互联网上的信息是海量的,非结构化的信息需要结构化后才能更好的展示。如果梳子能提供搜索就更好了。垂直门户网站是最好的行业信息分类。
垂直搜索引擎提供的主要内容不应局限于普通的web索引,还应包括对商业信息和结构化信息的处理。
4、垂直搜索的门槛在哪里?
在互联网上,门槛不止是资源。垂直搜索也是如此。能否提供全面权威的行业信息,是否拥有行业资源,是垂直搜索引擎发展的门槛。换句话说,垂直门户就是垂直搜索最近的父亲。作为房地产行业,搜房网是一个垂直门户,房地产领域没有人比我们更清楚什么是垂直搜索。
垂直搜索的难点不是技术,而是用户参与门户的创新,以及垂直门户对上下游信息资源的整合。
5、垂直搜索的功能:
(1)搜索是产业商业联盟的平台,是整合产业链上下游公司的搜索入口。
(2)垂直搜索的表达方式与谷歌、百度不同。结构化搜索和非结构化搜索一起使用。
(3)从广告模式上,提供了除google adsense和百度竞价排名广告之外的另一种可能。
6、垂直搜索引擎的三大特点:
(1)垂直搜索引擎捕获的数据来自垂直搜索引擎关注的行业网站:
例如,寻找工作的搜索引擎www.deepdo.com的数据来自www.51job.com和www.zhaoping.com。
、www.chinahr.com等;
股票搜索引擎www.macd.cn的数据来自www.jrj.com.cn和www.gutx.com。
等待股票网站;
(2)垂直搜索引擎抓取的数据倾向于结构化数据和元数据;
比如我们找工作时关注的:
工作信息:软件工程师;
公司名称,行业名称:软件公司,外包行业等。
地点:北京海淀;
(3)垂直搜索引擎的搜索行为是基于结构化数据和元数据的结构化搜索;
比如:在海淀找软件工程师的工作。
7、垂直搜索引擎网站的八大准则:
1、选择好垂直搜索方向。俗话说,男人怕选错行,搜索引擎也是一样。除了所选行业对垂直搜索的需求大,这个行业的数据属性最好不要相关。
雅虎、谷歌等通用搜索的抓取方向是重叠的。
目前比较热门的垂直搜索行业有:购物、旅游、汽车、工作、房产、交友等行业。搜索引擎对动态url数据不敏感也是众所周知的,动态URL数据可以作为垂直搜索引擎的切入点;
2、对所选垂直搜索行业的网站、垂直搜索内容、行业构成进行评价;
我们都知道,垂直搜索引擎不提供内容的来源,它的数据是由爬虫收集并深度加工的。所以,考虑垂直搜索引擎的环境和定位是非常重要的。
3、深度分析垂直搜索引擎的索引数据特征;
垂直搜索引擎的索引数据过于结构化,所以进入门槛相对较低,行业竞争会形成蜂拥而至的局面;如果搜索数据的特点是非结构化的,那么这类数据的抓取和分析是非常困难的,进入门槛太高,很有可能还没入门就死掉了。
4、垂直搜索引擎的索引数据倾向于结构化数据和元数据,这与雅虎、谷歌等通用搜索引擎不同。这是垂直搜索引擎的立足点。垂直搜索引擎植根于某个行业。
所以行业知识和行业专家也是一般搜索引擎所不具备的。换言之,进入垂直搜索是有门槛的。
5、垂直搜索引擎的搜索结果要覆盖全行业,搜索相关性要高于一般搜索引擎,贴近用户的搜索意图,搜索结果要及时。
6、 web 2.0对垂直搜索引擎的要求:
由于其结构性,垂直搜索引擎的搜索数据比一般搜索引擎的全文索引更明显。所以设计要提供收集用户数据的接口,提供tag、integral等机制,让搜索结果更加“垂直”。
7、垂直搜索引擎的目标是帮助用户解决问题,而不仅仅是像一般搜索引擎一样查找信息:
这是垂直搜索引擎的终极目标。做垂直搜索引擎的时候,你需要考虑:这个行业有哪些特殊的问题,有哪些普遍的问题。Keso多次提到,谷歌的目标是让用户尽快离开谷歌,垂直搜索引擎要粘住用户。一般来说,使用垂直搜索引擎的用户都与自己的兴趣息息相关。所谓兴趣需求是我自己的原创,大意是与用户的工作息息相关,是生活中不可或缺的需求,寻求可持续性。比如:学生找论文,业主找装修资料等等。所以,坚持用户,给用户反馈,是很关键的一部分。
8、垂直搜索引擎的社区特征:
本条与第九条相关。
正所谓物以类聚,人以群分,垂直搜索引擎定位于一个行业,服务于一群有特定需求的人群,这就决定了垂直搜索的社区行为。人们使用垂直搜索引擎来解决问题和分享反馈。现在的网站都是关于社区的,所以垂直搜索引擎本质上是垂直门户信息提供方式的简化整合。
搜索市场细分谷歌和百度面临挑战。
百度上市后,搜索市场突然火热起来。越来越多的企业围绕搜索市场做文章。而且,在搜索大战的同时,一些公司也抛出了一些惊人言论。近日,记者从专门从事个人通信的联系人(www.linkist.com)技术总监冉政处了解到,联系人正在加紧研发相关领域的专业垂直。
招聘信息搜索引擎等搜索引擎系统预计将于2005年底推出。联系人之所以涉足专业垂直搜索引擎领域,是看到了未来垂直搜索引擎市场的巨大商机。他认为,未来搜索市场将进一步细分,谷歌、百度等崇尚大而全的全球搜索引擎将面临垂直专业搜索引擎更大的竞争和挑战,市场份额将逐步被瓜分,专业垂直搜索将受到网民青睐。
那么为什么能得出这样的结论呢?冉老师解释说,CNNIC第14次互联网调查显示,搜索以71.9%的绝对优势成为用户从互联网获取信息的主要方式。在世界上几乎所有的调查中,搜索引擎都是互联网上仅次于电子邮件的服务。搜索引擎服务可以成为最受欢迎的服务,因为它解决了用户在浩瀚的互联网上快速定位信息的问题。用户几乎不可能用传统的方式在大量的网页中找到信息,需要耗费大量的精力和时间。然而,互联网上的信息量正在爆炸式增长。几年前,全球搜索引擎收集的网页数量只有几千万,现在已经达到几十亿。数量的增加带来的是搜索服务质量的下降,查询结果集是海量的,往往是几十万条信息。结果中存在大量重复信息和垃圾信息,用户越来越难以快速找到匹配的信息。现在频繁使用搜索引擎会让你觉得很难在短时间内准确筛选出需要的内容,而垂直搜索引擎对特定领域或行业的内容做了专业深入的分析挖掘、精细分类、过滤筛选,信息定位更加准确,所以这个垂直领域或行业提供的搜索服务必然会更好更强,更受用户欢迎。
举个例子,如果一个网民需要某个特定领域或行业的信息,如果一个专业的垂直搜索可以精准锁定内容,但是内容少,而另一个可以检索到很多内容,但是搜索到的内容大部分都是“垃圾”,很难找到匹配的信息,那么你会选择哪个?就像用户想买一个产品,会去专门的比价购物搜索引擎找。答案很明显,更多的用户会抛弃后者,即使前者品牌小,口碑小,但结果往往是网民最看重的。
冉老师也给记者举了一个简单的例子。联络员LINKIST一直在扩大人脉圈子,现在已经是炙手可热的SNS网站。SNS网站的目的是建立一个庞大的人脉圈子,参与其中的人可以通过站内的人脉搜索引擎找到自己想要的人,可以找工作,收集人才,寻找合作的商机。联络员LINKIST在短短几个月内就聚集了近7万名高级商务人士。有了一定的用户基础做铺垫,LINKIST现在大力发展人脉领域的垂直搜索引擎,比如工作搜索引擎的人脉搜索引擎,比以前“投简历,翻招聘信息”的机械做法灵活多了。
而且,做出这样的预测显然不是空穴来风。据记者了解,搜索市场上涌现出一大批垂直专业搜索引擎,如比价购物搜索引擎、工作搜索引擎、博客搜索引擎等。几乎占据百度一半流量的MP3搜索,其实可以说是专业的MP3垂直搜索引擎,很多垂直门户也推出了自己的搜索引擎系统。
就从以前开始
辞去网易内容总监一职后创业的李学凌,也做起了博客内容的搜索引擎,这也说明垂直搜索引擎的市场正在酝酿中,这既是机遇也是挑战,其盈利模式也得到了谷歌和百度的验证。而且很多风险投资(VC)已经认可了搜索的概念,并且下了赌注。
那么,谷歌和百度能否通过“补课”挤出这部分专用搜索市场呢?冉老师告诉记者,Google和百度注定要走一条大而全的粗糙路线,而专用的垂直搜索引擎则不同。他们需要深入挖掘内容,做精细分类,构建专业领域的知识库系统等。这些都是谷歌和百度做不到的。他们根本没有精力去做这些事情,对于每个行业领域都做不彻底。这是事实。
就像门户网站和专业的垂直行业网站可以共存一样,网民的胃口也是不一样的,有的满足于简单模糊的信息,有的在寻找精准内容的网民更喜欢专业的引擎。比如你打算跳槽,以前在人才招聘网站上投简历,现在可以试试LINKIST,和同行业的朋友交流最新的行业信息,探讨行业的发展趋势。而且以后联系人LINKIST推出网络引擎后,只需要点击一下就能收获很多。
有专家预测,未来专业的垂直搜索将会掀起一股热潮,垂直搜索引擎不会是简单的文本框和一个走遍天下的按钮,还需要专业的信息辅助和配套的增值内容支持,即相关内容的二次“加工”。这正是谷歌和百度所不能提供的。相信届时很多VCS都会聚焦于此,谷歌和百度会面临怎样的挑战?我们只能拭目以待。
要理解垂直搜索引擎,要和大家熟知的横向搜索引擎,也就是通用搜索引擎做一个比较。目前,互联网领域主要的搜索引擎服务商,如雅虎、百度、谷歌等。为用户提供横向的海量信息搜索。它们可以满足大量信息的横向搜索和提供,但很难兼顾搜索的准确性和相关性的质量。通用搜索引擎的价值在于做了大量的信息导航,对于信息需求相对集中、分类更加细化的行业客户缺乏引导。垂直搜索引擎的出现有效解决了上述通用搜索引擎无法满足的市场需求。
垂直搜索是指搜索引擎为用户提供范围极其狭窄的特定信息,而不是数百甚至数千万个相关网页。换句话说,搜索引擎收集的是市场空间中某个“市场利基”的数据,比如工作、旅游和高端房地产。这样的信息不仅用户更容易消化,而且更深刻。
谷歌、雅虎和MSN主导着互联网搜索市场,全球大部分网民使用这些搜索引擎来寻找自己需要的信息。但是在寻找一些特定的信息时,这些主要搜索引擎的表现都不尽如人意。有时候用户得到的往往是他们查询的初衷。
无关紧要的结果。拉近用户与所需信息距离的需求,催生并推动了搜索行业的小众化发展。垂直搜索引擎针对搜索市场中不同的小众市场。
小生境是英文术语小生境的翻译。小众市场是指一些通常被大企业忽视的细分市场。利基市场战略是指企业通过专业化经营占领这些市场,从
以及为实现收益最大化而采取的策略。实施小众战略的意义在于,进行市场小众的公司已经充分了解了目标客户群体,因此可以比其他公司做得更好、更完善。
满足消费者的需求。此外,利基市场可以根据它们提供的附加值收取更多的利润。一句话,市场利基者获得“高边际收入”,而集约营销者只获得“高毛收入”。
分析师认为,利基搜索市场和强大的在线广告市场之间有着密切的关系。管理者可以像Google和Yahoo一样使用搜索结果页面运行广告,即可以在搜索结果页面上提供一定针对性的文字广告。这种广告策略被认为是搜索行业的盈利渠道。
对于垂直搜索引擎来说,由于数据源被详细划分,所以可以对这些数据进行操作,并以简单易用的方式展示出来。此外,过去“千人展示成本”和“CPC”这两种网络广告存在效率低、广告成本风险大的问题,这也是垂直搜索受到青睐的主要原因之一。垂直搜索可以提供更集中的受众,从而提高搜索引擎的广告投放能力。同时,垂直搜索也能有效促进新广告商机的发展――姑且称之为“每次行动的成本”。这种广告方式不局限于广告量,是根据广告的实际效果,也就是根据潜在客户的响应行动来收费的。
国内有哪些垂直搜索引擎?各大搜索引擎都有自己的垂直搜索引擎,比如MP3搜索、图片搜索、新闻搜索、博客搜索等等。独立的垂直搜索引擎有:旅游搜索引擎(如携程网),商业搜索引擎,比价搜索引擎都是垂直搜索引擎。
九个非常有特色的垂直搜索引擎爱看图标网,中文图标搜索引擎(http://www.iconpng.com/)
目前收录了一万多个图标,功能还不错。可以通过图标系列、分类、色系、关键词、图标标题等进行搜索。可以查看每个图标的作者信息、大小、图片文件格式、色系、分类等信息。每个图标都是以png格式下载的(png格式是透明背景),大部分图标也是以ico格式下载。这个网站对于设计网页和制作PPT的人来说非常有用。
查一下专门查询各种数字的搜索引擎(http://www.cha086.com/)
目前有很多类似的网站支持手机归属地、ip地址、邮政编码、电话区号、身份证查询、QQ号、车牌查询。之所以选择在这里查,是因为这个网站没有广告,有很多特殊的功能:可以查车牌号(这个在其他网站没有),查QQ号的时候,不仅可以看到号码的主人是否在线,还可以看到QQ号的QQ秀;手机所有权查询有一个很有意思的投票功能;查询的时候还可以看到一些和查询内容相关的运势,天气等等。
找词网,中文字体搜索引擎(http://www.zhaozi.cn/)
荀子。com是一个致力于搜索字体的网站。还支持字体编码、字体类型等高级搜索功能,还支持在线字体预览平台,可以大大节省搜索字体的时间。
豆丁。中文文档搜索引擎(http://www.docin.com/)
豆丁。com声称包含超过1亿个文档,是最大的中文文档库。提供文档标题、简介、内容的关键词搜索功能,支持word、PDF、PPT、Jpg等30多种文件格式。
艾索。中文电子书搜索引擎(http://www.isoshu.com/)
爱搜书网成立于2006年,致力于各类电子书资源的垂直搜索服务。目前拥有包括漫画、小说、商业、生活、占星、手机等超过1000万的电子书搜索资源。
www.macd.cn MACD搜索引擎,实时金融信息搜索引擎
MACD搜索引擎索引的股票,基金,债券和其他信息。MACD搜索引擎,提供最即时的金融信息搜索,确实很新,但是内容有点少。
朋友圈,中文最大的求职搜索引擎(http://www.jobui.com/),专注于求职领域。随着网络招聘市场的扩大和行业招聘、区域招聘网站的成熟,招聘信息趋于分散。员工朋友圈更新的即时职位信息峰值超过70万条/天,平均更新速度稳定在30——40条/天。庞大的职位信息支撑了员工群体薪资搜索数据的准确性。
258.com,商业搜索引擎(http://www.isoshu.com/)
258商务搜索号称全球第一商务搜索引擎,为全球商务人士提供全面的多语种商务信息搜索服务,实时搜索全球超过6000个B2B平台,包括近10亿条供求信息、产品信息、公司信息、行业新闻等商务信息。258的商务搜索服务包括:商务信息搜索、公司搜索、新闻搜索、商务指南、商务信息“查找”、个性化服务等。为成功的商务人士提供搜索、订阅、短信服务,用户将在第一时间把握全球第一商机。
红薯网,中国图书垂直搜索(http://www.fanshu.com/)
红薯网提供中文图书搜索引擎、电子商务平台、全媒体出版系统的综合云服务。为60万本正版图书提供搜索服务,支持全文搜索,通过搜索实现图书资源的精准获取。










