网站群垂直检索引擎开发升级,网站群垂直检索引擎是什么。

网站群垂直检索引擎

网站信息量、频道量过多,用户无法快速查找所需信息??
子网站群“多而散”,如何满足用户“一键式”网站群垂直检索的需求??
怎么才能知道用户最关心的是什么,用户经常查找的是哪些信息??
泰得利通网站群垂直搜索引擎主要解决这三个问题。
什么是垂直检索引擎?
垂直检索引擎是针对特定类型网站的专业搜索引擎系统,可对网站中特定类型的信息进行横向整合、垂直检索,是一种新型的搜索引擎服务模式。
垂直检索引擎的本质是对特定类型网站群信息资源的简化性整合
垂直检索引擎的内容来源包括:门户网站自身的信息资源、抓取指定目标网站群的信息资源、通过开放式接口由指定对象提供的信息资源。
泰得利通垂直检索引擎能做什么?
作用一:采用通用型搜索引擎(Google、百度等)的模式,为垂直门户网站的用户提供特定信息资源(包括:新闻、公告、文件、图片等)的快速检索服务。
作用二:按照指定的规则,对分布在不同区域、不同类型的网站信息资源进行统一索引,满足对特定网站群的“一键式”垂直检索。
作用三:采用智能化的互动模式,使网站访问者与管理者及时了解热点信息或热门搜索关键字,从而为网站用户提供“引导式”的搜索服务。
泰得利通垂直检索引擎政府专用版能起到什么效果?
实现最低成本的政府网站信息资源整合
让用户最方便、快速地检索政府网站群
让政府更全面地了解网民的关注焦点
泰得利通(Intertid)垂直检索引擎由三部分构成:采集系统、索引系统及检索系统。Intertid智能化采集系统负责网站信息的采集工作,Intertid索引系统提供海量信息的分词、存储及即时索引,Intertid检索引擎提供全文检索及多种条件的检索功能。
(一)产品架构
信息层:网站非结构化信息、组织内部结构化信息
采集层:多线程智能化数据采集
加工层:信息内容的智能加工
数据存储中心:海量信息分布式存储
用户层:提供全文检索及多种条件检索方式
(二)产品功能
1) 支持异构资源整合索引
泰得利通(Intertid)垂直检索引擎不仅支持跨站索引而且还支持服务器本地硬盘文件索引及局域网文件索引,而且支持多数据源多索引、单数据源多索引、多数据源单索引,最大程度的满足在各种网络结构中实现整合索引。
2) 支持自定义搜索字段
可自定义搜索字段,还可根据用户的需要索引文档中特定的字段,从而满足各种特定的检索需求,如:检索政府公文的文号等特定字段。
3) 集成先进的中文自然语言处理技术,提高查全率和查准率
系统内置可维护的分词词典,支持多种切词方法,可根据不同行业设置不同的字典,提高切词的正确性和可扩展性。
4) 支持分布式多线程采集技术
Intertid采集机器人采用多线程并发采集技术,可以根据实际情况动态调节线程数目,实现多线程并发采集,从而提高采集效率,缩短采集时间。
5) 满足各种个性化配置需求
Intertid索引系统允许用户进行多种配置,具体包括:采集时间配置(任务开始时间,监控周期等)、信息采集的资源类型配置、信息采集的网址范围配置(在限定的站点,限定的域或目录)、信息采集的数量配置(每个站点采集的资源数目,层次数)等,从而满足不同用户的不同需求。
6) 自动化信息加工与过滤
Intertid索引系统可对网页进行内容分析和过滤,自动去除广告、版权、栏目等无用信息,精确获取目标网站的主体信息内容。
7) 强大的非结构化数据检索功能
系统支持包括TEXT、HTML、RTF、MS OFFICE、PDF等多种格式文件的存储、索引和检索。
8) 完善的信息检索方式
Intertid全文检索服务除了支持通用搜索引擎所提供的全文检索之外,还支持多种条件检索,比如按发布日期检索、按关键词检索、按标题检索等智能功能。

相关新闻

联系我们

联系我们

QQ:951076433

在线咨询:点击这里给我发消息

邮件:951076433@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

分享本页
返回顶部