数据挖掘中间件软件产品升级。

数据挖掘中间件软件

概述:

数据挖掘(Data Mining),顾名思义就是从大量的数据中挖掘出有用的信息。也可以把数据挖掘解释为:从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取人们所不知的潜在有用信息和知识的过程。数据挖掘技术主要包括“关联规则”、“聚类”、“分类”、“回归”、“决策树”等几种算法。与数据挖掘相近的同义词有数据融合、数据分析和决策支持等。

华胜天成作为卓越的IT综合服务提供商,从客户需求出发,自主研发的一款数据挖掘中间件产品TS-Miner。该产品提供数据处理、数据探索、数据建模及模型应用等一系列功能,致力于开发多种数据挖掘算法和统计建模方法,并能够方便、快速、高效地处理海量数据,为商业智能的应用提供更方便、灵活的工具和服务。

数据挖掘中间件软件介绍
软件主要功能:

  • 基本统计功能
    ü   均值分析
    均值分析过程计算指定变量的综合描述统计量,包括反映总体特征的分析和离散态势两部分。利用均值分析功能,客户可以研究城市居民和农村居民的收入、消费的平均水平以及差异等各种复杂情况。
    ü   多种统计分布函数
    包括如正态分布、F分别、卡方分布等基本统计分布函数,利用分布函数可以计算相应概率值,实现对统计指标的评估判断。 
  •  数据预处理功能
     ü   缺失值处理
    多种缺失值处理方法,对数据中出现的缺失值进行判断、检验和填充处理。避免由数据缺失引起的计算误差。
    ü   数据标准化处理
    对不同维度、不同类型的数据进行标准化可以消除因量纲不同造成的计算结果偏差,提高计算效率和精度。 
  • 数据挖掘功能
    ü   回归分析
    回归分析是统计分析中应用最多、最广泛的一个分支。在金融、工业技术、气象、化工等领域都需要利用回归分析从数据中建立模型、获取参数。TS-Miner提供变量全部选入和逐步回归两种处理方式,详尽地计算主要统计量并进行方差分析。
    ü   聚类分析
    许多应用领域要求考察数据的聚集态势,从而将数据划分到合理的类别中,如划分消费群、按地域划分产业带、遗传学研究等。在分类判据未知的情况下,聚类分析是主要的研究方法。TS-Miner提供属性重要度指标用于衡量属性在聚类过程中的重要度,该指标有助于数据挖掘业务指导的实施。此外,支持超常规聚类数,最大聚类数可以达到20。
    ü   决策树
    决策树本身使用明确的知识表示方式,从宏观到细节逐层描述蕴涵在数据之中的因果规则。当数据库庞大时,仅仅依赖分析人员的直觉和经验几乎无法发现这些复杂而富有层次的因果关系。TS-Miner的决策树模块提供主流的学习算法,能自动生成决策树,并显示为图形,为数据分析人员提供帮助。此外,TS-Miner可以根据模型结果生成SQL语句,实现在数据库中对样本进行打分。
    ü   关联规则
    关联规则是一种常用于从大量的业务记录和其它信息中提取因果依赖关系的规则。利用这些规则,决策者能够刺激潜在消费市场,提高盈利水平。TS-Miner除了提供关联规则的关键指标支持度、置信度外,TS-Miner在Apriori算法的实现设计上采用灵巧的存储结构,使得运算效率要高于同类软件产品。 

 软件特点:

ü   l 算法进程相互独立

当一个挖掘过程开始,TS-Miner核心层的调度程序将根据挖掘指令调用相关的算法管理模块、输入输出模块、挖掘算法模块和底层支持模块组成单独的算法进程,保证每一个挖掘算法进程的相互独立性。TS-Miner能实现多挖掘过程同时进行,并保证可同时进行的挖掘过程数量仅仅取决于服务器硬件性能。

ü   l 基础模块划分明确

在TS-Miner中,各个功能模块均有明确的划分。在对于产品进行升级和改动(改进底层支持模块、升级已有算法和添加算法)时,操作简单且不影响其他已有模块。

ü   l 功能层次清晰

TS-Miner各功能层次清晰,将核心数据挖掘算法与相关的管理功能明确分割。这一特性有利于提高数据挖掘计算效率,减少错误发生。

ü   l 数据处理能力强大

TS-Miner为处理海量数据设计了强大的数据读取方法,在数据遍历、各个挖掘算法的计算过程中均采取了数学上的性能优化,极大地提高了数据处理能力,符合数据挖掘产品的数据处理性能要求。

ü   l 灵活的算法设定

TS-Miner提供的各个算法均有相关参数设定,帮助高级客户合理地控制数据挖掘过程。同时各参数均有相对较为合理的默认值,帮助一般客户正确进行数据挖掘工作。

ü   l 多种集成方案

TS-Miner可作为中间件产品与企业已有的信息系统进行集成,并提供多种集成方案,以满足不同客户需求。

ü   l 结果应用便捷

TS-Miner的挖掘结果也以多种形式表现,包括分析报告、图形和编程语言等多种形式。客户可根据报告、图形等结果展现分析模型结果、制定相应策略,也可直接将以编程语言形式的结果直接用于数据库或企业信息系统中。

相关新闻

联系我们

联系我们

QQ:951076433

在线咨询:点击这里给我发消息

邮件:951076433@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

分享本页
返回顶部