分类 |
列表 |
数据理解 |
• 凭借自动辅助创建大量互动图表
• 使用可视链接分析查看您数据中的关联信息
• 通过在图表中选择地区和项目及查看所选信息,进行数据交互; 或选择关键信息进行分析
• 可直接从SPSS Modeler界面访问SPSS Statistics图表和报告工具 |
数据准备 |
• 可访问来自Cognos Business Intelligence、IBM DB2®、Oracle、Microsoft SQL Server、IBM Informix®、IBM
Netezza、mySQL (Oracle)和Teradata的业务数据,也可通过zDB2和IBM Classic Federation Server支持访问大
型机数据
• 可导入分割文本文件和固定宽度文本文件、SPSS Statistics文件、SPSS Data Collection数据源、Excel、SAS或XML
• 可从SPSS Modeler中选择多种数据清理选项,删除或替换无效数据,自动填充缺失值并减少离群值和极端值
• 将自动数据准备用于查询和限制数据,以便在一个单独步骤中进行分析
• 从SPSS Modeler直接访问SPSS Statistics中执行的数据管理和转换
• 使用字段过滤、命名、推导、合并、再范畴化、价值重置和字段重新排序
• 应用记录选择、抽样(包括整群和分层抽样)、合并(包括内连接、完全外连接、部分外连接和反对连接)、排序、聚合和
平衡
• 可选择数据再构成、分割和对换选项
• 可选择大量的字符串函数: 字符串创建、替代、查找和匹配,空格移除和截断
• 应用RFM (近因、频数和货币值)评分: 合计客户交易,提供RFM价值数并将其结合进行完整的RFM分析
• 可将数据导出至数据库、IBM Cognos Business Intelligence包、SPSS Statistics、SPSS Data Collection,可导出
的格式为分割文本文件、Excel、SAS或XML |
建模算法 |
• 异常检测—通过使用基于集群的算法检测不寻常的记录
• Apriori—借助高级判断函数的流行关联发现算法
• Bayesian Networks—图形概率模型
• C&RT、C5.0、CHAID和QUEST—决策树算法,包括交互式树构建
• CARMA—支持多结果的关联算法
• Cox回归—计算事件可能发生的时间
• Decision List—交互式规则建立算法
• Factor/PCA, Feature Selection—数据压缩算法
• IBM InfoSphere*数据库内挖掘算法: 关联(Association)、集群(Clustering)、决策树(Decision Tree)、逻辑回归
(Logistic Regression)、朴素贝叶斯(Naive Bayes)、回归(Regression)、序列(Sequence)、时间序列(Time Series)
• IBM Netezza*数据库内挖掘算法: 贝叶斯网(Bayes Net)、决策树(Decision Trees)、分离集群(Divisive Clustering)、
广义线性(Generalized Linear)、K均方聚类(K-Means)、KNN、线性回归(Linear Regression)、朴素贝叶斯(Naive
Bayes)、PCA、回归树(Regression Tree)、时间序列(Time Series)
• Microsoft SQL Server*数据库内挖掘算法: 关联规则(Association Rules)、集群(Clustering)、决策树(Decision
Tree)、线性回归(Linear Regression)、朴素贝叶斯(Naive Bayes)、神经网络(Neural Network)、序列集群
(Sequence Clustering)、时间序列(Time-Series)
• Oracle*数据库内挖掘算法: 自适应贝叶斯(Adaptive Bayes)、Apriori、人工智能(AI)、决策树(Decision Tree)、一
般线性模型(GLM)、K均方聚类(KMeans)、最小描述长度(MDL)、朴素贝叶斯(Naive Bayes)、非负矩阵分解(Non-
Negative Matrix Factorization)、正交分区集群(Orthogonal Partitioning Clustering)、支持向量机(Support Vector
Machine)
• K均方聚类(K-Means)、Kohonen、Two Step、Discriminant、支持向量机(SVM)—集群和分割算法
• KNN—最近邻建模和评分算法
• 逻辑回归(Logistic Regression)—面向二进制结果
• 神经网络(Neural Network)—具有反向传播学习和径向基函数网络的多层感知器
• 回归(Regression)、线性(Linear)、一般线性模型(GLM)、广义线性混合模型(GLMM)—线性方程模型
• 自学响应模型(SLRM)—具有增量学习的贝叶斯模型
• 序列(Sequence)—面向序列敏感分析的序列关联算法
• 支持向量机(Support Vector Machine)—面向广泛数据集的精准高级算法
• 时间序列(Time-Series)—生成和自动选择时间序列预测模型 |
建模和评估 |
• 结合使用大量数据挖掘算法和高级功能,从您的数据中获取最佳结果
• 使用自动(二进制和数值型)分类和集群,取代选择单一算法
• 使用交互模型和方程浏览器,查看高级统计输出
• 借助变量重要性图表,在预测的结果中展示数据属性的相关影响
• 在地图中可视化分析结果
• 结合多种模型(集成建模)或使用一种模型分析另一种模型
• 使用SPSS Modeler Component-Level Framework (CLEF)集成自定义算法
• 通过SPSS Statistics的集成,使用R统计编程语言扩展分析选项 |
部署 |
• 使用SQL或PMML (预测模型的基于XML的标准格式)导出模型
• 使用IBM SPSS Collaboration and Deployment Services的创新分析管理、流程自动化和部署功能 |
Modeler服务器* |
• 使用领先的数据库技术并利用高绩效的数据库实现,使用数据库内挖掘在数据库内建立模型
• 使用SQL-pushback推动数据转换并选择建模算法直接用于您的操作数据库
• 通过并行执行数据流和多种模型,利用包括IBM System z大型机在内的高绩效硬件,可更快创建解决方案并取得更佳
投资回报率(ROI)
• 通过安全套接字层(SSL)加密,可在SPSS Modeler Client和SPSS Modeler Server间安全传输敏感数据
*需要Modeler专业版服务器 |