IBM SPSS Modeler字段类型

原创
2016/04/15 11:08
阅读数 7.8K

SPSS Modeler软件“类型”节点对于数据字段的一下具体含义,更详细的参考IBM官方的文档

一、字段类型解释

1、默认。具有未知存储类型和值的数据(例如,由于其尚未被读取)将显示为<默认值>。


2、连续。用于描述数字值,如范围 1-100的连续数值 。


3、离散。用于字符串值(可取的值的确切数量未知时)。读取数据后,将指定为标志、集合或无类型。


4、标志。用于表示两个不同的值,如0和1,ture和false。


5、集合(名义)。 用于描述具有多个不同值的数据,其中的每个值都被视为集合的一个成员,如 small/medium/large。


6、有序集合。用于描述具有顺序固定的不同值的数据。例如,1, 3, 5 是某个整数集合的默认排列顺序,而 HIGH, LOW, NORMAL(按字母升序)是某个字符串集合的顺序。任何能够使用集合字段的位置使用有序集合字段。


7、无类型。用于不属于任何上述类型的数据。

也可根据“类型”节点根据读取的值来做判断和指定,能自己指定还是自己指定吧,如果“数据源”的节点是Excel的话,只能通过读取值来指定类型,自己手动是无法设置的。

二、基于Excel数据源的类型设置

例如:“数据源”的节点是Excel,还未读取值的时候,“类型”节点显示的信息

点击读取值后,这时候,即使我们指定第二个字段为“连续”类型也没用,读取值后,还是会变成“集合”类型,但是可以设置成“有序集合”

三、基于可变格式的字段设置

数据是相同的,把上个例子的Excel复制到了txt文档

读取值时,部分字段没有达到我的预期

这时候是可以指定相关字段的类型的,比如我设置了两个“标志”,其中第四个字段,可用“连续”、“集合”、“有序集合”,但是用“离散”是不行的

附:本次测试使用的数据的截图

展开阅读全文
打赏
1
0 收藏
分享
加载中
更多评论
打赏
0 评论
0 收藏
1
分享
返回顶部
顶部