[计算机软件及应用]SAS基本教程
第一章 引 论
第一节 SAS 与统计分析
SAS 系统是美国 SAS 软件研究所的产品,是一个用于决策支持的大型
集成信息系统。SAS 系统经过二十多年的发展,以其卓越的数据处理能力,
为在线数据分析、数据仓库、数据挖掘和决策支持提供了全面的解决方案。
SAS 系统的发展始终离不开它的强大的数据分析功能,而且随着SAS 系统
的发展,其分析功能也与它在信息技术上的发展相辅相成,发展得更加深入、
广泛和强大。
SAS 系统的分析功能是散布在几乎所有的模块之中,较为集中的具有统
计分析功能的是 SAS/STAT、SAS/QC、SAS/INSIGHT、SAS/ETS 等一些模
块。SAS 系统的分析功能也在不断的发展之中,它随时地把用户需要的和学
术研究中得到的一些有效的实用分析方法加入到SAS 的不同模块之中,例如
多变量分析中的偏最小二乘法便是一例。
在 SAS 系统分析功能的使用上,除了提供编程调用外,SAS 对一些常
用的分析功能都提供了简便的菜单系统,使用户不用编程就可以享用 SAS
的许多深入的分析功能。对常用的一些统计分析方法而言,SAS/INSIGHT、
分析员应用和直接编程都可以达到同样的目的。一般来说,SAS/INSIGHT
最为直观,便于步步深入;分析员应用可提供自动形成的程序,而且在属性
数据分析和功效函数计算方面较 INSIGHT 强;编程是功能最强的,尤其是
一些特殊或深入的分析功能只能用编程实现,但相对来说,编程较难熟练掌
握。下面我们就结合 SAS/INSIGHT 和分析员应用来介绍常用的一些统计分
析方法。
第二节 SAS/INSIGHT
SAS/INSIGHT 是一个交互式的数据探索和分析的工具,用这一软件
可以:
l 通过多窗口连动的图象和分析结果,对数据进行探索
l 分析单变量分布
l 用相关和主成分研究多变量间的关系
l 用方差分析和回归分析说明、拟合变量间关系的模型
一、 区间型变量 ( interval variable ) 和列名型变量( nominal variable ):
在SAS 数据集中,变量的两种类型为:
l 字符型变量
l 数值型变量;
1
在SAS/INSIGHT 中,为了区分变量在分析中的不同作用,变量又按其测
量水平分为:
l 区间型变量: 区间型变量必须是数值型变量,可以对其观测值进行
各种四则运算,计算各种统计量;
l 列名型变量:列名型变量可以是数值型的,也可以是字符型的,在
INSIGHT 中常起分类作用。
字符型变量只能是列名型的,对取值不多而用以区分不同类别的数值型变
量也可看作列名型的。
在缺省情况下,INSIGHT 对所有数值型变量冠以区间型测量水平,对所
有字符型变量冠以列名型测量水平。在有需要时,也可将数值型变量冠
以列名型测量水平。
二、 调用SAS/INSIGHT:
1、 方法 1:在命令行键入Insight → 打开数据集(DTS. BCLASS);
2 、 方法2:打开下拉菜单选 解决方案 → 分析 → 交互式数据分析
→ 打开数据集(DST. BCLASS)。
3、 数据窗口介绍:
1 ) 窗的左上角给出了变量数和观测值个数;
2 ) 每个观测值置以一个观测序号,观测序号前的符号表示该观
测在作图时使用的符号和颜色;
3 ) 数据集的变量在数据窗的顶部标明,每个变量都标以区间型
( Int ) 或列名型 ( Nom ) 的。
三、 Insight 功能概述:
l File 栏目下提供读入数据集,存储数据集、分析结果的表格和
本文链接:https://my.lmcjl.com/post/11913.html
4 评论