计算机软件必须会sas软件吗,[计算机软件及应用]SAS基本教程.pdf

[计算机软件及应用]SAS基本教程

第一章 引 论

第一节 SAS 与统计分析

SAS 系统是美国 SAS 软件研究所的产品,是一个用于决策支持的大型

集成信息系统。SAS 系统经过二十多年的发展,以其卓越的数据处理能力,

为在线数据分析、数据仓库、数据挖掘和决策支持提供了全面的解决方案。

SAS 系统的发展始终离不开它的强大的数据分析功能,而且随着SAS 系统

的发展,其分析功能也与它在信息技术上的发展相辅相成,发展得更加深入、

广泛和强大。

SAS 系统的分析功能是散布在几乎所有的模块之中,较为集中的具有统

计分析功能的是 SAS/STAT、SAS/QC、SAS/INSIGHT、SAS/ETS 等一些模

块。SAS 系统的分析功能也在不断的发展之中,它随时地把用户需要的和学

术研究中得到的一些有效的实用分析方法加入到SAS 的不同模块之中,例如

多变量分析中的偏最小二乘法便是一例。

在 SAS 系统分析功能的使用上,除了提供编程调用外,SAS 对一些常

用的分析功能都提供了简便的菜单系统,使用户不用编程就可以享用 SAS

的许多深入的分析功能。对常用的一些统计分析方法而言,SAS/INSIGHT、

分析员应用和直接编程都可以达到同样的目的。一般来说,SAS/INSIGHT

最为直观,便于步步深入;分析员应用可提供自动形成的程序,而且在属性

数据分析和功效函数计算方面较 INSIGHT 强;编程是功能最强的,尤其是

一些特殊或深入的分析功能只能用编程实现,但相对来说,编程较难熟练掌

握。下面我们就结合 SAS/INSIGHT 和分析员应用来介绍常用的一些统计分

析方法。

第二节 SAS/INSIGHT

SAS/INSIGHT 是一个交互式的数据探索和分析的工具,用这一软件

可以:

l 通过多窗口连动的图象和分析结果,对数据进行探索

l 分析单变量分布

l 用相关和主成分研究多变量间的关系

l 用方差分析和回归分析说明、拟合变量间关系的模型

一、 区间型变量 ( interval variable ) 和列名型变量( nominal variable ):

在SAS 数据集中,变量的两种类型为:

l 字符型变量

l 数值型变量;

1

在SAS/INSIGHT 中,为了区分变量在分析中的不同作用,变量又按其测

量水平分为:

l 区间型变量: 区间型变量必须是数值型变量,可以对其观测值进行

各种四则运算,计算各种统计量;

l 列名型变量:列名型变量可以是数值型的,也可以是字符型的,在

INSIGHT 中常起分类作用。

字符型变量只能是列名型的,对取值不多而用以区分不同类别的数值型变

量也可看作列名型的。

在缺省情况下,INSIGHT 对所有数值型变量冠以区间型测量水平,对所

有字符型变量冠以列名型测量水平。在有需要时,也可将数值型变量冠

以列名型测量水平。

二、 调用SAS/INSIGHT:

1、 方法 1:在命令行键入Insight → 打开数据集(DTS. BCLASS);

2 、 方法2:打开下拉菜单选 解决方案 → 分析 → 交互式数据分析

→ 打开数据集(DST. BCLASS)。

3、 数据窗口介绍:

1 ) 窗的左上角给出了变量数和观测值个数;

2 ) 每个观测值置以一个观测序号,观测序号前的符号表示该观

测在作图时使用的符号和颜色;

3 ) 数据集的变量在数据窗的顶部标明,每个变量都标以区间型

( Int ) 或列名型 ( Nom ) 的。

三、 Insight 功能概述:

l File 栏目下提供读入数据集,存储数据集、分析结果的表格和

本文链接:https://my.lmcjl.com/post/11913.html

展开阅读全文

4 评论

留下您的评论.