1 / 95

SAS 基础培训课程

SAS 基础培训课程. SAS Institute (Shanghai) Co., Ltd. SAS 系统. SAS 系统是用于数据分析与决策支持的大 型集成式模块化软件包。 ( 其早期的名称为 S tatistical A nalysis S ystem ). SAS 系统是用于决策支持 的大型集成信息系统. SAS 系统主要完成以数据为中心的四大任务 : 数据访问 数据管理 数据呈现 数据分析 . SAS 系统介绍. The SAS System. 数据访问. 数据管理. 分 布 式

tokala
Télécharger la présentation

SAS 基础培训课程

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. SAS 基础培训课程 SAS Institute (Shanghai) Co., Ltd.

  2. SAS系统 • SAS系统是用于数据分析与决策支持的大型集成式模块化软件包。 • (其早期的名称为 • Statistical Analysis System )

  3. SAS系统是用于决策支持的大型集成信息系统 • SAS系统主要完成以数据为中心的四大任务: • 数据访问 • 数据管理 • 数据呈现 • 数据分析

  4. SAS 系统介绍 The SAS System 数据访问 数据管理 分 布 式 计 算 环 境 Base SAS GRAPH, GIS, CALC, INSIGHT, SPECTRAVIEW, ASSIST Base SAS,STAT,ETS, OR,QC,IML,INSIGHT, NNA,LAB, SPECTRAVIEW 开 发 工 具 AF EIS FSP CONNECT SHARE IntrNET DATA Base SAS ACCESS MDDB Server ODBC Base SAS FSP SHARE CONNECT ASSIST Warehouse Admin. MDDB Server 数据分析 数据呈现

  5. SAS系统的构成 • SAS系统是一个可由几个到二、三十个工具模块及面向行业的子系统组成的可伸缩系统。其模块按功能大体有四类: • 数据库及其管理 • 面向对象的4GL开发平台 • 各类堪称行业标准的分析工具 • 方便用户的外层技术(多平台支持,开 放环境,网络计算及分布处理)

  6. SAS 系统软件由模块构成 • 数据库部分:BASE SAS, FSP, ACCESS,.. • 分析核心:STAT, ETS, QC, OR, IML, . . . • 开发呈现工具:AF, EIS, GRAPH, . . . • 分布处理与数据仓库:CONNECT, WA, ..

  7. 数据 进入 组织 利用 提交信息(Information Delivery):SAS的核心业务 信息 知识 输出 管理

  8. SAS系统简介 • 要 求 • 进入SAS系统 • 发常用命令,切换窗口 • 进Assist和Desktop窗口

  9. 启动SAS:在Windows桌面系统下双击SAS图标 SAS系统简介§1 SAS 提供的基本运行环境 或运行SAS系统目录下(例C:\SAS)的可 执行程序sas.exe 常用的是交互运行方式。也可用提交批作业 方式运行的

  10. SAS系统简介§1 SAS 提供的基本运行环境 • SAS 为交互方式运行提供的环境 • 显示管理系统下拉菜单(弹出菜单) • 命令框、工具栏 • 三个基本窗口 • PROGRAM EDITOR 窗口 • LOG 窗口,OUTPUT 窗口 工作界面介绍

  11. 访问和编辑已有的SAS程序 编写新的SAS程序 递交SAS程序 将SAS程序存为文件 是一个基本的敞口,缺省地打开 依次记录程序输出的结果 有结果输出时自动转到前台 是一个基本的窗口,缺省地打开 依次记录SAS进程中各程序运行的信息 可用命令清空 SAS系统简介§1 SAS提供的基本运行环境--三个基本窗口

  12. SAS系统简介§1 SAS 提供的基本运行环境 • SAS常用的交互式运行方式: 用SAS编程实现各种任务 用SAS提供的菜单系统实现各种任务 用SAS/ASSIST 用SAS桌面系统

  13. SAS系统简介§1 SAS 提供的基本运行环境 • 在交互式操作中用命令指挥显示管理系统、切换窗口和完成各种特定的功能 • 发布命令有四种方式: • 在命令框直接键入命令; • 使用下拉菜单; • 使用工具栏。 • 按功能键; 发命令

  14. SAS系统简介§1 SAS 提供的基本运行环境 • 常用的其它窗口: • KEYS 查看及改变功能键的设置 • LIBNAME 查看已存在的SAS数据库 • DIR 查看某个SAS数据库的内容 • VAR 查看SAS数据集的有关信息 • OPTIONS 查看及改变SAS的系统设置

  15. SAS系统简介§1 SAS 提供的基本运行环境 • 进入SAS/ASSIST • 使用工具栏图标 • 发命令ASSIST • 下拉菜单选 GlobalsASSIST 进入SAS桌面系统 发命令DESKTOP 下拉菜单选 Globals Desktop 进菜单系统

  16. SAS系统简介 § 2 运行一个简单的SAS程序 • 运行一个简单的 SAS 程序:在 PROGRAM EDITOR窗口中键入程序: • 提交程序(SUBMIT) • 查看 LOG窗口的信息 • 调出提交的程序(RECALL)并修改,再次提交 • 在 OUTPUT窗口查看运行结果 • 存储程序 P005

  17. SAS系统对数据的管理 • 要 求 • 设定、浏览SAS数据库 • 打开SAS数据集及其变量窗口

  18. SAS系统对数据的管理 • SAS对数据的分析与呈现都是面对SAS数据集进行的 • SAS数据集是一种SAS文件 • SAS文件是由SAS系统创建和管理的有特殊结构的文件。包括 SAS数据集和SAS目录册(CATALOG)等

  19. SAS系统对数据的管理 数据直接输入 流行的数据库 其它文件格式 SAS数据集 SAS应用程序

  20. SAS系统对数据的管理§1 SAS 数据库 • SAS数据集存储在SAS数据库中SAS数据库还存储其它SAS专用文件 • SAS数据库文件用两级命名方式定名:libname.SAS-filename • (库标记.文件名) SAS数据库 SAS数据集

  21. SAS系统对数据的管理§1 SAS 数据库 • SAS数据库有永久库和临时库两种 • 临时库:名为WORK,系统自动指定 • 永久库:系统自动指定名为SASUSER,(SASHELP等). 其它可由用户指定

  22. SAS系统对数据的管理§1 SAS 数据库 • 用工具栏中的图标进入库管理对话窗或键入命令 Dlglib 或 Global  Access  Display Liberary可进入库管理窗口浏览库内容和库文件 • 或用LIBNAME命令进入Libname窗口用DIR 命令进入Dir窗口用VAR 命令进入Var窗口 操作:看库

  23. SAS系统对数据的管理§1 SAS 数据库 • 不同的主操作系统下SAS数据库文件以不同方式与主操作系统下的文件组织相联系 • 在Windows下每个SAS数据库置于某个子目录之中 • 例:SASUSER: C:\SAS\SASUSERWORK: C:\SAS\SASWORKCOURSE: C:\USERS\ZDW

  24. SAS系统对数据的管理§1 SAS 数据库 设定 • 用工具栏中的图标进入库管理对话窗,按下New Library按键 • 使用LIBNAME语句可以指定SAS库标:LIBNAME 库名 SAS数据库挘 • 在Windows环境下:LIBNAME 库名 目录名挘LIBNAME course ‘c:\course’; 连库 Libname 库名 ('目录1' '目录2')

  25. SAS系统对数据的管理§2 SAS 数据集 • 两种类型的数据对象: • SAS数据集(Data sets):包含描述部分和数据部分 • SAS数据视窗(Data View):只含描述部分 • (变量名,属性,长度,标题 格式,创建与修改日期)

  26. SAS系统对数据的管理§2 SAS 数据集: 描述部分

  27. SAS系统对数据的管理§2 SAS 数据集: 描述部分 • Global  Access  Display Liberary . . . • Desktop  SAS Explore  File  Pop menu  Contents • Ass  D.Manag.  Utilities  Contents..  B & E  Dst Attr. Proc contentsdata=SAS数据集 <position>; run;

  28. SAS系统对数据的管理§2 SAS 数据集: 数据部分 SAS数据集的数据部分是由数据构成的矩形表 变 量(字段、列) 记录 或行 缺失值(Missing Value)。 字符型变量的缺失值用空格符表示 数值型变量的缺失值用句号“ . ”表示

  29. SAS系统对数据的管理§2 SAS 数据集看数据集 • 用工具栏中的图标进入库管理对话窗 选中数据集 在弹出菜单选 Open table view • 发命令:VT(或FSV)数据集名 • 提交程序: proc print data=数据集名; run;

  30. 浏览和编辑SAS数据集 • 要 求 • 使用ViewTable浏览、编辑和新建SAS数据集 • 使用Proc Print输出SAS 数据集 在SAS系统中浏览和编辑SAS数据集必须先设定SAS数据库,将要浏览和编辑的数据集存放在已设定的SAS数据库中

  31. 浏览和编辑SAS数据集§1 使用Viewtable 浏览与编辑 • Viewtable 提供一个显示数据集的窗口。它具有对数据集的浏览、编辑和创建的功能 • Viewtable 提供两种显示数据集的方式: • Table View以矩阵表格形式显示数据,一次可显示多条记录 • Form View一次只显示一条记录

  32. 浏览和编辑SAS数据集§1 使用Viewtable 浏览与编辑 • 如何进入Viewtable窗: • 在SAS浏览器或数据库对话窗中双击数据集图标 • 键入命令:VT 数据集名

  33. 浏览和编辑SAS数据集§1 使用Viewtable 浏览与编辑 • 除了Viewtable窗口外,FSV等也提供了字符型界面的数据集的浏览和编辑的窗口,它打开数据集的速度更快。 • Insight和Analyst Application也提供了对数据集浏览和编辑的窗口,他们在生成新变量方面有更强的功能

  34. 用VIEWTABLE FSEDIT FSVIEW 编程:用DATA步 用Import菜单 用SAS/ACCESS 浏览和编辑SAS数据集§2 用Viewtable新建数据集 建立SAS数据集的各种途径 数据存于纸上 需直接键入 数据存于文本文件 数据存于流行 数据库文件中

  35. 浏览和编辑SAS数据集§2 用Viewtable新建数据集 设定变量属性 • 为了新建一个SAS数据集,一般应该先规定输入变量的属性(变量名,标题名,类型,长度,输入输出格式)。 • 对格式和其它属性无特殊要求的也可先输入数据,而后设定各个变量的属性。 • 命令:VT。选中变量名在弹出菜单选Column Attributes 先输入数据举例.另法:File=>Add Item=>Table

  36. 浏览和编辑SAS数据集§2 用Viewtable新建数据集 设定变量属性 • 数据集变量的属性描述: • 变量名(Name):字母或下划线开始且不超过8个字符或数字构成 • 类型(Type):数值型、字符型 • 长度(Length):缺省8字节(  200) • 标题名(Label): 缺省40字节 • 输入格式(Informat):$输入格式名w.d • 输出格式(Format): $输出格式名w.d 必须 可选

  37. NAME SEX POSITION AGE SALARY Alex M A 35 1500 Linda F 28 1400 Simon M C 45  浏览和编辑SAS数据集§2 用Viewtable新建数据集 设定变量属性 • 在数据集的一条记录的某个变量无数据时,称为缺失值(Missing Value)。 • 字符型变量的缺失值用空格符表示 • 数值型变量的缺失值用句号“ . ”表示

  38. 浏览和编辑SAS数据集§2 用Viewtable新建数据集 设定变量属性 • 输入、输出格式例: 输入格式 输入数据 8.2 comma8.2 dollar8.2 12234.1234 12,234.1234 $12,234.1234 实际存储 数据值 12234.12 输出格式 输出数据 8.2 comma8.2 dollar8.2 12234.12 12,234.12 $12,234.12

  39. 输出格式 输出数据 20OCT1997 102097 97-10-20 date9. mmddyy6. yymmdd8. 浏览和编辑SAS数据集§2 用Viewtable新建数据集 设定变量属性 • 日期输入、输出格式例: 1960,1,10 1960,1,21 1960,2,131 1961,1,1366 输入格式 输入数据 DATE7. DDMMYY8. yymmdd10. 20OCT97 20/10/97 1997/10/20 实际存储 数据值 13807 转换:data _null_; x=put(today(), date7.);put x;run; datetry

  40. 浏览和编辑SAS数据集§2 用Viewtable新建数据集 设定变量属性 • 几种常用的输入、输出格式: w.d $w. COMMAw.d DOLLARw.d DATEw. MMDDYYw. 标准的数字型格式 标准的字符型格式 数字中嵌入逗号 数字中嵌入逗号,前加$ 日期格式 日期格式

  41. 浏览和编辑SAS数据集§2 用Viewtable新建数据集 设定变量属性 • 利用HELP查找SAS系统提供的输入、出格式 SAS System Help下拉菜单 目录: SAS Language 索 引: SAS Informats and Formats -- Contents SAS Formats and Informats 从函数名找 从分类功能找

  42. SAS编程基本概念 • 用户提交的 SAS 程序由许多程序步构成。 数据步常用于创建数据集 原始 数据 过程步 Proc Step 报告 数据步 Data Step SAS表 SAS表 过程步常用于处理数据集(生成 报表、图形和实现数据分析功能)

  43. SAS编程基本概念 • SAS的程序由两种程序步(Step)构成: • 数据步(DATA STEP):以(DATA)语句开始,创建和处理SAS数据集 • 过程步(PROC STEP): 以(PROC)语句开始,用于处理SAS数据

  44. SAS编程基本概念 • SAS的每个程序步都由语句构成。 • 每个语句常以开始的关键词称呼,用分号表示语句的结束。 • SAS语句书写的格式较为任意 • 语句可以在任一列开始和结束 • 词间可任意加入空格和换行 • 一个语句可跨多行,多个语句可写在一行 • 良好的书写格式便于程序的阅读 看例e029, e029_2

  45. 浏览和编辑SAS数据集§3 打印数据集 • 基于数据集的报表从其内容来看大体有两类: • 一类是提供数据集的详细数据为主,在SAS 中是采用Report窗口或用过程print或report • 另一类是只含各种分类的汇总信息,在SAS 中是采用过程 tabulate 或与此联系的菜单窗口

  46. 编程: PROC PRINT DATA=SAS-data-set; RUN; 浏览和编辑SAS数据集§3 打印数据集

  47. 浏览和编辑SAS数据集§3 打印数据集 • PROC PRINT DATA=SAS-data-set <NOOBS>; • ID variable; • VAR variables; • WHERE where-expression; • SUM variables; • BY by-variables; • PAGEBY by- variables; • RUN;

  48. 浏览和编辑SAS数据集§3 打印数据集Format的使用 • 若数据集形成时已为变量规定format,则在打印输出时自动运用这一format。 • 在打印程序中使用format语句,可为变量临时设定使用的format。 format语句的形式为 FORMAT variables format; 例 format date yymmdd10.;

  49. 浏览和编辑SAS数据集§3 打印数据集Format的使用 • FORMAT语句: FORMAT variables format; 定义用户格式: PROC FORMAT; VALUE format-name range1=label range2=label . . . . . ;

  50. 浏览和编辑SAS数据集§3 打印数据集Label的使用 • LABEL variable1=label • variable2=label • . . . . . . . . . .; Label语句: Print 选项: SPLIT=符号

More Related