金融数据处理技术

金融数据处理技术

 

课程名称:CUR341 金融数据处理技术 Financial Data Processing Technology

课程性质:本学院选修,实验课程

学分课时:2学分,32课时,其中实验课时15

主讲教师:冯建芬副教授  

所属院系:金融学院金融工程系

  电话:64495048; E-mail:jianfen_feng@UIBE.EDU.CN

教学对象:金融学院大学二年级学生

考核方式:课下作业(10%),每章一次,提交程序和结果数据集

课堂实验(10%),每章1-2次,共计8次实验,提交程序和结果数据集,

期中考试(小组数据处理报告)(30%)

期末考试:开卷上机笔试(50%)

其中平时成绩包括课下作业和课堂实践,占20%, 期中成绩占30%,期末考试占50%

学术诚信:本课程对于学生的学术诚信的要求遵从《对外经济贸易大学学生违纪处分条例》、《对外经济贸易大学学生学习违纪处分实施细则》、《对外经济贸易大学考场纪律》的规定。 

教学方式:课堂讲授占比30%,上机实验占70%,教学中强调动手能力,采用实验教学、实践教学和研讨教学相结合的方式。教学全程在金融实验室完成,结合SAS软件、Ocale实验教学平台、金融数据库和PPt进行教学。 

出勤要求:遵从《对外经济贸易大学本科生课堂学习规范》,要求学生关闭一切电子设备;不能无故缺席上课;上课专心听讲,积极参与课堂讨论;课后认真复习课堂上讲授内容,独立完成教师布置的任务;并预习新课。学生缺勤不得多于总课时的四分之一。教师可以根据考勤情况决定学生是否可以参加考试、是否扣分。

一、课程简介:

本课程通过大量案例,借助数据处理和分析软件SAS,学习处理金融数据的方法和技术,是一门金融和计算机紧密结合的实践性非常强的综合课程。内容涉及:金融数据处理与分析软件(SAS)的基本应用、金融数据的批处理技术、常见统计分析方法的应用及金融数据处理案例分析等。主要教学内容有:数据文件在不同数据库间的格式转换、数据筛选与清洗技术、循环处理技术、同时处理多个文件的数据批处理技术(宏编程技术)等。

二、教学目标

本课程的教学目的是弥补学生在数据处理环节的不足,提高其金融数据处理与分析能力,为金融计算、金融时间序列、金融风险定量分析等后续课程学习及金融实践提供技术支持,为提高本科生的科研能力和实践能力排除障碍。

三、课程学习资料

1.教材

  《SAS编程技术教程》(第2版),朱世武, 清华大学出版社,2013。

2.参考资料

《SAS编程技术教程》(第1版),朱世武, 清华大学出版社,2007。

《The little SAS book》, Delwiche,Lora D. and Slaughter, Susan J., 2003, NC: SAS Institute Inc.

《BASE SAS软件使用手册》,高惠璇等,编译,中国统计出版社,1997年

《SAS编程与数据挖掘商业案例》,姚志勇,机械工业出版社,2010.

《Using SAS in Financial Research》, Boehmer,Ekkehar,John Paul Broussard and Juha-Pekka Kullunki,2002, NC: SAS Institute Inc.

《金融计量学》,张宗新,中国金融出版社,2012.

《SAS 统计分析与数据挖掘》,谢龙汉,尚涛, 电子工业出版社,2013.

四、学习效果及达成途径

   1.学习效果:

  通过本课程的学习,希望达成的学习效果如下:

  1).掌握SAS的BASE SAS模块的语法,理解SAS处理数据的原理,能够熟练的编制SAS完整的程序。

2).能够使用SAS对金融数据进行各种文件格式间的转换,并通过SAS熟练地访问和生成各种数据库文件、PC文件。

3).能够通过SAS查询金融数据库数据,远程访问金融数据终端。

4).掌握基于SAS软件的金融数据的各种清洗技术,包括研究数据的筛选、数据查询、缺失值处理、日期格式数据处理、多个数据表的纵向合并、横向合并、多表查询、单表查询、数据表记录的添加、删除、更新。

5).掌握SAS帮助系统的查询和学习方法,能够自主利用SAS帮助系统学习其强大的统计分析功能、金融计量功进行金融数据挖掘;

6).掌握基于SAS的海量数据的批处理技术

7)掌握SQL数据库查询语言在SAS中的应用,能够灵活运用SQL语言进行多表数据的查询和链接。

2.达成学习效果的途径

 善于动手,课前完成例题程序的上机任务;上课跟着老师思路走,积极参与课堂讨论;充分利用实验教学平台的讨论区和教师指定的答疑时间及时答疑解惑;按时完成课堂实践任务和课下作业,协同完成小组金融实践任务,认真准备期末考试。

五、教学进度计划表 

本课程教学周为16 周,具体安排如下

周次

内容提要

教学方式

参考资料

作业与考试

1

第一讲:认识SAS

讲授、实验

教材第1

课堂上机

2

第二讲:SAS的数据存储与读取

2.1 SAS对数据文件的管理

2.2建立数据集,读入原始数据

讲授、实验

教材第2,3章,第4章:4.1-4.4,4.14,第8章,第9章

 

3

学生实践:建立逻辑库,建立数据集,读入数据

实验

课堂实践测验

4

2.3 输出原始数据

讲授、实验

 

5

学生实践:外部文件与SAS的数据传输:导入与导出

实验

课堂实践测验;课下作业

6

第三讲:查询语言SQL

3.1 SQL过程与SQL语言简介

3.2 从单个表中查询和加工数据

3.3 从多个表中查询和拼接数据

讲授、实验

教材13,14章

课下作业

7

学生实践:利用SQL语言查询和加工数据

实验

 

课堂实践测验

8

第四讲:数据集的编辑与修改

4.1 改变变量或数据集的属性

4.2 变量和观测的选择

讲授、实验

第4章4.5, 4.6, 4.7, 4.8, 4.11, 4.12;第5章,第6章

 

9

学生实践:对数据的初步处理,变量和观测的选择

实验

课堂实践测验课下作业

10

4.3变量编辑与观测的修改

4.3.1 数据集拼接增加变量和观测

4.3.2 利用表达式与函数修改观测

讲授、实验

 

11

4.3.3 利用循环语句修改观测和变量

4.3.4 利用数组修改观测

讲授、实验

课下作业

12

学生实践:数据的进一步处理技术,变量与观测的修改技术应用

实验

课堂实践测验;

布置小组金融实践任务

13

第五讲:宏编程技术

5.1 宏变量的定义与引用

5.2 宏的定义与调用

5.3 宏程序语句和宏函数

5.4 数据步接口程序

讲授、实验

教材第16

课下作业

14

学生实践:宏技术的应用—宏与数据批处理技术

实验

 

课堂实践测验

15

第六讲:过程步的应用

讲授、实验

教材第11,12

课下作业

16

学生小组演示报告

研讨

 

小组作业研讨

17-18

期末考试(学校统一安排考试时间及地点)

 

 

 

六、教学内容:

第一章:SAS入门

【教学目的和要求】

使学生了解SAS的基本操作界面和操作窗口,指导学生如何使用SAS强大的帮助系统,并通过部分案例使学生了解SAS的数据处理功能。

【主要内容】

1.1 SAS软件介绍

 1.2 SAS工作界面

 1.3 SAS窗口操作

 1.4 SAS帮助文档

 1.5 SAS安装

教学总时数:2,其中实验课时1课时

参考资料:《SAS编程技术教程》第二版,第一章

参考资料:《SAS编程技术教程》第二版,第一章

作业与练习(课上实验,1课时):

1.关闭日志窗口、输出窗口、编辑器窗口,重新打开上述三个窗口;(使用快捷键)

2.关闭资源管理器,停放资源管理器;

3.关闭结果窗口,停放结果窗口;

4.通过菜单建立逻辑库,删除逻辑库;

5. 打开程序”例1-1class程序”,运行程序,另存程序;

6. 建立新的程序,输入如下代码:

options noxwait;

x md F:data;

libname data "F:data";

libname data clear;

7. 逐行执行程序;保存新的程序;

8.清楚日志窗口的内容;

 

第二章:SAS的数据存储与读取

【教学目的和要求】

使学生掌握如何建立SAS的数据集,以各种方式读入数据进行存储,包括直接输入方式、数据集导入方式、外部文件(excel文件、txt文件、access文件,ODBC数据源、SPSS文件等)导入方式,并掌握如何将SAS数据集中的数据以各种方式展现或导出到外部文件。

【主要内容】

2.1 SAS对数据文件的管理;

2.1.1 SAS逻辑库与SAS数据集功能及其属性

2.1.2 建立逻辑库,读入文件;

2.2 建立数据集,读入原始数据;

2.2.1 建立空数据集

2.2.2 直接对变量赋值建立数据集

2.2.3 直接输入数据建立数据集

2.2.4 从其他数据集导入数据建立数据集

2.2.5 从外部文件导入数据建立数据集

2.3 输出原始数据

2.3.1 输出到Log窗口

2.3.2 输出到输出窗口;

2.3.3 导出的外部文件;

教学总时数:8,其中实验课时4课时

参考资料:1.《SAS编程技术教程》第二版,第二章,第三章,第四章:4.1-4.4,4.14,第8章,第9章

2.SAS系统帮助目录:SAS 产品àBase SASàSAS语言字典à语言元素字典

作业与练习:

课堂实验12课时):

1.通过菜单操作和libname语句分别建立几个逻辑库,分别指向如下文件夹:

 

2. .建立各种空数据集

3.完成利用x发布主机操作命令的任务

4.完成注释语句的实验任务

5.通过赋值建立数据集的实验任务

6.完成通过数据行读入数据建立数据集的任务

课堂实验22课时)

1. 利用import过程导入数据的实验任务。

2. 利用 input-infile语句导入文本数据的任务。

3. 利用put语句输出数据到log窗口

4. 利用print过程将结果输出到输出窗口

5. 利用export过程将数据导出到外部文件

6. 利用file-put语句将数据导出到文本文件

课下作业:

1)利用x命令,获取data文件夹中文件名前三个字符是stk的文件,将其存储到文件name.txt;

2)查找帮助,尝试在SAS的命令栏使用下列SAS命令,并说明其作用:keys, dlglib, libname, dir, var,submit, recall.

3)将name.txt中的内容读入到SAS数据集hwork.a, 变量名为name, 长度为9($9.),要求不能在同一行读入两条记录(@)。(infile-input语句)

4)将hwork.a中的变量name输出到外部文件hongstk.txt,每一个变量记录添加字符串,如:stk000001 变为:%stk(stk000001, result);

5) 登陆锐思数据网站(账号:uibe/ 密码:uibe) :www.resset.cn参考输出设置部分的“格式说明”文档,分别下载如下格式的数据源,下载条数为500条,且将其转换为SAS数据集。要求设置好环境,并给运行结果正确的程序。

逗号分隔文本(*.CSV)

空格分隔文本(*.TXT)

Tab键分隔文本 (*.TXT)

EXCEL电子表格(*.XLS)

字符型EXCEL电子表格 (*.XLS)

6)用PUT和FILE语句写SAS程序,将数据集data.class直接输出为外部TXT文本。

7)在数据集中建立100个变量。