文档介绍:SAS基础与金融计算游家兴厦门大学经济学院计统系1上节课上机操作(1)对上节课生成的最终数据集total进行如下操作:(1)剔除金融业上市公司;(2)剔除每股收益为负的上市公司;(3)由于数据集中年涨跌幅采用百分比表示,建立一个新的变量,采用小数表示。(4)建立一个新的变量,表示除第一大股东外其它股东所持有的股份比例。2(1)剔除金融业上市公司第一步:运用substr语句Datatest;settotal; code=substr(code,1,6);Run;3第二步:Datatemp1;settest; ifcode='000562'orcode='000001'orcode='000563'orcode='600015'orcode='600016'orcode='600030'orcode='600036'orcode='600816'orcode='600000'orcode='601998'orcode='601328'orcode='601166'orcode='601318'orcode='601398'orcode='601628'thendelete;Run;4(2)剔除每股收益为负的上市公司Datatemp2;settemp1;ifeps<0thendelete;Run;Datatemp2;settemp1;ifeps>=0;Run;5(3)建立新变量:用小数表示的涨跌幅Datatemp3;settemp2;re2=re/100;Run;6(4)建立新的变量表示其它股东持股比例Datatemp4;settemp3;ratio2=1-ratio/100;Run;7本节课上机作业(2)公共信箱下载数据集test1和test2,运用SAS将test1和test2纵向拼成新的数据test。根据股票收益率大小将test分成四个组,并形成四个子数据集:tmp1,tmp2,tmp3,tmp4。在数据集test中,第一大股东持股比例在50%以上且每股收益超过1元的公司有多少家?8描述统计分析常见的数据统计描述量及意义(1)表示分布平均水平和位置的特征量:均值:数据的平均值—Mean众数:观测值中出现最频繁的数值—Mode中位数:观测值排序中处于中间位置的值—Median百分位数:中位数的推广—P1、P33、P999(2)表示分布离散程度的特征量标准差Std方差Var变异系数CV标准误STDEER10