文档介绍:3 数据数据文件是一个矩形的矩阵,这个矩阵的每一行都代表或对应着一个“观测单位”(比如是一个人,一个村或一个地区等等),矩阵的每一列都代表或对应着一个“变量”(比如年龄,身高、体重,月工资收入等等)。因此,数据文件矩阵中的每一个元素( case )都代表或对应着某一个“观测单位”(如张三、李四, A 厂、 B 厂)中的某一个“变量”(比如年龄、体重,月收入等等)的变量值或观察值。 打开示例数据和网络数据: use 示例数据示例数据为 STATA 帮助文件中所用的数据, ,如果在 STAT A 软件当前路径下,直接用 use 命令即可打开,如果不在当前路径下,则可以使用 sysuse 命令打开。. use auto ,clear //打开汽车数据 . cd d:///改变路径到 d:/ . use auto , clear file not found //系统提示无法找到文件,因为 不在 d:/ r(601); . sysuse auto ,clear //无论当前路径是什么,该命令均能打开系统自带文件示例数据 A uto : 美国 1978 年汽车数据,包括产地、车名、行使里程、重量等变量 B plong 血压数据 C ancer 药物实验生存数据 C ensus1980 年美国分州人口普查数据 C itytemp 美国城市气温数据 E duc99gdp 教育与 GDP 关系数据 G np96 美国 1967-2002 年的 GNP 数据 L ifeexp 预期寿命数据 N lsw88 美国年轻妇女研究数据 P op2000 美国 2000 年人口普查数据 S p500 S&P500 历史数据 U slifeexp 美国预期寿命 1900-1999 V oter 美国 1992 年选举民意调查数据 从网络获取数据上述示例数据可能没有全部下载安装于你的电脑中,因此简单地使用 use 和 sysuse 命令时,可能出现错误,如. use nlswork , clear file nlswork .dta not found 此时,如果确定该数据为示例数据,可以直接通过网络获取,其命令为: . use .com/data/r9/nlswork //从网站获取数据,或者. webuse nlswork , clear //与前一命令等价,从 STATA 官方数据库获取数据 webuse 这一路径获取数据, 如果不是该网站的数据, webuse 失效, 只能把网站地址完全写出来。,我们所用的《计量经济学导论》一书中所使用的全部数据都可以通过该数据中心获得。比如. use http://fm-p/data/wooldridge/CEOSAL1 即打开教材中例 中所使用的 CEO 数据。 use 命令只能打开后辍名为“*.dta ”格式的数据, .dta 格式以外的数据, STAT A 不能直接读取,需要从外部读入,最简单而直接的办法是复制和粘贴,但有时没有其他软件,比如有 SAS 格式或 SPSS 格式的数据,但没有 SAS 软件和 SPS S 软件,此时需要用 STATA 提供的其他命令或者使用 transfer 数据格式转化软件。在讨论其他输入或导入数据的方法之前,我们先来学****一点数据类型的知识。 数据类型 STATA 通常把变量划分为三类:分别是数值型,字符型和日期型 数值变量: 用0、1、2…9及+、–(正负号)与小数点“(.)”来表示。在输入数据时, 逗号不能被识别,如 1,024 应该直接写成 1024. 其他示例 5- +3 -2 后面两个数据为科学计数法的数据,分别表示 5200 . 其中的 e 相当于10,因此 +3 的意思是: *10 3=5200 数值型变量按其精度区分,又有五种类型,分别是: 存贮类型最小最大 0-领域字节--------------------------------------------------------------------- byte -127 100 +/-1 1 int-32,767 32,740 +/-1 2 long -2,147,483,647 2,147,483,620 +/-1 4 float -*10^38 *10^36 +/-10^-36 4 double -*10^307 *10