文档介绍:stata初级入门3-描述性统计指标
一、基本描述统计量
summarize命令
可概括观测值个数、平均值、标准差、最大值和最小值五个指标。
语法:summarize varlist [in] [if] [weight] [,ostata初级入门3-描述性统计指标
一、基本描述统计量
summarize命令
可概括观测值个数、平均值、标准差、最大值和最小值五个指标。
语法:summarize varlist [in] [if] [weight] [,options]
选项:detail可统计方差、偏度、峰度和各个分位数等指标。
范例:summarize price mpg
2022/5/28
2
菜单:Statistics > Summaries, tables, and tests > Summary and descriptive statistics > Summary statistics
2022/5/28
3
tabstat命令
语法: tabstat varlist [if] [in] [weight] [, options]
选项:默认结果是均值。
by(varname) 按变量varname进行分组描述性统计;
statistics(statname [...]) 报告指定的描述性统计指标值。
nototal不报告总体统计值,通常是与by()配合使用
missing用by()选项时,显示by()变量的缺失值也作一类的结果。
范例:tabstat price mpg, by(id) statistics(mean ma mi sd n) missing
2022/5/28
4
菜单:Statistics>Summaries, tables, and tests >Tables>Table of summary statistics (tabstat)
2022/5/28
5
ameans命令
估计算术、几何和调和平均数
语法:ameans [varlist] [if] [in] [weight] [,options]
范例:ameans price
2022/5/28
6
菜单:Statistics > Summaries, tables, and tests > Summary and descriptive statistics > Arith./geometric/harmonic means
2022/5/28
7
二、单个分类变量的汇总统计
tabulate/tab1命令
对分类变量的描述统计是观察其不同类别的频数或百分数。
语法1:tabulate varname [if] [in] [weight] [, options]
语法2: tab1 varlist [if] [in] [weight] [, options]
选项:missing缺失值也作一类,plot作柱状图
范例:tabulate foreign/tab1 foreign id
2022/5/28
8
菜单1: Statistics > Summaries, tables, and tests > Tables > One-way tables
2022/5/28
9
菜单2:Statistics > Summaries, tables, and tests > Tables > Multiple one-way tables
2022/5/28
10
三、两个分类变量的列联表
列联表是考察两个分类变量相关关系的方法
列联表给出从属于两个分类变量不同类别的观测值的频数
如果两个分类变量各有r,c个类别,则列联表共有r×c个单元格
2022/5/28
11
tabulate命令:
语法1——指定两个变量的列联表
tabulate varname1 varname2 [if] [in] [weight] [, options]
范例:tabulate foreign id
2022/5/28
12
菜单:Statistics > Summaries, tables, and tests > Tables > Two-way tables with measures of association
2022/5/28
13
语法2——多个变量内存在的所有可能列联分析结果
tab2 varlist [if] [in] [weight] [, options]
范例:tab2 foreign id rep78
2022/5/28
14
菜单:Statistics > Summaries, tables, and tests > Tab