Stata统计分析软件
Stata是一套完整的、集成的统计分析软件包,可以满足您用于数据分析、数据管理和图形的所有需要,尤其是面板数据的处理。
功能概述:
数据管理
数据转换、匹配-合并、ODBCXML、分组处理、追加文件、排序、行列转置和标注等。
基础统计
汇总、列联表、相关、t检验、等方差检验、比例检验和置信区间等。
线性模型
回归、bootstrapjackknife和稳健Huber/White/sandwich方差评估;工具变量(instrumental variable);三阶段最小平方;约束;分位数回归;GLS等。
多层混合效应模型
连续、二元和计数结果、2-、3-和多因子随机intercepts和随机系数模型;交叉随机效应;MLREML估计;效应和拟合值的BLUPs;分层模型等。
二元,计数,和受限的因变量
LogisticprobittobitPoisson和负二项式;条件,多项式,排序的,秩排序,和stereotype logistic;多项式probit;零堆积和零截尾计数模型;selection模型;边际效应等。
面板数据/横截面时间序列
带稳健标准误差的随机和混合效应;线性混合模型,随机效应probitGEE,随机和混合效应PoissonArellano–Bond,和工具变量回归, AR(1) disturbances等。
广义线性模型(GLMs)
10个链接函数、用户定义链接、7种分布、MLIRLS评估、9种方差评估和7种残差等。
非参数方法
Wilcoxon–Mann–WhitneyWilcoxon符号秩和Kruskal–Wallis检验;SpearmanKendall相关;Kolmogorov–Smirnov检验;精确二项式CIs等。
ANOVA/MANOVA
平衡和非平衡设计、因子、嵌套设计;重复测量等。
多元方法
因子分析;首要成分;旋转;多维排列; Procrustean分析;相关分析;biplot;系统树图;用户可扩展分析等。
聚集分析
分层聚类;kmeanskmedian非分层聚类;系统树图;停止规则;用户可扩展分析等。
重采样和仿真方法
bootstrappingjackknife和蒙特卡罗模拟;permutation检验等。
模型检验和postestimation支持
Wald检验;LR检验;线性和非线性组合,检验和预测;边际效应;调整均值;Hausman检验等。
图形
线条图、散点图、条状图、饼图、hi-lo图表、回归诊断图形、幸存图、非参数smoothers和分布Q-Q图等。
调查方法
采样权重、多阶段设计;分层、poststratificationdeff均值、比例、比率、总数;汇总表格;bootstrapjackknife和基于线性化方差评估;回归、工具变量和probit等。
幸存分析
Kaplan–Meier Nelson–Aalen评估;Cox回归(frailty);参数模型(frailty)hazard;时间变异协方差;左和右删失;Weibull,指数和Gompertz分析等。
流行病学工具
比率标准化、病例对照、匹配病例对照、Mantel–Haenszel、代谢动力学、ROC分析和ICD-9-CM等。
时间序列
ARIMA ARCH/GARCHVAR VECM、相关图、周期图、white-noise检验、单元根检验、Holt–Winters smoothersHaver Analytics数据、旋转和递归估计等。
极大似然
用户自定义函数;NR DFP BFGS BHHH; OIMOPGrobust bootstrapjackknife矩阵;Wald检验;调查数据;数值或分析衍生等。
转换和正态性检验
Box-Cox转换;能力值转换、Shapiro–Wilk Shapiro–Francia检验等。
其它统计方法
样本大小和能力值、非线性回归、归因、逐步回归、统计和算术函数等。
编程语言
添加新的命令、命令脚本、ifwhile、命令分析、调试、菜单和对话框编程、标注和控制语言等。
矩阵编程-Mata
交互式对话、大型开发项目、矩阵倒置、分解、特征值和特征向量、LAPACK engine、真实和复杂数值、string矩阵、Stata数据集和矩阵之间的接口等。
Internet功能
安装新的命令、网络更新、网络文件共享和最新Stata新闻等。
Stata各版本区别:
Stata/SE, Stata/ICSmall Stata主要的区别在于每个版本能够分析的数据集大小。Stata/MP是一个拥有并行处理能力的Stata/SE
Stata/MP: 适合双核、多核、多处理器计算机的Stata版本
Stata/SE: 适合大数据集的Stata版本
Stata/IC: Stata标准版本
Small Stata: 小型的、Stata学生版本
Stata/MP:运行最快和处理数据集最大的Stata版本。它通过并发运行多处理器或内核来加快运算速度。Stata/SEStata/MP允许数据集最多可达32,767个变量。观测值的数量仅受您计算机内存大小的限制。Stata/SEStata/MP在计算机内存大小足够的情况下允许最大11,000 x 11,000维矩阵。相关的是Stata/SEStata/MP能够拟合带有更多的自变量(最多10,998)的模型。
Stata/IC允许多达2,047个变量的数据集。观测值的数量仅受您计算机内存大小的限制。Stata/IC能够在一个模型中最多有798个右手边(right-hand-side)变量。
Small Stata限制能分析的数据集最多为99个变量并带有接近1,000观测值。Small Stata最多能在一个模型中有38个右手边(right-hand-side)变量。
功能比较
版本
最大变量数
最大右手边变量数
最大观测值数
最大矩阵大小
是否兼容64位系统?
是否支持并行处理?bootstrap 软件
平台
Stata/MP
32,767
10,998
无限*
11,000
Windows, Macintosh Unix
Stata/SE
32,767
10,998
无限*
11,000
Windows, Macintosh Unix
Stata/IC
2,047
798
无限*
800
Windows, Macintosh Unix
Small Stata
99
39
1,000
40
Windows Macintosh
*最大观测值数仅受可使用的内存大小限制