Stata是一套提供其使用者数据分析、数据管理以及绘制专业图表的完整及整合性统计软件。它提供许许多多功能,包含线性混合模型、均衡重复反复及多项式普罗比模式。新版本的STATA采用最具亲和力的窗口接口,
使用者自行建立程序时,软件能提供具有直接命令式的语法。Stata提供完
整的使用手册,包含统计样本建立、解释、模型与语法、文献等超过一万余页的出版品。[1]
除了之外,Stata软件可以透过网络实时更新每天的最新功能,更可以得知世界各地的使用者对于STATA公司提出的问题与解决之道。使用者也
可以透过StataJournal获得许许多多的相关讯息以及书籍介绍等。另外
一个获取庞大资源的管道就是Statalist,它是一个独立的listserver,
每月交替提供使用者超过1000个讯息以及50个程序。参见“"、“[2]”、
“网”、”等。
编辑本段Stata的统计功能
Stata的统计功能很强,除了传统的统计分析方法外,还收集了近20
年发展起来的新方法,如Cox比例风险回归,指数与Weibull回归,多
类结果与有序结果的logistic回归,Poisson回归,负二项回归及广义
负二项回归,随机效应模型等。具体说,Stata具有如下统计分析能力:
数值变量资料的一般分析:参数估计,t检验,单因素和多因素的方差
分析,协方差分析,交互效应模型,平衡和非平衡设计,嵌套设计,随机效应,多个均数的两两比较,缺项数据的处理,方差齐性检验,正态性检验,变量变换等。
分类资料的一般分析:参数估计,列联表分析(列联系数,确切概
率),流行病学表格分析等。
等级资料的一般分析:秩变换,秩和检验,秩相关等
相关与回归分析:简单相关,偏相关,典型相关,以及多达数十种的回归分析方法,如多元线性回归,逐步回归,加权回归,稳键回归,二阶段回归,百分位数(中位数)回归,残差分析、强影响点分析,曲线拟合,随机效应的线性回归模型等。
其他方法:质量控制,整抽样的设计效率,诊断试验评价,kappa等。
编辑本段Stata的作图功能
Stata的作图模块,主要提供如下八种基本图形的制作直方图
(histogram),条形图(bar),百分条图(oneway),百分圆图(pie),
散点图(twoway),散点图矩阵(matrix),星形图(star),分位数图。这些图形的巧妙应用,可以满足绝大多数用户的统计作图要求。在有些非绘图命令中,也提供了专门绘制某种图形的功能,如在生存分析中,提供了绘制生存曲线图,回归分析中提供了残差图等。
Stata的矩阵运算功能
矩阵代数是多元统计分析的重要工具,Stata提供了多元统计分析中
所需的矩阵基本运算,如矩阵的加、积、逆、Cholesky分解、Kronecker内积等;还提供了一些高级运算,如特征根、特征向量、奇异值分解等;在执行完某些统计分析命令后,还提供了一些系统矩阵,如估计系数向量、
估计系数的协方差矩阵等。
编辑本段Stata的程序设计功能
Stata是一个统计分析例土,但它也具有很强的程序语言功能,这给用户提供了一个广阔的开发应用的天地,用户可以充分发挥自己的聪明才智,熟练应用各种技巧,真正做到随心所欲。事实上,Stataado
(高级统计部分)都是用Stata自己的语言编写的
Stata其统计分析能力远远超过了SPSS,在许多方面也超过了SAS!
由于Stata在分析时是将数据全部读入内存,在计算全部完成后才和磁盘交换数据,因此计算速度极快(一般来说,SAS的运算速度要比SPSS
少快一个数量级,而Stata的某些模块和执行同样功能的SAS模块比,
其速度又比SAS快将近一个数量级!)Stata也是采用命令行方式来操作,但使用上远比SAS简单。其生存数据分析、纵向数据(重复测量数据)分析等模块的功能甚至超过了SASoStata绘制的统计图形相当精美,
很有特。
编辑本段STATA的功能列表
数据管理(Datamanagement)
资料转换、分组处理、附加档案、ODBC、行-列转换、数据标记、
字符串函数…等
基本统计(Basicstatistics)
直交表、相关性、t-检定、变异数相等性检定、比例检定、信赖区问…等
线性模式(Linearmodels)
稳健Huber/White/sandwich变异估计三阶最小平方法、类非相关
回归、齐次多项式回归、GLS
广义型线性模式(Generalizedlinearmodels)
十连结函数、使用者-定义连结、MLIRLS估计、
九变异数估计、七残差•…等二元、计数及有限应变量(Binary,count,andlimiteddependentvariables)
spss中bootstrap结果解读罗吉斯特、probit、卜松回归、tobittruncated回归、条件
罗吉斯特、多项式逻辑、巢状逻辑、负二项、zero-inflated模型、Heckman选择模式、边际影响
Panel数据/交叉-组合时间序列
(Paneldata/cross-sectionaltime-series)
随机及固定影响之回归、GEE、随机及固定-影响之
卜松及负二项分配、随机-影响、工具变量回归、
AR(1)干扰回归
无母数方法(Nonparametricmethods)
多变量方法(Multivariatemethods)
因素分析、多变量回归、anonical相关系数
模型检定及事后估计量支持分析
(Modeltestingandpost-estimationsupport)
Wald检定、LR检定、线性及非线性组合、非线性限制检定、边际
影响、修正平均数Hausman检定
集分析(Clusteranalysis)
加权平均质量中心及中位数联结、kmeanskmedians
dendrograms、停止规则、使用者扩充
图形(Graphics)
直线图、散布图、条状图、圆饼图、hi-lo图、
回归诊断图…
调查方法(Surveymethods)
抽样权重、丛集抽样、分层、线性变异数估计量、拟-概似最大估计
量、回归、工具变量•…
生存分析(Survivalanalysis)
Kaplan-MeierNelson-Aalen,Cox回归(弱性)、参数模式(弱性)、危险比例测试、时间共变项、
左-右检查、韦柏分配、指数分配…
流行病学工具(Toolsforepidemiologists)
比例标准化、病例控制、已配适病例控制、Mantel-Haenszel,
理学、ROC分析、ICD-9-CM
时间序列(Timeseries)
ARIMAARCH/GARCHVARNewey-Westcorrelogramsperiodograms、白-噪音测试,
最小整数根检定、时间序列运算、平滑化
最大概似法(Maximumlikelihood)
转换及常态检定(Transformsandnormalitytests)
Box-Cox、次方转换Shapiro-WilkShapiro-Francia检定
其它统计方法(Otherstatisticalmethods)
样本数量及次方、非线性回归、逐步式回归、统计及数学函数
包含样本范例(Samplesession)
再抽样及模拟方法(Resamplingandsimulationmethods)
bootstrappingjackknife蒙地卡罗模拟、排列检定网络功能
安装新指令、网络升级、网站档案分享、Stata最新消息
epiman论坛学习资源丰富,学术氛围良好,在国内新生代公共卫生学术界有一定影响力。是探讨Stata,spss,sas,epidata等统计软件的主流论坛之一。
编辑本段Stata学习资料
网络资源
StataStata公司提供的Webresources,涵盖了大量相关网络资源;其FAQ则提供了各种常见问题的解答;Statalist则是一个类似
于人大经济论坛的免费的讨论区。加入Statalist的方法很简单,你只需
要发送邮件至Stata-maillist,邮件内容无需任何称谓,只需写上“subscribeStatalist”的字样即可。接到确认信息后,你便成为一名
Statalist的成员了。当然,即使不加入,你仍然可以浏览,但不能提问。
UCLA加州大学洛杉矶分校)提供的网络教程。该网站提供的DataManagementGraphicsRegressionLogisticRegressionMultilevelModelingSurveyDataAnalysis等模块都非常出;其WebBooks
TextbookExamples模块则非常细致地呈现了几十本非常流行的统计和计量教材的Stata实例;对于LaTeX感兴趣的朋友,则可以通过StataToolsforLaTeX模块获得诸多有用的信息;
Graphexamples模块中,则列举了四十余种图形的绘制方法;最后,在ClassesandSeminars模块中,你可以
在线观看数十个Stata教学视频。
Stata中文讨论专区。目前,国内已有多个专门讨论Stata应用的论坛,
包括人大经济论坛Stata专区[5],公卫人EpiMan[6]等。这些论坛集中了国内
外数十万的Stata用户,为交流和解决Stata应用过程中遇到的各种问题
和经验提供了很好的平台。
相关的书籍
自从Hamilton(1990)出版StatisticswithStata后,一系列将计量理论与软化操作结合起来的书籍开始相继面世,而在此之前,人们似乎都认为软件操作是件非常简单的事情。也正因为如此,很多学生在修改完了
一个学年的计量经济学课程后,仍然不知道该如何完成OLS估计。为此,
我列举的书籍多附有Stata实例(*表示我的推荐程度),多数书中的范
例数据都可通过Stata下载
一份详细的书单:UCLA提供了的书单。
入门教材:Baum(2006)*NewtonandCox(2009)Chenetal.(2005)AdkinsandHill(2008)*;Wooldridge(2009)*,波士顿大学的网站上提供