Stata软件基本操作和数据分析入门
二、数据的录入与储存
Stata为用户提供了简捷,但是非常完善的数据接口,熟悉它的用法是使用Stata的第一步,在Stata中读入数据可以有三种方式:直接从键盘输入、打开已有数据文件和拷贝、粘贴方式交互数据。
1)从键盘输入数据
Stata中可以使用命令行方式直接建立数据集,首先使用input命令制定相应的变量名称,然后一次录入数据,最后使用end语句表明数据录入结束。
在某实验中得到如下数据,请在Stata中建立数据集。
观测数据
input命令X  1  3  5  7  9
Y  2  4  6  8  10
解:此处需要建立两个变量XY,分别录入相应数值,Stata中的操作如下,其中划线部分为操作者输入部分。
. drop _all
. input x y
    x  y
  1. 1  2
  2. 3  4
  3. 5  6
  4. 7  8
  5. 9  10
  6. end
2)stata的数据编辑工具
①进入数据编辑器
进入stata界面,在命令栏键入edit或在statawindow下拉菜单中单击data editor或点击编辑图标   (注意:是浏览图标,点击后只能浏览,不能编辑)即可进入stata数据编辑器。(stata界面如下图2
2
②数据编辑
stata 数据编辑器界面:此时进入了数据全屏幕编辑状态。
3
在第一列输入数据后,Stata第一列自动命名为var1;在第二列输入数据后,第二列自动命名为var2……依次类推。在输入数据后,双击纵格顶端的变量名栏(如:Var1Var2),可以更改变量名,并可以在label栏中注释变量名的含义,点击OK确认(如图4所示)。仍沿用上例,双击观察值所在列顶端的变量名栏,更改变量名为x,并在label栏中注明 7岁男童身高(cm
4
数据输入完毕后,单击preserve键确认所输数据,按关闭键 即可退出编辑器。
5
数据输入完毕后,单击preserve键确认所输数据,按关闭键 即可退出编辑器。
3)拷贝、粘贴方式交互数据
Stata的数据编辑窗口是一个简单的电子表格,可以使用拷贝、粘贴方式直接和EXCEL等软件交互数据,在数据量不大时,这种方式操作极为方便。
现在EXCEL中已录入了三个变量,共五条记录,格式见下图,请将数据读入Stata
解:首先将EXCEL中的A1C6全部18个单元格选中,选择菜单编辑复制,将数据拷贝到剪贴板上;然后切换到Stata,选择菜单WindowData Editor,打开数据编辑窗口;再选择EditPaste,相应的数据就会被直接粘贴如数据编辑窗口中,并且变量名、记录数、变量格式等均会被自动正确设置,见图6和图7
EXCEL中的数据格式
粘贴入Stata后的数据格式
4)、打开已有的数据文件
Stata能够直接打开的数据文件只能是自身专用格式或者以符号分隔的纯文本格式,后者第一行可以是变量名,分述如下:
1.点击图标,然后选择路径和文件名,可以打开Stata专用格式的数据文件,并且扩展名为.dta
2.打开Dta数据文件:该格式文件是Stata的专用格式数据文件,也使用use命令即可打开,例如要打开数据文件“C:\data1.dta”,则命令为:
. use c:\data1
即扩展名可以省略,如果Stata中已经修改或者建立了数据集,则需要使用clear选项清除原有数据,命令为:
. use c:\data1 , clear
3.读入文本格式数据:需要使用insheet命令实现,例如需要读入已建立好的文本格式数据
文件“C:\”,则命令为:
. insheet using c:\
该命令会自动识别第一行是否为变量名,以及变量列间的分隔符是tab、逗号还是其他字符。如果Stata中已经修改或者建立了数据集,则需要使用clear选项清除原有数据,命令为: