数据录入
在Stata中读入数据可以有三种方式:直接从键盘输入打开已有数据文件拷贝、粘贴方式交互数据
(1)从键盘输入数据
在Stata中可以使用命令行方式直接建立数据集,首先使用input命令制定相应的变量名称,然后一次录入数据,最后使用end语句表明数据录入结束。
例1  在某实验中得到如下数据,请在Stata中建立数据集。
观测数据
X 1 3 5  7  9
Y 2  4  6  8  10
解:此处需要建立两个变量X、Y,分别录入相应数值,Stata中的操作如下,其中划线部分为操作者输入部分。
. drop _all
. input x y
    x  y
  1. 1   2
  2. 3   4
  3. 5   6
  4. 7   8
  5. 9 10
  6. end
2)用stata的数据编辑工具
①进入数据编辑器
进入stata界面,在命令栏键入edit或在statawindow下拉菜单中单击data editor或点击编辑图标 (注意:是浏览图标,点击后只能浏览,不能编辑)即可进入stata数据编辑器。(stata界面如下图)
②数据编辑
在空白处输入数据。注:键入数据后要按Enter
在第一列输入数据后,Stata第一列自动命名为var1;在第二列输入数据后,第二列自动命名为var2……依次类推。在输入数据后,双击纵格顶端的变量名栏(如:Var1或Var2处),可以更改变量名,并可以在label栏中注释变量名的含义,点击OK确认(如图4所示)。仍沿用上例,双击观察值所在列顶端的变量名栏,更改变量名为x,并在label栏中注明 “7岁男童身高(cm数据输入完毕后,单击preserve键确认所输数据,按关闭键 即可退出编辑器。
指令解释
Preserve:保存已经输入的数据,相当于Word里的Save功能。
Rrstore:撤销所有未保存的数据。
Sort:按某一列数据排序。(注:需先选中某列数据)
《:将某列数据移到左边一列。
》:将某列数据移到右边一列。
Hide:隐藏某列数据。(注:需先选中某列数据)
Delete:删除数据。
(3)从Excel中导出数据
首先将EXCEL中的A1-6~D1-6全部24个单元格选中,并复制;然后切换到Stata,选择菜单Window Data Editor,打开数据编辑窗口;点右键选择Paste,相应的数据就会被直接粘贴如数据编辑窗口中,并且变量名、记录数、变量格式等均会被自动正确设置。
  在EXCEL中的数据格式
粘贴入Stata后的数据格式
(4)打开已有的数据文件
Stata能够直接打开的数据文件只能是自身专用格式或者以符号分隔的纯文本格式,后者第一行可以是变量名,分述如下:
1.点击图标,然后选择路径和文件名,可以打开Stata专用格式的数据文件,并且扩展名为.dta。
2.打开Dta数据文件:该格式文件是Stata的专用格式数据文件,也使用use命令即可打开,例如要打开数据文件“C:\data1.dta”,则命令为:
. use c:\data1
即扩展名可以省略,如果Stata中已经修改或者建立了数据集,则需要使用clear选项清除原有数据,命令为:
. use c:\data1 , clear
3.读入文本格式数据:需要使用insheet命令实现,例如需要读入已建立好的文本格式数据文件“C:\”,则命令为:
. insheet using c:\
该命令会自动识别第一行是否为变量名,以及变量列间的分隔符是tab、逗号还是其他字符。
如果Stata中已经修改或者建立了数据集,则需要使用clear选项清除原有数据,命令为:
. insheet using c:\ , clear
input命令(5)数据文件保存
为了方便以后重复使用,输入Stata的数据应存盘。Stata实际上只能将数据存为自身专用的数据格式或者纯文本格式,分述如下:
点击图标,然后选择路径和文件名,点击保存
存为dta格式:可以直接使用文件菜单,也可以使用save命令操作,如欲将上面建立的数据文件存入“C:\”中,文件名为Data1.dta,则命令为:
. save c:\data1
file c:\data1.dta saved
该指令将在C盘根目录建立一个名为“data1.dta”的Stata数据文件,后缀dta可以在命令中省略,
会被自动添加。该文件只能在Stata中用use命令打开。如所指定的文件已经存在,则该命令将给出如下信息:file c:\data1.dta already exists,告诉用户在该目标盘及子目录中已有相同的文件名存在。如欲覆盖已有文件,则加选择项replace。命令及结果如下:
. save c:\data1.dta , replace
file c:\data1.dta saved
存为文本格式:需要使用outsheet命令实现,该命令的基本格式如下。
outsheet [变量名列表] using 文件名 [, nonames replace ]
其中变量名列表如果省略,则将全部变量存入指定文件。
如欲将上面建立的数据文件存入文本文件“C:\”中,则命令为:
. outsheet using c:\
此时建立的文件第一行为变量名,第2~6行为变量值。变量列间用Tab键分隔。如
果不希望在第一行存储变量名,则可以使用nonames选项。如果文件已经存在,则需要使用replace选项。