课程
首页 > 学术资讯 >Stata检验极端值数据的步骤>
Stata检验极端值数据的步骤
2021-11-23
3507

  Stata是如何检验极端值的呢?检验极端值有哪些步骤?本期艾思云课堂小编带大家学习一下stata检验极端值数据的步骤。

  常见命令:tabulate、stem、codebook、summarize、list、histogram、graph box、gragh matrix

  step1.用codebook、summarize、histogram、graph boxs、graph matrix、stem看检验数据的总体情况:

Stata检验极端值数据的步骤.png

  可以看出数据分布状况,尤其是最大、最小值

  step2.用tabulate、list细致寻找极端值

  tabulate code if x1==极端值(作出x1等于极端值时code的频数分布表,code表示地区、年份等序列变量,这样便可找出那些地区的数值出现了错误)

  list code if x1==极端值(直接列出x1等于极端值时code的值,当x1的错误过多时,不建议使用该命令)

  step3.用replace命令替换极端值

  replace x1=? if x1==极端值

  去除极端值:

  keep if y<1000

  drop if y>1000

  对数据排序:

  sort x

  gsort +x

  (对数据按x进行升序排列)

  gsort -x

  (对数据按x进行降序排列)

  gsort -x, generate(id) mfirst

  (对数据按x进行降序排列,缺失值排最前,生成反映位次的变量id)

  对变量进行排序:

  order y x3 x1 x2

  (将变量按照y、x3、x1、x2的顺序排列)

  生成新变量:

  gen logx1=log(x1)(得出x1的对数)

  gen x1`=exp(logx1)(将logx1反对数化)

  gen r61_100=1 if rank>=61&rank<=100(若rank在61与100之间,则新变量r61_100的取值为1,其他为缺失值)

  replace r61_100 if r61_100!=1(“!=”表示不等于,若r61_100取值不为1,则将r61_100替换为0,就是将上式中的缺失值替换为0)

  gen abs(x)(取x的绝对值)

  gen ceil(x)(取大于或等于x的最小整数)

  gen trunc(x)(取x的整数部分)

  gen round(x)(对x进行四舍五入)

  gen round(x,y)(以y为单位,对x进行四舍五入)

  gen sqrt(x)(取x的平方根)

  gen mod(x,y)(取x/y的余数)

  gen reldif(x,y)(取x与y的相对差异,即|x-y|/(|y|+1))

  gen logit(x)(取ln[x/(1-x)])

  gen x=autocode(x,n,xmin,xmax)(将x的值域,即xmax-xmin,分为等距的n份)

  gen x=cond(x1>x2,x1,x2)(若x1>x2成立,则取x1,若x1>x2不成立,则取x2)

  本期的艾思科蓝资讯就分享到这里了,学海无涯,我们的每一天都在学习,艾思科蓝一直伴随在您的学习之路上。

Stata面板数据计量分析高级培训班.jpg

分享:
收藏 0
点赞 0
业务咨询
刘老师:18922434589
商务合作
石老师:13922152147
客服邮箱:customer_services@ais.cn
举报受理
电话:400-607-9388
邮箱:customer_services@ais.cn

公众号

小程序

广州科奥信息技术股份有限公司 版权所有。
Copyright©2019 All rights reserved 粤ICP备16087321号