Stata如何进行整体数据查看
    2021-11-22
    2069

      Stata如何进行整体数据查看。Stata怎么样整体查看数据?为了方便大家理解,本期艾思云课堂小编给大家整理了一些相关的资料,在这里分享给大家,希望能够对你有所帮助。

    Stata如何进行整体数据查看.png

      一、读取数据——数据转码Unicode

      比如常见的我们在stata14进行数据读取时,结果是乱码。然后用Unicode analyze 对其进行分析,结果说该文件需要进行Unicode translate。此时,关键是要设对需要转换文件的原始编码类型。例如,如果原始数据中变量标签为中文,用stata14打开时,变量标签无法识别。此时,需要设定编码类型。命令为 Unicodeencoding set gb18030,即设定编码类型为国标18030,即简体中文。然后,用Unicode analyze filename. dta 分析文件是否需要转换,如结果为需要,那么继续用Unicode translate filename. dta来转换数据文件中不可识别的中文汉字。成功以后,原始数据中不能识别的中文则可以在stata14中识别了。

      其实,在实际数据读取过程中,我们只是偶然会遇到这种情况。更多的情况是各种不同数据格式之间的转换,比如一些数据库的原始数据是SAS数据或者SPSS数据甚至直接就是Excel数据,此时我们需要转换成Stata可以读取的dta格式,这里Excel数据可以用Stata软件直接转换,其他的推荐Stata translate软件进行转换。

      二、查看识别变量——isid、duplicates

      重复记录是数据清理中一个非常常见的问题,可能就是因为该问题太常见了,所以Stata开发了一整套识别、描述和移除重复记录的命令。

      一般而言,每个数据集都有唯一一个识别每条记录的识别符(重复测量的长型数据除外)。Stata检查唯一识别符是否唯一的命令为isid(或许是is this an ID的缩写)。isid允许同时检查多个唯一识别符,如果没有返回值,就说明是唯一的(没有消息就是好消息);如果不唯一,就会出现红色提示variable *** does not uniquely identify the observations

      如果出现重复记录就需要详细查看重复记录的情况。深入检查数据集重复记录的Stata命令为duplicates,对应的Stata菜单操作方式为Data → Data utilities → Manageduplicate observations。Stata是这样描述duplicates命令的:duplicates命令用来报告、查看、标示和删除重复记录。具体应用,大家可以在Stata软件命令栏中输入help duplicates查看。

      以上就是本期艾思科蓝分享的内容了,如需了解更多相关内容,请点击页面艾思科蓝关注我们,我们会定期分享更多大家关心的资料以及想要了解的资讯哦。

    Stata面板数据计量分析高级培训班.jpg

    分享:
    收藏 0
    点赞 0
    业务咨询
    刘老师:18922434589
    石老师:13922152147
    商务合作
    冯老师:13922150126 (微信同号)
    客服邮箱:customer_services@ais.cn
    举报受理
    电话:400-607-9388
    邮箱:customer_services@ais.cn

    公众号

    小程序

    广州科奥信息技术有限公司 版权所有。
    Copyright©2019 All rights reserved 粤ICP备16087321号
    • 在线客服
    • 微信客服
      扫码添加
      微信客服
    • 学术测评
      测一测你和Nature大神距离有多远?
    • 微信公众号
      扫码关注
      云课堂公众号
    • 视频教程