Stata怎样做聚类分析?
    2021-11-23
    1997

      Stata是如何做聚类分析的?接下来艾思云课堂小编给大家收集了一些资料,下面就是教大家如何使用stata软件做聚类分享的内容。

    Stata怎样做聚类分析?.png

      cluster kmeans y x1 x2 x3, k(3)

      ——依据y、x1、x2、x3,将样本分为n类,聚类的核为随机选取

      cluster kmeans y x1 x2 x3, k(3) measure(L1) start(everykth)

      —— "start"用于确定聚类的核,"everykth"表示将通过构造三组样本获得聚类核:构造方法为将样本id为1、1+3、1+3×2、 1+3×3……分为一组、将样本id为2、2+3、2+3×2、2+3×3……分为第二组,以此类推,将这三组的均值作为聚类的核;"measure"用 于计算相似性和相异性的方法,"L1"表示采用欧式距离的绝对值,也直接可采用欧式距离(L2)和欧式距离的平方(L2squared)。PS:这个方法 所得的结果与SPSS所得结果相同。

      sort c1 c2(对c1和c2两个分类变量排序)

      by c1 c2:reg y x1 x2 x3(在c1、c2的各个水平上分别进行回归)

      bysort c1 c2:reg y x1 x2 x3 if c3=1(逗号前面相当于将上面两步骤合一,既排序又回归,逗号后面的“if c3=1”表示只有在c3=1的情况下才进行回归)

      stepwise, pr(.2): reg y x1 x2 x3(使用Backward selection,去除P值大于0.2时变量)

      stepwise, pe(.2): reg y x1 x2 x3(使用forward selection,去除P值小于0.2时变量)

      stepwise, pr(.2) pe(.01):reg y x1 x2 x3(使用backward-stepwise selection,取P值在0.01和0.2之间的变量)

      stepwise, pe(.2) forward: reg y x1 x2 x3(使用forward-stepwise selection)

      reg y x1 x2 x3

      predict Yhat,xb

      predict u,resid

      predict ustd,stdr(获得残差的标准误)

      predict std,stdp(获得y估计值的标准误)

      predict stdf,stdf(获得y预测值的标准误)

      predict e,e(1,12)(获得y在1到12之间的估计值)

      predict p,pr(1,12)(获得y在1到12之间的概率)

      predict rstu,rstudent(获得student的t值)

      predict lerg,leverage(获得杠杆值)

      predict ckd,cooksd(获得cooksd)

      reg y x1 x2 x3 c1 c2

      adjust x1 x2 x3,se(使得变量x1、x2和x3等于其均值,求y的预测值和标准误)

      adjust x1 x2 x3,stdf ci(使得变量x1、x2和x3等于其均值,求y的预测值,预测标准误和置信区间)

      adjust x1 x2,by(c1) se ci(控制变量x1、x2,亦即取它们的均值,在分类变量c1的不同水平上求y预测值,标准误和置信区间)

      adjust x1 x2 x3,by(c1) stdf ci(控制变量x1、x2、x3,亦即取它们的均值,在分类变量c1的不同水平上求y预测值,预测标准误和置信区间)

      adjust x1 x2,by(c1 c2) se ci(控制变量x1、x2,在分类变量c1、c2的不同水平上求y的预测值,标准误和置信区间)

      adjust x1 x2 x3,by(c1 c2) stdf ci(控制变量x1、x2、x3,在分类变量c1、c2的不同水平上求y的预测值,预测标准误和置信区间)

      adjust x1=a x2=b x3=c,se ci(当x1=a、x2=b、x3=c时,求y的预测值、标准误和置信区间)

      adjust x1=a x2=b x3=c,by(c1) se ci(当x1=a、x2=b、x3=c时,在分类变量c1的不同水平上,求y的预测值、标准误和置信区间)

      adjust x1=a x2=b c1=1,by(c1) se ci(当x1=a、x2=b,并假设所有的样本均为c1=1,求在分类变量c1的不同水平上,因为变量x3的均值不同,而导致的y的不同的预测值……)

      mvreg Y1 Y2 ……: X1 X2 X3……(多元回归)

      mvreg y1 y2 y3: x1 x3 x3(多元回归分析,y1 y2 y3为因变量,x1 x3 x3为自变量)

      本期的艾思科蓝资讯就分享到这里了,学海无涯,我们的每一天都在学习,艾思科蓝一直伴随在您的学习之路上。

    Stata面板数据计量分析高级培训班.jpg


    分享:
    收藏 0
    点赞 0
    业务咨询
    刘老师:18922434589
    石老师:13922152147
    商务合作
    冯老师:13922150126 (微信同号)
    客服邮箱:customer_services@ais.cn
    举报受理
    电话:400-607-9388
    邮箱:customer_services@ais.cn

    公众号

    小程序

    广州科奥信息技术有限公司 版权所有。
    Copyright©2019 All rights reserved 粤ICP备16087321号
    • 在线客服
    • 微信客服
      扫码添加
      微信客服
    • 学术测评
      测一测你和Nature大神距离有多远?
    • 微信公众号
      扫码关注
      云课堂公众号
    • 视频教程