stata学习笔记(一):stata软件入门

一、文件扩展名

数据文件 .dta

命令文件.do

程序文件.ado

二、不同统计软件的对比

三、使用wbopendata(世界银行公开数据)模块获取数据,减轻数据下载管理的工作量

例1:用wbopendata获得“每百人手机订购量“指标的元数据并制作地图

. wbopendata, language (en -English) indicator
(it.cel.sets.p2) long clear latest

. use Mobile, clear
. spmap it cel sets p2 using "world-c.dta", id(id)

四、解决线性代数问题

例2:

1 //?线性变换可以用矩阵的形式表示,即x=Sy,y=Qz, 则x=S*Q*z.其中x,y,z??为列向量
2 mat S=(2,0,1\-2,3,2\4,1,5)
3 mat Q=(-3,1,0\2,0,1\0,-1,3)
4 mat b1=S*Q
5 mat l b1 //下面用方程形式表示出来
6 dis "x1="b1[1,1] "*z1+"b1[1,2] "*z2+"b1[1,3] "*z3"
7 dis "x2="b1[2,1] "*z1+"b1[2,2] "*z2+"b1[2,3] "*z3"
8 dis "x3="b1[3,1] "*z1+"b1[3,2] "*z2+"b1[3,3] "*z3"
9 //求解矩阵,先试探系数矩阵是否可逆
10 mat A=(2,1,-1\2,1,0\1,-1,1)p
11 dis det(A) //行列式不为零,可以求逆
12 mat b=(1,-1,3\4,3,2)
13 mat X=b*inv(A)
14 mat l X

五、自学途径

  • help+命令(全英文看醉了)
  • 人大经济论坛(中文)
  • statalist(英文)
  • UCLA提供的网络教程
  • 连玉君博客
  • 参考教材

六、基本操作

  • 打开数据
.sysuse auto    //使用sysuse打开系统示例数据
.sysuse auto,clear  //使用clear命令来清除已打开的数据
.use abcd //使用use命令来打开用户自己的数据,默认打开C:\data或D:\data
.cd”D:\abc“  //打开其他位置的数据文件,或者使用file--open来打开指定数据
  • 查看数据

describe:描述数据库变量类型、属性

. describe

Contains data from F:\stata13(windows安装版)\ado\base/a/auto.dta
  obs:            74                          1978 Automobile Data
 vars:            12                          13 Apr 2013 17:45
 size:         3,182                          (_dta has notes)
-------------------------------------------------------------------------------
              storage   display    value
variable name   type    format     label      variable label
-------------------------------------------------------------------------------
make            str18   %-18s                 Make and Model
price           int     %8.0gc                Price
mpg             int     %8.0g                 Mileage (mpg)
rep78           int     %8.0g                 Repair Record 1978
headroom        float   %6.1f                 Headroom (in.)
trunk           int     %8.0g                 Trunk space (cu. ft.)
weight          int     %8.0gc                Weight (lbs.)
length          int     %8.0g                 Length (in.)
turn            int     %8.0g                 Turn Circle (ft.)
displacement    int     %8.0g                 Displacement (cu. in.)
gear_ratio      float   %6.2f                 Gear Ratio
foreign         byte    %8.0g      origin     Car type
-------------------------------------------------------------------------------
Sorted by:  foreign

. 

list:陈列相应的变量和数据

. list

     +----------------------------------------------------------------------+
  1. | make              |  price | mpg | rep78 | headroom | trunk | weight |
     | AMC Concord       |  4,099 |  22 |     3 |      2.5 |    11 |  2,930 |
     |----------------------------------------------------------------------|
     |   length   |   turn   |   displa~t   |   gear_r~o    |    foreign    |
     |      186   |     40   |        121   |       3.58    |   Domestic    |
     +----------------------------------------------------------------------+

     +----------------------------------------------------------------------+
  2. | make              |  price | mpg | rep78 | headroom | trunk | weight |
     | AMC Pacer         |  4,749 |  17 |     3 |      3.0 |    11 |  3,350 |
     |----------------------------------------------------------------------|
     |   length   |   turn   |   displa~t   |   gear_r~o    |    foreign    |
     |      173   |     40   |        258   |       2.53    |   Domestic    |
     +----------------------------------------------------------------------+

     +----------------------------------------------------------------------+
  3. | make              |  price | mpg | rep78 | headroom | trunk | weight |
     | AMC Spirit        |  3,799 |  22 |     . |      3.0 |    12 |  2,640 |
     |----------------------------------------------------------------------|
     |   length   |   turn   |   displa~t   |   gear_r~o    |    foreign    |
     |      168   |     35   |        121   |       3.08    |   Domestic    |
     +-----------------------------------------------------------------------
//在list之后加上限制条件选取所需数据
//列出价格大于10000的车型
. list make if price > 10000

     +-------------------+
     | make              |
     |-------------------|
  9. | Buick Riviera     |
 11. | Cad. Deville      |
 12. | Cad. Eldorado     |
 13. | Cad. Seville      |
 26. | Linc. Continental |
     |-------------------|
 27. | Linc. Mark V      |
 28. | Linc. Versailles  |
 41. | Olds Toronado     |
 64. | Peugeot 604       |
 74. | Volvo 260         |
     +-------------------+

. 

//列出价格大于10000的进口车车型
. list make if price>10000 & foreign == 1

     +-------------+
     | make        |
     |-------------|
 64. | Peugeot 604 |
 74. | Volvo 260   |
     +-------------+

. 

直接使用browse命令打开数据库浏览

.browse

scatter:绘制散点图

. scatter price weight

  • 生成数据

generate:生成一列新数据

.g num = _n  //generate或gen都可以

用list num可查看新生成的变量

. list num

     +-----+
     | num |
     |-----|
  1. |   1 |
  2. |   2 |
  3. |   3 |
  4. |   4 |
  5. |   5 |
     |-----|
  6. |   6 |
  7. |   7 |
  8. |   8 |
  9. |   9 |
 10. |  10 |
     |-----|
 11. |  11 |
 12. |  12 |
 13. |  13 |
 14. |  14 |
 15. |  15 |
     |-----|
 16. |  16 |
 17. |  17 |
 18. |  18 |
  • 修改数据
.replace  //+条件语句:剔除缺失值、异常值、批量修改数据

.edit  //慎用,避免无意间修改了原始数据

注意:原始数据不允许随便修改

  • 描述统计

summarize:求变量的个数、平均值、标准差、最小值和最大值

. su  //summarize或sum都可以

    Variable |       Obs        Mean    Std. Dev.       Min        Max
-------------+--------------------------------------------------------
        make |         0
       price |        74    6165.257    2949.496       3291      15906
         mpg |        74     21.2973    5.785503         12         41
       rep78 |        69    3.405797    .9899323          1          5
    headroom |        74    2.993243    .8459948        1.5          5
-------------+--------------------------------------------------------
       trunk |        74    13.75676    4.277404          5         23
      weight |        74    3019.459    777.1936       1760       4840
      length |        74    187.9324    22.26634        142        233
        turn |        74    39.64865    4.399354         31         51
displacement |        74    197.2973    91.83722         79        425
-------------+--------------------------------------------------------
  gear_ratio |        74    3.014865    .4562871       2.19       3.89
     foreign |        74    .2972973    .4601885          0          1
时间: 2024-10-11 22:41:51

stata学习笔记(一):stata软件入门的相关文章

nodejs学习笔记之安装、入门

由于项目需要,最近开始学习nodejs.在学习过程中,记录一些必要的操作和应该注意的点. 首先是如何安装nodejs环境?(我用的是windows 7环境,所以主要是windows 7的例子.如果想看linux下的安装可以参考http://www.cnblogs.com/meteoric_cry/archive/2013/01/04/2844481.html) 1. nodejs提供了一些安装程序,可以去官网(http://nodejs.org/download/)按照自己的机器进行下载,下载完

Linux学习笔记——Ubuntu更新软件源

0.前言 通过修改ubuntu软件源可提高apt命令下载安装软件的速度. 参考资料 [官方资料]--配置文件修改方法 [Ubuntu怎样修改软件源地址]--使用ubuntu软件中心修改(推荐) [at-get update错误处理] 1.使用ubuntu软件中心更新 请参考[Ubuntu怎样修改软件源地址]--来自百度经验 图1 打开软件和更新 图2 选择国内软件源 2.使用指令方法修改 [1]首先备份源列表 sudo cp /etc/apt/sources.list /etc/apt/sour

卷积神经网络(CNN)学习笔记1:基础入门

卷积神经网络(CNN)学习笔记1:基础入门 Posted on 2016-03-01   |   In Machine Learning  |   9 Comments  |   14935  Views 概述 卷积神经网络(Convolutional Neural Network, CNN)是深度学习技术中极具代表的网络结构之一,在图像处理领域取得了很大的成功,在国际标准的ImageNet数据集上,许多成功的模型都是基于CNN的.CNN相较于传统的图像处理算法的优点之一在于,避免了对图像复杂的

Node.js学习笔记【1】入门(服务器JS、函数式编程、阻塞与非阻塞、回调、事件、内部和外部模块)

笔记来自<Node入门>@2011 Manuel Kiessling JavaScript与Node.js Node.js事实上既是一个运行时环境,同时又是一个库. 使用Node.js时,我们不仅仅在实现一个应用,同时还实现了整个HTTP服务器. 一个基础的HTTP服务器 server.js:一个可以工作的HTTP服务器 var http = require("http"); http.createServer(function(request, response) { r

树莓派学习笔记——修改树莓派软件源

0 前言 本文说明如何修改树莓派软件源.如果使用raspbian系统,修改软件源的方法和ubuntu相同,可在http://www.raspbian.org找到最新的软件源镜像,修改/etc/apt/sources文件中的内容即可. [相关博文] [树莓派学习笔记--索引博文]--更多博文请关注. [Linux学习笔记--Ubuntu更新软件源] 1 软件源位于何处 [树莓派软件源镜像列表] 截止2014年8月,在中国的软件源镜像有--清华大学(2015年将停止访问).大连东软信息学院.中国科技

stata学习笔记(三):计算五年内的ROA标准差所用到的一些知识

1.如何删除某几行的数据 drop if year2==2014 | year2==2013 2.如何计算连续几年的标准差 *year2为int型 bys stkcd (year2):gen roa1=adjroa[_n-1] bys stkcd (year2):gen roa2=adjroa[_n-2] bys stkcd (year2):gen roa3=adjroa[_n+1] bys stkcd (year2):gen roa4=adjroa[_n+2] egen roasd=rowsd

R语言入门学习笔记 - 对R软件的认识

1.安装R:自行百度? 2.R控制台(R Console)和R程序脚本: 打开R软件,就会直接打开控制台,控制台可以显示程序运行的结果.错误提示等信息,也可以直接输入想要执行的操作并立即返回运行结果,箭头">"表示等待输入. 程序脚本通过点击右上角"文件" - "新建程序脚本"来建立.如果想要长久的保存已经提交的程序代码,那么可以在程序脚本中编写,点击保存的时候会另存为一个后缀为".R"的数据文件,如果直接在控制台编写代

stata学习笔记(七):回归分析和稳健性检验

1.分组回归 sort state by state:reg xxx xxx 2.交叉项 genicv可以一键生成很多交叉项 ##可以直接表示交叉项. [例子] ssc install genicv sysuse auto,clear genicv length weight foreign \\\会生成4个交叉项,所以可能情况,并且有label reg price length weight length_weight *如果不愿意生成,直接用 reg price c.length##c.we

stata学习笔记(四):主成份分析与因子分析

1.判断是否适合做主成份分析,变量标准化 Kaiser-Meyer-Olkin抽样充分性测度也是用于测量变量之间相关关系的强弱的重要指标,是通过比较两个变量的相关系数与偏相关系数得到的. KMO介于0于1之间.KMO越高,表明变量的共性越强.如果偏相关系数相对于相关系数比较高,则KMO比较低,主成分分析不能起到很好的数据约化效果. 根据Kaiser(1974),一般的判断标准如下: 0.00-0.49,不能接受(unacceptable); 0.50-0.59,非常差(miserable): 0