双剑合璧之Stata与Python:初识IPyStata

双剑合璧之Stata与Python:初识IPyStata

一个是经管实证研究的必备利器,Stata。

一个是触手可及的胶水语言,Python。

爬虫获取数据,祭出神器Python,整理数据跑出漫天星星,亮出宝剑Stata。双剑合璧,驰骋于数据时代。

当时在R语言与应用计量经济学已经提到Stata有一些不足需要弥补。其实在 Stata Conference Chicago 2016上,不仅有人在提及与Web交互绘图的问题,还提及到Reproducible research。Reproducible research在R语言中得到了较好的体现,感兴趣的读者可以阅读Dynamic Documents with R and Knitr(2nd)和Reproducible Research with R and RStudio(2nd)。Stata用户也想实现Reproducible research,其中一个比较便捷的方式就是借助Jupyter Notebook来实现。

不得不说Stata用户中也是牛人辈出呀,Ties de Kok开发出IPyStata实现了在Python环境下调用Stata。哈哈,放一张这个牛人的PPT。“The whole is greater than the sum of its parts.”

演示的环境:

  1. Win10;
  2. Anaconda 4.1.1 (64-bit);
  3. Stata/MP 14.1 (64-bit);
  4. IPystata 0.3.5。

简要安装步骤:

1.在CMD环境下输入“pip install ipystata”;

2.在CMD环境(管理员模式)下切换到Stata的安装路径;

3.注册Stata,输入“StataMP-64.exe /Register”,“StataMP-64.exe”是Stata的exe文件名称;

4.启动Jupyter,如图所示输入代码;

import ipystata
from ipystata.config import config_stata
config_stata('F:\ProgramFiles\Stata\StataMP-64.exe')

5.准备工作安装完毕。

下面来尝鲜一下具体的功能。

  • 导入数据。

  • 描述性统计与相关性分析

  • 一图胜千言。

  • 正常导入dta数据,再画图。

注意导入数据的地址写法。
  • 导入在线数据。

  • 终结者。

IPystata使用情况简述:
  1. 和Julia以Kernel的形式引入Jupyter不同,Stata是通过IPystata包的途径在Jupyter上显示。
  2. 基本可以使用,包括数据导入、描述性分析、绘图和回归。
  3. 不仅可以调用Stata原生命令,安装在本地的Stata插件也是可以使用,如图中的esttab。
  4. Stata的有些操作不能很好的显示在Jupyter上面。如list(List values of variables)。

更具体的信息可以关注GitHub上的IPystata。
编辑于 2016-10-18

文章被以下专栏收录