由于量化策略研究需要用到尽量全的历史数据,包括:股票、外汇、期货、基金等等的分钟、小时、日历史数据,而且数据尽量全,最好能从九几年起。所以我在网上做了较多的搜查以找到可用的数据源。以下分别列出几个方案,并讨论其优缺,最后总结出一条可行的路。
Tushare 数据接口:
该接口基本是使用新浪的数据源做一个python的封装。而且目前只针对股票,能获取到日线数据较为完整。分钟线和小时线都不行,明细数据有些股票能获取到较早的时间,大概2004年左右。
直接新浪 数据接口:
该方法能获取到股票、外汇、期货的历史及实时数据,股票数据情况同tushare。期货外汇的数据都不是很全。期货的明细获取办法暂时未找到。
通联数据:
该渠道还是主打事实数据为主,历史数据接口还没找到较好的。这个也要付费,但可以试用。
Wind 数据接口:
下载wind 客户端,可以开启Python接口,可以通过获取到期货、外汇、基金等等一系列产品的实时以及历史行情,包括日线、小时、分钟。具体最早能获取到多早未知。但是要付费! 3.8万一年。
盈透 IB 数据接口:
需要获得IB的账户才能使用它的接口获取数据,数据获取也有一定的限制。但相对来说,如果在那里进行实盘交易,获取历史数据就相当于免费。具体的限制可以参加这里。
直接购买:
淘宝能搜到不少提供历史数据的商家。网上找到一个微盛投资,可以提供各种历史数据,也比较全面。但这家公司如何未了解。
手动下载:
这个方法基于软件。MT4平台主要可以下载外汇和股指的历史数据,直接导出成csv格式,也很全面。缺点是手动,而且没有股票和较全的期货数据。
其余的方法,比如Yahoo的数据等还未具体调查,但基本可以认为并不比以上的方法好。
总结:
先通过tushare和新浪的接口获取股票、期货、外汇的数据。然后做好数据整理。如果需要较为完整的数据的地方,可以通过手动下载的方式。后期再使用wind和盈透的数据。如果盈透和wind的数据也不够完整,可以考虑数据购买。