基于短周期价量特征的多因子选股体系

本篇报告中,我们将开创性的构建全新的多因子模型体系——短周期交易型多因子阿尔法选股体系。

通过交易型阿尔法策略的研究,我们发现在A股市场,与传统多因子模型所获取的股票价值阿尔法收益相比,交易型阿尔法收益的空间更大、收益稳定性也更强。

即便是最纯粹的价值投资者也不得不承认,交易行为在短期内对股票价格起着几乎是决定性的影响,而发掘这种交易型套利空间正是量化投资的优势所在,因此量化模型在这一领域内应有着广泛的运用空间。

在本篇报告所构建的交易体系中,我们总共构建、运用了将近200个短周期阿尔法因子,其中因子数据则均来自于个股日频率的价格与成交量数据。在此基础上,我们构建了基于短周期价量特征的风格中性多因子选股策略。

策略自2012年1月至2017年4月,在扣除所有交易成本后,较之中证500指数,实现年化超额收益率50.2%,最大回撤5.9%,信息比率4.67。

对交易成本的敏感性分析结果表明,由于对换手率与交易成本进行了最优平衡过程的处理,因此策略可容纳的极限交易成本接近双边1%,模型实战能力较强。

短周期交易型阿尔法体系既是对传统多因子体系的补充,也可以说是全新思路、独立设计的交易体系。在这其中,量化模型不再仅仅是低风险低收益的投资策略,同样也可获得高额的收益回报,而尽管我们在这其中还只是看到了冰山一角。

短周期交易型阿尔法策略体系的构建,希望对投资者的研究思路有所拓展,在量化模型最擅长的领域发挥其真正的威力。

一 引言

传统多因子模型在A股量化投资领域被广泛运用,在过去若干年内模型也获得较为稳健的超额收益。然而,由于市值效应在A股市场的影响过于明显,导致传统多因子模型或多或少都受其影响。

尤其是自2017年以来,随着市场风格发生的急剧变化,策略稳定性受到了一定冲击,其中主要原因不外乎以下3点:首先,阿尔法因子体系与市值因子相关性过高;其次,组合对风格的暴露控制力不足;最后,选股域与比较基准域之间的不匹配。总而言之,市场风格的变化对策略的影响远大于阿尔法因子本身所产生的波动,因此在当前市场环境下,对传统多因子模型的风格控制能力提出了更高的要求,即使没有显著的风格预判能力,那至少也需具备风格中性的控制能力。从目前市值因子的波动情况而言,小盘因子超额收益的黄金时代可能已经过去。

在本篇报告中,我们将开创性的构建全新的多因子模型体系----短周期交易型多因子阿尔法选股体系。这将是对原有传统多因子模型的极大补充,我们将从收益来源、有效周期、因子体系特征、组合换手率、策略设计等多个方面来分析我们所构建的新体系。

通过交易型阿尔法策略的研究,我们发现在A股市场,与传统多因子模型所获取的股票价值阿尔法收益相比,交易型阿尔法收益的空间更大、收益稳定性也更强,这与A股市场的投资者结构、交易制度、投资者交易特征有着很大的关系。在A股市场中,即便是最纯粹的价值投资者也不得不承认,交易行为在短期内对股票价格起着几乎是决定性的影响,而挖掘这种交易型套利空间正是量化投资的优势所在,因此量化模型在这一领域内应有着广泛的运用空间。

在本篇报告中,我们总共构建、运用了将近200个短周期阿尔法因子,其中因子数据则均来自于个股日频率的价格与成交量数据。在此基础上,我们构建了基于短周期价量特征的风格中性多因子选股策略。模型自2012年1月至2017年4月,在扣除所有交易成本后,较之中证500指数,实现年化超额收益率50.2%,最大回撤5.9%,信息比率4.67。策略设计以T+2日频率调仓,组合每期持股约为50-60只。

短周期交易型阿尔法体系既是对传统多因子体系的补充,也可以说是全新思路、独立设计的交易体系。在这其中,量化模型不再仅仅是低风险低收益的投资策略,同样也可获得高额的收益回报,而尽管我们在这其中还只是看到了冰山一角。

短周期交易型阿尔法策略体系的构建,希望对投资者的研究思路有所拓展,在量化模型最擅长的领域发挥其真正的威力。

二 阿尔法模型的评价标准

2.1 阿尔法模型的评价标准

在介绍交易型阿尔法策略新体系之前,我们有必要对阿尔法模型的评价标准再做些许的梳理,而这样的标准既适用于交易型阿尔法体系,同样也适用于传统阿尔法模型。

毫无疑问,投资必然是以结果为导向的,因此策略最后实现的收益风险特征是衡量阿尔法模型好坏的最终标准。但是,阿尔法模型的本质即是预测收益,因此在观察策略实际收益率之前,我们可以通过一些定量的方法,计算阿尔法模型的收益预测是否精确、是否显著,这样的判断将更有利于我们了解自己阿尔法模型的特性,提高投资成功的概率。

在我们的因子模型体系中,收益率分解是基本的假设前提。我们认为任意股票在同一时刻暴露于多种不同的风险因素下,它们之间的共同作用形成了股票价格的波动。因此,我们致力于寻找对绝大部分股票价格波动都有影响的共同因素,称其为风格因子,这部分收益则称为风格收益。而风格因子不可解释的部分,则认为是个股自身特有的属性,称其为特质因子,这部分收益则自然称为阿尔法收益。

即,股票收益率 = 风格收益+ 阿尔法收益。

其中,A股市场最为典型的风格收益包括行业风格、市值风格等。对于各大类风格因子(行业、贝塔、动量、市值、盈利、波动、成长、价值、杠杆、流动性)的定义,我们在之前的报告中已经做了详细的阐述,或详见附录1。

风格收益的特点在于显著但不可预测(或者说在我们的因子模型体系中不对风格收益进行预测),而阿尔法收益的特点是显著并且一定程度上可预测。

因此,阿尔法模型的目标应是针对阿尔法收益的预测,而不是针对股票整体收益率的预测。而评价阿尔法模型的标准也应是计算其对阿尔法收益的预测是否可靠。

从建模的角度而言,假设Rt是所有个股在某一期内的收益向量,Xindustry是定义的行业哑变量矩阵,Xstyle为定义的风格因子载荷矩阵(其中包括Beta、Momentum、Size、Earnings_Yield、Volatilty、Growth、Value、Leverage、Liquidity),我们通过回归方程的计算,可以得到:

其中,f industry和f style分别为行业因子和风格因子的因子收益率factor return,e则为当期个股阿尔法收益率截面。

值得注意的是,假设站在投资时点t时刻,我们可获得的变量仅为Xstyle和Xindustry,因此未来一期的阿尔法收益率截面et+1是需要预测的。

因而,无论我们选择何种因子定义、何种因子加权方式、何种收益率转化方式等,最后产生的计算结果都是阿尔法收益率的预测值,即

换言之,我们在t时刻末通过阿尔法模型计算得到t+1期的阿尔法收益率预测值E{et+1},而到了t+1时刻末,我们通过回归建模得到t+1期阿尔法收益率的实际值et+1,我们通过预测阿尔法截面与实际阿尔法截面之间的相关系数计算,即可对阿尔法模型该期的预测效果得到定量的评估,我们称其为阿尔法模型预测系数(IC of Alpha Model),即

那么,对于足够长的一段时间T,我们可以计算得到每期阿尔法模型预测系数的时间序列,接下来通过一些简单的统计检验就可以判断,阿尔法模型的预测性是否显著,例如T检验,即

显著性检验的结果即可视为对一个阿尔法模型的定量评价,那么对于若干不同的阿尔法模型就可以有严格的好坏区分。并且,从经验上而言,预测能力较强的阿尔法模型,其所对应的实际组合获取超额收益的概率也越高。当然,如果阿尔法模型预测能力的检验非显著,那么甚至都没有必要去尝试构造组合,因为最终即便实现的超额收益,若不是风格收益,那么也只是运气而已。

遗憾的是,传统阿尔法因子所构建的阿尔法模型体系,其预测能力在剔除市值因子的效用之后究竟有多强的显著性,值得深思。

2.2 阿尔法模型的预测一致性问题

至今为止,没有任何一个投资模型可以解释市场运行的一切变化规律。投资不需要真理,但是需要逻辑和依据。

在整个多因子模型体系中,策略的构建分为选股和组合两个步骤。选股即为预测阿尔法收益,组合则为实现阿尔法收益,两者互相独立却又一脉相承。

所谓阿尔法模型预测的一致性问题,指的是阿尔法因子的预测目标与组合实现的收益目标相一致。也就是说,阿尔法模型的预测过程与组合构造的实现过程需要有共同的目标。

举一些典型的例子来说明这个问题。我们经常利用分组计算收益的方式来考察因子的单调性,而这一过程其实是在对个股的整体收益率进行预测(风格收益+阿尔法收益),即选股目标为预测个股整体收益。而到了构建组合的时候,为了控制回撤降低波动率,我们加入了行业中性、市值中性等约束手段,即组合过程希望获取较为纯粹的阿尔法收益。显然,此时预测过程与组合实现过程出现了目标不一致的情况,在最后实现的超额收益中,因子的预测作用究竟体现了多少,便不得而知了。

另一种情况则恰恰相反,我们利用一些统计回归、截面正交等方式,在检验因子的时候就尽可能多的剔除各种风格的影响,最后得到因子对纯阿尔法收益的预测结果。但在组合构建过程中,没有对上述剔除的各种风格因子进行严格的中性约束,导致组合仍有一定的风格敞口暴露。此时预测过程与组合实现过程仍有不一致性的问题,因子预测的作用又大打折扣。

因此,在我们的多因子体系中,无论是传统多因子模型,还是本篇报告要介绍的交易型阿尔法体系,都尽可能的做到在因子检验、收益预测的过程中,剔除所有风格因素的影响,而在组合构建过程中,保持所有大类风格的中性化处理,最大程度的体现阿尔法模型的预测作用。

尽管,这种方式不一定是最优的,许多投资者或许认为承担风格收益的风险,获得的同样也是阿尔法收益。但正如我们上述提到的,投资需要的是逻辑和依据。对风格收益的预测就需要有独立的风格轮动模型,对市场涨跌的预测则需要有独立的择时模型。在我们的多因子体系中,我们大胆假设风格收益、市场收益难以预测,因此根据这样的逻辑,得到了因子模型和组合模型的推导结果,所有的策略设计过程做到逻辑严谨、有理可依、有据可靠。

阿尔法模型的定量评估和一致性问题是我们因子模型的理念基础,在此基础上,我们下面将介绍具体的交易型阿尔法新体系。

三 基于短周期价量特征的多因子选股体系

3.1 短周期交易型阿尔法策略的构建思路

传统多因子模型的收益来源,往往集中于财务数据的挖掘、分析师一致预期数据的挖掘,而只有一小部分是中低频价量特征的数据,因此传统多因子模型亦可称为价值型阿尔法模型。

而在A股市场交易行为具有很强的随机性,机构投资者的交易效率较之成熟市场亦不十分有效,加之T+0、融券卖空等交易机制的缺乏,导致在短周期由于交易行为所产生的定价非有效十分常见。只要是投资者交易产生的价格序列,就一定不是随机序列,而这一特征在A股更为明显。

因此,在这一领域内,超额收益有着更大的空间,量化模型也应该发挥其优势。我们将交易型阿尔法体系与传统阿尔法模型体系的特点做了简单的对比,具体为:

1. 超额收益来源:传统多因子模型的超额收益来源多为股票内在价值,而交易型阿尔法体系的超额收益来源则是交易行为;

2. 因子数据来源:传统多因子模型的因子数据来源集中于财务报表、分析师报告、及少部分中低频价量数据,而交易型阿尔法体系的因子数据则全部来自价格、成交领数据(本篇报告中,我们仅采用日频率价量数据,在后续的研究中日内价量数据也将被广泛运用);

3. 因子有效周期:传统多因子模型的因子有效周期较长,财务类因子的预测周期超过1个月甚至更长;而交易型阿尔法体系的因子有效周期则较短,一般都在1周以内,但是因子预测的显著性更强;

4. 有效因子数量:传统多因子模型的因子数量较少,并且更习惯于将多个有一定相关性的因子合成处理;而交易型阿尔法体系的因子数量则较多,不同因子贡献的边际收益较为独立;

5. 策略交易频率:传统多因子模型的交易频率为季度、月频率、周频率等中低交易频率,而交易型阿尔法体系的交易频率则为日内、日度、隔日等中高频率(本篇报告中,我们将策略设计为T+2日换仓);

6. 组合换手率:传统多因子模型的整体换手率偏低,策略年化双边换手率约为10倍左右,而交易型阿尔法体系的整体换手率偏高,策略年化双边换手率约为30-50倍左右(换手率与客观交易成本呈负相关,我们将在后面的研究中具体介绍);

7. 受市场风格影响:传统多因子模型的收益与市场风格有一定的相关性,这不仅是由于因子选择、组合构建的偏差所导致,同样与市场环境、因子底层逻辑有关,而交易型阿尔法体系与市场风格的相关性则相对较低;

8. 策略内在收益率:传统多因子模型的内在收益率较低,而交易型阿尔法体系的因子预测显著性更强,因而策略内在收益率较高。

9. 策略可容纳规模:传统多因子模型的容量规模较大,而交易型阿尔法体系的策略容量相对较低,对交易效率的要求相对较高。

3.2 一些显著的价量特征举例

本节中,我们将对一些显著的、便于直观观察的价量特征进行举例说明。在后期的因子构建中,我们将对这些 底层因子进行一些衍生、变化、合成,使得策略更加适应市场的实战环境。

我们在每一期的股票截面上,计算全部个股的价量特征因子值,随后进行统计显著性检验。具体的,我们将检验风格因子中性后的因子收益率、因子收益率IR、因子相关系数和因子相关系数IR(FactorReturn、Factor Return IR、IC、ICIR),其中检验时间均为2010年1月至2017年4月。

举例1:价量背离

经验观察:短周期内成交量逐步提升,价格不断下降;或成交量逐步下降,价格不断提升。

因子定义:

以短周期内个股均价序列与成交量序列的相关系数衡量价量背离的程度,相关系数越低,后期实现超额收益的概率越高,累计因子收益率仅在股灾期间发生波动,其余时间段均较为显著。

举例2:开盘缺口

经验观察:当日个股跳空高开或低开。

因子定义:

当日个股开盘缺口,短周期内有较强的动量效应,累计因子收益率较为显著。

举例3:异常成交量

经验观察:当日成交量较短周期均值异常放大、减小。

因子定义:

个股成交量的异常变化往往预示着阶段性反转,尤其是异常缩量,是阶段底部的特征。成交量的因子处理过程中应注意区分由于涨跌停导致的成交量异常变化。

举例4:量幅背离

经验观察:短周期内成交量逐步提升,振幅不断下降;或成交量逐步下降,振幅不断提升。

因子定义:

以短周期内个股振幅序列(最高价比最低价)与成交量序列的相关系数衡量价量背离的程度,相关系数越低,后期实现超额收益的概率越高,累计因子收益率是所有因子中稳定性最强的。

对价量特征进行因子化处理的最大优势在于,避免了利用单一模式在时间序列上进行买点和卖点的选择,因为这牵涉到开平仓参数的敏感性问题等,会带来很大的不确定性和参数过拟合的问题。

价量形态的精髓在于,以当前市场的运行特征,寻找价格运行的规律。如果说传统多因子模型更加重视因子背后的价值投资逻辑,那么交易型阿尔法体系则更加重视交易行为背后的规律显著性,从某种意义上而言,这恰恰是最为直白朴素的投资逻辑。

3.3 短周期价量因子体系的构建

本篇报告中,我们总共构建了191个基于价格和成交量数据的短周期阿尔法因子,其中数据维度均为日频率交易数据。本节中,我们对所有因子的构建给出了详细的定义方式,而在之后的章节中,我们将对因子体系的特征进行分析。因子明细详见下表,部分函数表达详见附录2:

3.4 因子检验及相关特征

本节,我们将通过一些特征分析,使得投资者对我们的短周期交易型因子体系有更深入的认识。

3.4.1 因子体系的显著性检验、相关性及有效周期

首先,我们对所有单因子进行有效性及预测周期检验,进而判断整个因子体系的可靠程度以及可预测的未来极限周期。其中,单因子显著性及有效周期检验的具体步骤如下:

我们统计了全部因子分别在预测周期为1天、2天、3天、4天、5天的情况下,年化因子收益率及信息比率。

其中FR_DAY1表示预测未来1天收益率的所有因子收益率分布,预测周期以此类推;IR_DAY1表示预测未来1天收益率的所以因子收率信息比率分布,预测周期同样以此类推,具体分布及统计情况如下:

从上述因子收益率的分布情况而言,大部分因子的年化因子收益率在2%-10%左右,极少部分因子收益率超过15%。从平均收益情况而言,因子体系对未来2天的收益预测平均收益最高,T+3日之后收益情况递减。

而从上述因子收益率的显著性水平情况而言,平均来说因子体系对越短周期的预测显著性越强,呈现明显的单调变化。而在T+4日之后,整体因子收益率IR均值未达到95%统计显著性水平。换言之,因子体系的预测周期极限即为T+4日。

对于因子体系的相关性问题,由于短周期因子体系的因子数量较多,我们则不再对任意两两因子做正交处理,而选择在构建完毕所有因子后统一处理,即在我们得到所有因子收益率f之后,我们分别计算任意两个因子k和k‘的因子收益率相关系数,即ICkk‘ = corr(fk,fk‘),若ICkk‘大于某一给定阈值y,则剔除因子收益率IR较低的因子,保留IR较高的因子。上一节中给出的因子体系,则是我们完成上述计算筛选后的结果。我们对所有因子收益率的相关系数分布情况及均值进行了计算,具体结果如下:

经计算,因子收益率相关系数分布均值仅为-0.0057,并且94%的因子收益率相关系数绝对值小于0.1。

上述因子收益率显著性、相关性、及预测周期的分析表明,在短周期内(T<4天)因子体系呈现了整体高显著、低相关的特征,这样的特点十分有助于因子模型在收益预测和实现组合收益的过程中,获得较高的较稳定的超额收益。

3.4.2 因子体系的预测能力

我们进一步考察因子体系对收益的预测能力,其中统计方法与我们在第二章中提到的阿尔法模型的评价标准相一致。

我们首先利用一定的转化方式,将全部因子转化为对个股阿尔法收益截面的预测值,并进而统计预测值与事后计算可得的实际值进行相关系数计算及其显著性检验。我们考察当预测周期t=1的情况下,模型预测系数(IC of Alpha Model)的计算结果,具体方法如下:

按照上述步骤,我们对因子体系的预测显著性进行了统计计算,其中时间自2010年1月至2017年4月,预测周期为T+1日频率,股票截面则为全A非St,我们分别统计了每日模型IC及30日IC均值,具体计算结果如下:

结果表明,因子体系在日度预测阿尔法收益截面的情况下,IC均值为0.057,模型预测系数显著性高达18.23,整体预测胜率接近90%,仅在2015年股灾期间有所波动,其余时间段稳定性较强。

因此从统计结果来看,我们构建的交易型阿尔法因子体系对短周期内阿尔法超额收益具有很强的预测能力,这既符合我们对交易型阿尔法收益特征的判断,也是随后构建策略获取较高超额收益的基础。

3.4.3 因子个数与模型预测能力的关系

本节讨论因子数量的问题,可能有投资者会疑问,是否真的需要运用如此多将近200个阿尔法因子。我们将从因子数量与模型预测能力的角度出发,来考察这个问题。

我们首先根据所有单因子检验的Factor Return IR排序,然后分别选取20个、40个、60个因子对阿尔法收益进行预测并计算模型预测系数及其显著性,以此类推直到用尽全部因子。其中检验时间仍为2010年1月至2017年4月,股票截面则为全A非St,具体结果如下所示:

从上述分析结果中可以看到,随着有效因子数量的增加,因子体系的预测能力也呈现单调的上升趋势。由于,我们采用因子收益率IR排序,因此曲线呈现了边际递减的形态,但这并不妨碍绝对预测能力的提升。

所以说,目前的因子数量还远未达到可预测收益的边界区域,因子体系的空间还是比较大的。其实,在一些海外知名的对冲基金中,也有类似的交易型阿尔法策略体系的布局,其所使用的数据范围、因子数量和算法种类远超想象,甚至存在因子数量在百万、上亿级别的情况,可以说是一种崭新的交易模式。当然,一味追求因子个数的增加是不合理的,关键还是在于对任意单个因子,必须达到必要的统计显著结果才可纳入因子体系。

3.5 组合换手率与超额收益

较高的组合换手率会使得投资者对策略实战效果有所担忧。对于大部分投资者而言,较高的策略换手率未必会带来更高的收益率,交易越频繁亏损越大也成为了较为普遍的现象。但是,对于量化模型获得较为稳定的阿尔法来源之后,提高投资换手率往往会带来收益率的显著提升。在众多的学术文献中,我们往往会看到一些选股策略或CTA策略在不考虑交易成本的情况下,实现了惊人的投资胜率和收益率。但是,在实际投资环境中,由于较高的换手率所导致的交易成本将大幅侵蚀策略的收益率,甚至导致最后的亏损。

因此,高换手率、低交易成本与高收益率可以说构成了投资的不可能三角,在策略设计的时候,必须寻找到三者之间的最优平衡状态。对于一些非常有价值的投资信号或阿尔法源,我们往往由于其所负担的每期100%的换手率而被迫将其放弃。但是,如果我们通过换手率与交易成本之间的平衡,将信号换手率控制在每月60%、40%甚至20%,那么该策略所获取的收益仍然将是非常可观的。

具体而言,控制组合换手率的方式有很多,大体上分为因子层面、优化目标层面和风险约束层面。

1. 因子层面的换手率平衡,是指在因子构建过程中,就考虑组合过程中的高换手问题,因此做加长周期、平滑等处理,但是这种方式对短期阿尔法损失影响较大,适合于中低频的传统多因子模型,不适合短周期交易型阿尔法策略。

2.优化目标层面的换手率平衡,是指在优化构建组合的过程中,以单次交易换手成本作为罚函数加入目标收益中,以实现考虑交易成本后的预期收益率最大化,具体的目标函数形式为:

其中wt为所需要求解的目标组合权重向量,Tc为设定的客观交易成本。

这种目标函数的构建很大程度的降低了策略对交易成本的敏感程度,尤其是对短周期交易型阿尔法策略。一般情况下,如果只以最大化预期收益率为目标函数,很有可能出现任意单次换仓比率均接近100%的情况,虽然这样有利于阿尔法的收益空间,但是牺牲的交易成本也过大。因此,上述目标函数的构造实现了阿尔法与交易成本之间的平衡,是组合最优的拐点位置。

当然,这样的目标函数构建对超额预测E(e)的预测精度要求较高,如果阿尔法模型的预测显著性不强,则也不适用这样的方法。

3. 风险约束层面的换手率平衡,是最为直观、简便的换手率控制方式,即在优化构建组合的过程中,在约束条件中严格控制单次换仓比例,即:

其中,TurnOver为设定的单次换手率上限。

这种方法的优点在于简洁直观、效果明显,并且可以保证换手率的控制效果精确可控。但是其缺陷也非常明显,换手比例限制过于死板,并未综合考量超额收益与换手率的关系,在某些情况下,可能会以牺牲较多的阿尔法空间为代价。并且,在规划求解的过程中,容易出现由于和其他约束条件相冲突导致方程无解的情况发生。

在我们的策略设计中,采用了第2种优化目标层面的换手率平衡方式,因此随着客观交易成本Tc的提升,策略的整体换手率将逐步降低,超额收益也将有所降低。我们将在下一节中,对策略的交易成本敏感性做实证分析,考察模型可容忍的极限交易成本。

3.6 基于短周期价量特征的风格中性多因子选股策略

至此,我们已经完成了因子体系构建、阿尔法收益预测、因子预测周期评估、换手率与交易成本的平衡分析。本节,我们将构建基于短周期价量特征的风格中性多因子选股策略。

3.6.1 策略设计

在整个策略的设计过程中,我们保持着2个原则:首先,尽可能的提高策略收益率。由于Alpha正比于,因此在因子体系贡献了较高较稳定的ICalphamodel的基础上,我们尽可能的提高尝试次数sqrt(n)。而在主动风控端sigmatarget,我们并未强行设定目标跟踪误差,因此模型在设计上,整体收益的空间较大。

其次,收益端与风险端的分离。我们以交易型阿尔法为超额收益的来源设计组合优化的目标函数,而在风控约束端,保持组合在所有大类风格因子层面的中性处理。这种收益与风险完全分离的做法,使得模型在获得较高较稳定收益的同时,尽可能的降低了回撤风险。策略具体构建步骤如下所示:

3.6.2 实证分析

本节,我们将对策略进行实证回溯分析,其中相关参数设定如下:

1)回测时间从2012年1月至2017年4月;

2)比较基准为中证500指数;

3)股票池选取全A非ST股票;

4)交易成本为单边0.1%,印花税0.1%,即Tc=0.3%;

5)行业中性约束中,因子敞口设定为正负5%(相对比例);

6)风格中性约束中,因子敞口设定为正负0.1;

7) 组合以次日开盘价模拟成交,并剔除停牌、涨跌停等异常情况;

策略具体结果及相关绩效如下所示:

上述结果表明,策略自2012年1月至2017年4月,相较中证500指数,实现年化超额收益50.2%,信息比率4.67,最大回撤5.90%,发生在2014年3月至4月之间,组合整体收益表现优异。分年度表现来看,2015年市场波动率大幅增加给予了交易型阿尔法策略更大的空间,当年超额收益超过100%,其余年份超额收益表现均在30%-40%左右。值得注意的是,在市场风格发生较大变化的2017年,截止4月末,策略仍然实现年化35%左右的超额收益,表现出策略收益来源与组合构造均与市场风格较为独立的特性。

从换手率的角度来看,策略年化双边换手率为48.2倍,单次平均换仓比率约为40%,而从分年化的换手情况来看,2015年牛市阶段的换手率相对较高,这也是导致该年度策略收益表现较好的直接原因。

整体而言,从我们的测算结果来看,短周期交易型阿尔法策略体系在收益空间方面较之传统价值型阿尔法策略有巨大的提升,并且在风格中性的配置下组合的稳定性仍然得到了较好的保证。

3.6.3 交易成本敏感性分析

本节,我们将考察策略对交易成本的敏感性问题,以检验策略可承受的交易成本(包括冲击成本)的理论极限空间。

在组合换手率与超额收益一节中,我们提出加入单次换仓成本罚函数作为目标函数的做法,即

其中Tc即为设定的客观交易成本。

从目标函数的构造来看,为了实现经交易成本调整后的超额收益最大化,策略随着Tc的不断提升,组合各期单次换仓比率将逐步降低,而阿尔法也将有所降低。接下来,我们将对Tc进行敏感性分析,设定Tc自0.3%不断提升至1%,观测策略整体的收益、风险及换手率等相关情况,具体统计结果如下图所示:

从结果来看,随着设定的客观交易成本不断增加,策略的年化换手率也随之降低。尽管策略的超额收益也逐渐下降,但是整体而言,由于做了相对平衡的目标函数控制,因此策略对交易成本的敏感程度并不会导致灾难性的结果发生。

可以看到,当Tc=0.8%时,组合年化超额收益率仍然接近30%,信息比率接近2.5,收益风险表现依然较为平稳。而当Tc=1%的情况下,策略的整体收益表现接近极限位置,若交易成本再提升,模型将会趋于失效。

当然,对交易成本Tc的估计有许多种方式,不同域的股票所产生的冲击成本也不尽相同,因此在实际操作中可以根据不同股票的模拟冲击成本将Tc做向量化处理,使得整体结果更为精确。

3.6.4 策略可容纳规模估算

收益、风险和资金容纳规模构成投资的不可能三角,在策略实现相对较高收益、较低风险的情况下,可容纳的资金规模相对不会很大,因此有必要对这类策略的规模容量做一定的估算。

我们以持仓组合中,各只股票当日成交金额的10%作为个股可容纳资金规模上限。同时,为了避免极端小成交金额对组合整体估计的偏差,我们以作用组合权重后所有个股可容纳资金规模上限倒序排列的95%分位数,作为当日策略可容纳规模上限估计值,测算时间与组合构造时间保持一致,具体结果如下所示:

从上述结果可以看到,策略可容纳资金规模与市场整体成交量相关,2012年至2014年,由于市场整体成交萎缩,导致策略可容纳规模在1亿左右。而2014年至2016年牛市阶段,市场成交活跃,因此策略可容纳规模大幅提升,最高接近7亿水平。而在2017年当前市场成交水平,策略可容纳规模在2到3亿左右。

因此,客观而言,对于资金量较大的机构投资者而言,完全利用该种交易型策略进行阿尔法投资不太现实,策略比较适合运用于多策略体系中的一支,或大部分资金可以布局于容量较大但收益偏低的传统价值型阿尔法策略中,而小部分的资金量布局于该类高换手且收益较高的交易型阿尔法策略中,提高策略组合的整体收益水平。

当然,从策略的设计上而言,同样可以通过降低一定的收益率来获取更大的资金容纳规模,期间的因子运用、组合构造等步骤是相对灵活、开放的。

四 总结与展望

本篇报告,我们开创性的构建了全新的多因子模型体系----短周期交易型多因子阿尔法选股体系。其中,我们将超额收益的来源锁定在由于交易行为所产生的机会中,试图获取与传统价值型多因子模型相独立的阿尔法来源。

由于A股市场交易行为随机性很强,并且机构投资者的交易效率亦不十分高效,加之T+0交易、融券卖空交易模型的缺乏,导致在短周期内由交易产生的定价非有效情况较为常见。通过研究我们发现,与传统价值型阿尔法策略相比,交易型阿尔法的收益空间更高,稳定性也更强。

在本篇报告所介绍的交易型阿尔法体系中,我们总共构建、运用了将近200个阿尔法因子。研究分析表明,因子体系呈现出了高显著、低相关的特征,对超额收益具有很强的预测能力,这为后面策略构建提供了坚实的保障。

在策略设计方面,我们通过超额收益的因子化预测转换、换手率与交易成本的平衡、收益端与风险端的分离等方式,实现了策略整体的设计,回测结果表明,在可接受的交易成本和资金容量的情况下,模型可实现较高且稳定的超额收益。

尽管如此,在整个研究过程中,我们感觉到只是看到了交易型阿尔法空间的冰山一角。在海外成熟市场,类似的统计套利型的阿尔法策略占到了整个量化投资的半壁江山,因此该类策略或许也是量化投资的重要发展方向之一。

并且,随着近些年来,人工智能、机器学习算法的飞速发展,未来交易型阿尔法模型体系将大量运用该类算法去进行因子挖掘,但是这并不意味着机器将替代人类,对于投资者而言,底层的投资逻辑和策略设计仍然掌握在其逻辑框架中,这是任何技术都无法改变的。

在后期的研究中,数据源的拓展也是一个核心的方向,当前策略体系我们仅仅是利用了日频率的价量信息,而日内的高频数据则包含了更为显著的预测信息,是值得深入研究的方向。此外,场外的数据信息同样包含大量的预测信息,通过整体的策略设计,模型可提升的空间仍然较大。

短周期交易型阿尔法策略体系的构建,希望对投资者的研究思路有所拓展,在量化模型最擅长的领域发挥其真正的威力。

原文地址:https://www.cnblogs.com/fangbei/p/8393936.html

时间: 2024-10-10 17:05:46

基于短周期价量特征的多因子选股体系的相关文章

基于人体部件小边特征的多行人检测和跟踪算法

基于人体部件小边特征的多行人检测和跟踪算法 detection tracking edgelet feature multiple occluded human Bayesian combination 读"B. Wu, R. Nevatia. Detection and tracking of multiple, partially occluded humans by Bayesian combination of edgelet based part detectors[J],IJCV,7

单台设备基于63G的数据量快速完成mysql主从搭建

一.演示课题说明: 单台物理机利用xtrabackup工具在线备份63G的mysql数据,来新建slave库.演示的目的主要是记录下在单台物理服务器上利用63G的测试库数据,然后在本机上快速新建一个slave库,大概需要多久完成.以及在新增的slave的过程中对master库锁表影响多大? 二.设备和系统环境说明: 设备环境: x86_64位最小化安装 [[email protected] scripts]# cat /etc/redhat-release CentOS Linux releas

基于短消息的远程家电红外遥控系统

通过远程广域网控制家电设备是信息家电的主要发展方向之一.由于价格低廉.覆盖面广.使用方便等原因,短消息平台已经成为远程家电控制的重要方法. 本文研究和开发了一种基于短消息的远程红外遥控系统.该系统以Java语言应用程序作为客户控制终端,以短消息作为控制信号的传输平台,以家电常用的红外遥控器作为控制设备,形成了比较完备的远程家电控制系统原型. 本文首先分析了广域网传输技术.家电控制设备.客户控制终端等三个关键技术的选型问题,并据此提出了系统设计的总体结构. 随后,本文介绍了系统的硬件设计,着重讨论

分表需要解决的问题 &amp; 基于MyBatis 的轻量分表落地方案

分表:垂直拆分.水平拆分 垂直拆分:根据业务将一个表拆分为多个表. 如:将经常和不常访问的字段拆分至不同的表中.由于与业务关系密切,目前的分库分表产品均使用水平拆分方式. 水平拆分:根据分片算法将一个表拆分为多个表. 如:按照ID的最后一位以3取余,尾数是1的放入第1个库(表),尾数是2的放入第2个库(表)等. 解决的问题:单纯的分表可以解决数据量过大导致检索变慢的问题. 分表无法解决过多并发请求访问同一个库,导致数据库响应变慢的问题.所以通常水平拆分都至少要采用分库的方式,用于一并解决大数据量

【ACM Chp2】一致预期收益率:资本资产定价模型 之 特征组合(因子模拟组合)

一.关于特征组合(Characteristic Portfolio) (一)特征组合与因子投资 近年来,人们更多地关注于如何配置因子或者发现一个新因子,但作为因子投资基础的因子组合构建方法受到的关注却要少很多.CP又名纯因子组合,在较新的学术研究中一般也称作factor mimicking portfolio(因子模拟组合),或纯因子组合.它表示一个对某个因子暴露为1而对其他因子暴露为0的投资组合. 通过构建某个因子的CP,我们可以将CP的收益作为factor risk premium,也可以用

【人脸检测——基于机器学习4】HOG特征

前言 HOG特征的全称是Histograms of Oriented Gradients,基于HOG特征的人脸识别算法主要包括HOG特征提取和目标检测,该算法的流程图如下图所示.本文主要讲HOG特征提取. HOG特征的组成 Cell:将一幅图片划分为若干个cell(如上图绿色框所示),每个cell为8*8像素 Block:选取4个cell组成一个block(如上图红色框所示),每个block为16*16像素.Block的滑动步长为8像素,如黄色箭头所示 Detection Window:令64*

万张PubFig人脸数据实现基于python+OpenCV的人脸特征定位程序(1)

在最近刷今日头条以及其他媒体软件时,经常会发现一些AI换脸的视频,于是我想,可不可以自己实现一个可以进行人脸识别的软件程序.我的具体流程是先配合python网络爬虫先进行万张PubFig人脸公共图片的爬取,分析出图片具体特征,然后再配合机器学习的OpenCV视觉库进行软件的构建.有一篇Github的文章讲得很详细,大家可以参考:https://github.com/Hironsan/BossSensor. 前几篇博客先向大家讲解如何爬取PubFig人脸数据,然后本片的话先用一些动漫人脸图片,向大

Linux根文件系统裁剪 论文阅读笔记

Linux裁剪方法研究 2006 2 Linux裁剪原理: 2 Linux嵌入式系统根文件系统的选择与制作 2006 3 Linux嵌入式系统根文件系统的选择与制作 2006 3 基于ARM的嵌入式Linux操作系统移植的研究 2006 5 基于ARM的嵌入式文件系统研究与设计 2010 6 基于嵌入式Linux的Ext2根文件系统制作分析 2015 6 嵌入式Linux裁剪研究 2009 7 嵌入式Linux根文件系统的构建与分析 2015 8 嵌入式Linux共享库裁剪技术分析与改进 200

基于特征的推荐算法【转】

http://in.sdo.com/?p=2779 推荐算法准确度度量公式: 其中,R(u)表示对用户推荐的N个物品,T(u)表示用户u在测试集上喜欢的物品集合. 集合相似度度量公式(N维向量的距离度量公式): Jaccard公式: 其中,N(u)表示用户u有过正反馈的物品集合. 余弦相似度公式: UserCF公式: 其中,S(u,k)表示和用户u兴趣最接近的K个用户集合:N(i)表示对物品i有过正反馈的用户集合:w(u,v)表示用户u和用户v的兴趣相似度:r(v,i)表示用户v对物品i的兴趣.