Python量化回测常见陷阱有哪些

发布时间：2021-11-20 09:26:47 作者：iii
来源：亿速云阅读：229

这篇文章主要介绍“Python量化回测常见陷阱有哪些”，在日常操作中，相信很多人在Python量化回测常见陷阱有哪些问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”Python量化回测常见陷阱有哪些”的疑惑有所帮助！接下来，请跟着小编一起来学习吧！

很多量化交易的朋友在指定策略时往往容易犯下这几种类型的错误：前视偏差、不设置滑点、无手续费、过度优化等。这些错误可以使你在回测阶段把不盈利策略变得盈利，但是在真正的交易中却会造成灾难性的后果。

首先介绍下前视偏差。前视偏差是指在策略回测阶段采取了未来的信息来决定之前的交易，而这些信息在实盘操作中是无法获知的。这里我们提供几个典型的案例来介绍下：

买入策略1：“当天的收盘价突破前一天的最高价，则利用当天开盘价买入股票”，很明显，在开盘价成交几乎是不可能的事情了。

前视偏差是我们要极力避免的错误。如何避免前视偏差？可以使用“滞后”的历史数据来计算策略信号。滞后的数据意味着，在涉及到移动平均值、最高价、最低价、成交量等指标时，只使用“上一”交易日的收盘数据。比如：

shift(1)是在index不变的情况下对序列的值向后移动一个单位。目的是获取昨天为止的最高/最低价格。这样就能使用“滞后”的历史数据来计算策略信号。

如果一个交易策略要求你利用信号触发时的价格进行交易，那么这个交易策略就存在偷价的情况。

很多人会低估偷价的危害性，事实上，固定点数的偷价相当于在原本的资金曲线上叠加了一条斜率为正的直线（在每次交易都是固定手数的情况下）。假设一年250个交易日，每个交易日均对一只长期保持10元的股票执行一次100股的买卖，每次买卖都偷价1个tick（tick设置为1个点，即0.1元），那么全年下来可以多获利5000.1100 = 5000元，这甚至超越了你的本金（10*100=1000）。

然而，现实的情况是不但无法低于一个tick的价格成交，更多的反而是高于一个甚至多个tick的价格成交。原因很简单，大多数趋势交易者都会在某个关键点位建仓，竞争导致价格在这些关键位置形成剧烈波动，并且这种波动通常是对程序化交易不利的波动。所以在构建一个频率较高的交易系统的时候，更多是要考虑和解决滑点问题。

手续费相当于在原本的资金曲线上叠加了一条斜率为负的直线（在每次交易都是固定手数的情况下）。策略进行测试时，如果不计入手续费，资金曲线可能会产生巨大差异，甚至不计手续费时盈利的策略，在计入手续费后可能产生亏损。

当前股票交易费用由三部分组成：佣金、印花税、过户费（仅上海股票收取）

印花税：成交金额的1‰ 。
过户费：这是指股票成交后，更换户名所需支付的费用。此费用按成交金额的0.02‰收取。
交易佣金：最高收费为3‰，最低收费5元。

假设你买入10000股，每股票价格为10元，以此为例，对其买入成本计算：
买入股票所用金额：10元/股×10000股=100000元;
过户费：0.02‰×100000=2元;
交易佣金：100000×3‰=300元(按最高标准计算，正常情况下都小于这个值);
买入总成本：100000元+300元+2元=100302元(买入10000股，每股10元，所需总资金)
若以10.08每股卖出价格计算：
股票金额：10.08元/股×10000股=100800元;
印花税：100800元×1‰=100.8元;
过户费：0.002%×100800元≈2元;
交易佣金：100800元×3‰=302.4元;
卖出后收入：100800元-100.8元-2元-302.4元=100394.8元;

滑点是指触发指令的价格和最终成交价格之间的差异，它是难免会发生的情况，通常滑点产生的原因有以下两类：

1.行情波动剧烈、市场容量不够等情况导致的

2.网络延迟、交易平台不稳定等情况导致的

滑点是一个合格的交易策略必须充分考虑的因素。如果在一个交易策略中，将滑点数设置为0，即采用现价指令买卖证券其资金曲线就会优于同一个滑点数不为0的策略。通常我们要在最极端的条件下去构建和测试系统，一般系统都是高于2个tick的滑点来构建的。

接下来谈谈过度优化。过度优化是指为了迁就历史数据的噪音而将一个策略的参数或者规则反复优化到最佳的情况。

假如要把某个策略的资金曲线做的非常出色，我们可以这么优化：针对某段特定的行情进行参数优化，之后将分段行情对应的资金曲线拼接起来，得到一个表现更优秀的资金曲线。也可以指定过去某几个表现较差的交易日不进行交易。上述经过加工的回测一定表现优异，单纯为了追求资金曲线，这类策略模型仅仅适用于过去发生但未来不会再重现的历史偶然事件，并不考虑是否适用于未来的行情。

避免过度优化的有效办法有以下几个：

一般而言，策略的规则越多，模型的参数越多，就越可能出现过度拟合问题。因此采用的参数越少，可以优化的规则越少，自然过度优化的情况就能够得到很好的避免，并且，越少参数构建的策略，往往越稳健，无论其时效性或鲁棒性均能超越众多复杂的策略。

合理选择样本。有些策略覆盖的股票品种太少，时间周期太短，不能充分展现策略效果。这些策略只能用于个别品种上，或者在更长时间周期上的资金曲线可能表现的并没有那么好。有些策略虽然覆盖了较长的时间段，或较多的品种或市场，但仅仅覆盖了一种类型的行情（例如一轮较长时间的大牛市）。这些策略在遇到截然不同的市场情况时，表现可能会大相径庭。

进行样本外测试。构建策略模型时，将历史数据根据时间先后分为两段。参数优化和定性选择使用前一段数据（训练集），策略模型的测试使用后一段数据（测试集）。两段数据的大小要大致相等，若数据量不够，则至少用三分之一的数据做测试。训练集的最小含量由样本含量经验规则确定。

到此，关于“Python量化回测常见陷阱有哪些”的学习就结束了，希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习，快去试试吧！若想继续学习更多相关知识，请继续关注亿速云网站，小编会继续努力为大家带来更多实用的文章！

Python量化回测常见陷阱有哪些

相关阅读