高频量化交易,最常见的有两种:
做市商是从股票买卖 bid/offer 的差价中获取利润的,我对做市商没做过太多的研究,尽管高频做市交易肯定也需要算法,但我的感觉是算法相对简单。相比较而然,能否抢得先机,也就是能否在别人进入交易所服务器之前先获取数据,更为重要,这也是为什么很多做市商把计算机系统搬到离交易所服务器近的地方,或者接入光纤主干道,以提高获取数据的速度,也就是说,他们主要是靠硬件,或者说是靠蛮力取胜的。
而统计套利,也就是量化交易大牛Jim Simons采用的方法,靠的是智,也就是复杂的算法。
下面就简单介绍一下统计套利最基本的一点概念。
统计套利始于配对交易(Pairs Trading),最初是由Morgan Stanley一个年轻的程序员Gerry Bamberger开创的。Bamberger发现,每当有大额股票交易时,股票的价格就会有很大的波动,而交易完成后又会回到原来的价位。比如,某公司要卖掉大额的福特股票,起初的价格是15元,大额交易卖完后,价格很可能会跌倒14.5元,交易完后过一段时间,又会回复到原来的15元。他就想如何抓住这稳赚的0.5元利差,于是,他开始使用所谓pairs trading操作手法,在14.5元价格时long 福特, 同时Short 相似的股票GM做为对冲,这样就可以稳拿0.5的价差。
理论化地做一下延伸,如果一个时间序列(Time Series),比如说股票的价格序列,是平稳型(Stationary)的随机过程,满足随机正太分布,那就可以知道它的分布规律,并通过分布规律获利。比如,如果我们知道股票A的价格波动是平稳的随机过程,股票的价格大多都在8~12元之间震荡,那只要低于8我们就可以买,高于12就可以卖,这样就可以获利。
这其中的关键是数据序列必须要平稳,也就是说要有规律可循。
而在实际中,单个股票很少有完全满足平稳型随机过程的。如果单个数据序列不是平稳的,那如果把两个或多个时间序列整合成一个时间序列,无论是加减乘除还是别的操作,是否可以变成平稳的?如果能,就说明这些序列之间存在着协整性(Cointegration),如果新合成的时间序列是平稳的,一样可以利用它来获利。
打个比方,如果你去遛两只狗,每只狗的牵狗绳的长度是固定的,一个是3米,一个4米,往常你都会沿着固定的路线去遛狗,今天你想换一种遛法,你来到一个广阔的原野,或者来到一个诺大的广场,往常是你遛狗,今天是狗遛你,狗愿意走到哪里,你就跟到哪里。显然,按照这种走法,两条狗各自的行走路线是毫无规律可言,不是平稳的。但是,两条狗之间的距离,却是个平稳的随机过程,应该在0~7米间波动(假定你永远牵着狗)。
如果把上面两条狗的行动路线看成是两个股票序列A和B,各自是毫无章法可言,但A-B组成的新序列(相当于两条狗之间的距离),是个平稳的过程,可以用来获利,比如,如果A和B平日的差价是0~7元,一旦超出这个正常范围,就可以从中套利。
配对交易,只有两个之间相互对冲,风险太大。统计套利是把配对交易的两个股票,扩展到一篮子股票, 有long 的, 有short的, 也就是不仅是两个时间序列,而是扩展到多个时间序列,这一篮子股票也许各自不是平稳的, 但是合到一起组成一个新的序列,确是平稳的序列,这样可以从中获利。至于选哪个股票, 仓位多少,何时买卖,这就是Jim Simons比别人高明的地方。
统计套利做为一种均值回归方法, 是一种市场中性(market neutral)的策略, 也就是说理论上与大市的上下波动无关,尽管在实际中很难完全做到。
写这些,是鼓励别人去尝试这种方法呢?
恰恰相反,我绝不鼓励普通人去尝试统计套利,包括我自己。至少,我不会去尝试一种世上只有一个人能做成功的方法。容易成功的方法和途径多的是,何必要去选最难的那一种?!
而普通的配对交易,还是比较容易做的,至少从算法上来讲,难度不大。当然,是否能盈利,盈利多少,不好说。比如,金价和银价,银价和铜价,或者是同行业类似的股票之间,无论是差价,还是价格之间的比例,是否存在着获利空间,这个从算法上来讲是很容易的。
不鼓励别人去做,那还写它干什么?有的同学肯定会质疑。
还真是,如此说来,这篇文章还真是多余的!
建宁 2025/8/30