2004 (13)
2009 (42)
放空单的统计分析:
一组数值自平均值分散开来的程度的一种测量观念。一个较大的差,代表大部分的数值和其平均值之间差异较大;一个较小的差,代表这些数值较接近平均值。
例如,两组数的集合 {0, 500, 900, 1400} 和 {500, 600, 800, 900} 其平均值都是 700股 ,但第二个集合具有较小的差。
差可以当作不确定性的一种测量。在物理科学中,做重复性测量时,测量数值集合的差代表这些测量的精确度。当要决定测量值是否符合预测值,测量值的差占有决定性重要角色:如果测量平均值与预测值相差太远(同时与差数值做比较),则认为测量值与预测值互相矛盾。这很容易理解,因为如果测量值都落在一定数值范围之外,可以合理推论预测值是否正确。
定义及简易计算公式
假设有一组数值 x1, ..., xN (皆为实数),其平均值为:
此组数值的差为:
一个较快求解的方式为:
一随机变量 X 的标准差定义为:
须注意并非所有随机变量都具有差,因为有些随机变量不存在期望值。 如果随机变量 X 为 x1,...,xN 具有相同机率,则可用上述公式计算标准差。
从一大组数值当中取出一样品数值组合 x1,...,xn ,常定义其简易标准差:
这里示范如何计算一组数的标准差。例如一分钟内放空单的数值级别为 { 500, 600, 800, 900 } :
第一步,计算平均值
. n = 4 (因为集合里有 4 个数),分别设为:
用 4 取代 N
此为平均值。
第二步,计算差
用 4 取代 N
用 7 取代
此为差。
正态分布的规则
在实际应用上,常考虑一组数据具有近似于正态分布的机率分布。若其假设正确,则约 68% 数值分布在距离平均值有 1 个差之内的范围,约 95% 数值分布在距离平均值有 2 个差之内的范围,以及约 99.7% 数值分布在距离平均值有 3 个差之内的范围。称为 "68-95-99.7 rule"。
差与平均值之间的关系
一组数据的平均值及标准差常常同时做为参考的依据。在直觉上,如果数值的中心以平均值来考量,则标准差为统计分布之一"自然"的测量。较确切的叙述为:假设 x1, ..., xn 为实数,定义其公式
使用微积分,不难算出 σ(r) 在下面情况下具有唯一最小值:
几何学解释
从几何学的角度出发,标准差可以理解为一个从 N 维空间的一个点到一条直线的距离的函数。举一个简单的例子,一组数据中有3个值,x1, x2, x3。它们可以在3维空间中确定一个点 P = (x1, x2, x3)。想象一条通过原点的直线 L = {(r, r, r) : r ∈ R}。如果这组数据中的3个值都相等,则点 P 就是直线 L 上的一个点,P 到 L 的距离为0, 所以标准差也为0。若这3个值不都相等,过点 P 作垂线 PR 垂直于 L,PR 交 L 于点 R,则 R 的坐标为这3个值的平均数:
运用一些代数知识,不难发现点 P 与点 R 之间的距离(也就是点 P 到直线 L 的距离)是σ√3。在 N 维空间中,这个规律同样适用,把3换成 N 就可以了。
交易中最重要的是个股之间,各股与市场指数之间的相关性。市场风险无法回避,没有风险规避,任何交易无法长期保证获利。无论用那些局部函数来帮助预测。
交易数量差对多数人来说不透明,大交易商可以操纵。