智慧即财富

陈立功的文学城博客：驰纵骋横，谈今博古，飞花扬月，行文交友

首页文章列表博文目录

个人资料

TNEGI//ETNI (热门博主)

给我悄悄话

博客访问：

数学家们在统计学领域犯下了几个严重的错误

(2012-08-27 18:04:59) 下一个

数学家们在统计学领域犯下了几个严重的错误
陈立功，一个医学背景的生物统计硕士

稳健回归的开创者、美国著名的统计学家、前美国总统科技顾问Peter John Huber于1997年11月在北京中国科学院数理统计研究所演讲时说道：“很多数学背景的统计学家习惯于用数学的确定性思维模式来思考和解决统计学领域的非确定性问题，由此犯下了一些严重的错误，导致了很多思想和方法上的混乱。”他并期待着一股来自数学以外的力量能够推动统计学和数学的变革。
  听到这个演讲内容和观点后，我的第一感觉是，如果这个力量存在的话，那么，它只能是哲学，因为哲学是人类一切知识的认识论和方法论根源，因而也是一切知识的终极裁决者。
  其实，哲学并非什么艰深玄妙的东西，它是一种智慧，引导人们分辨万事万物的性质是怎样的，有何区别和相似之处，进而认识它们是什么，相互间有何关系。因此，一个学统计的，如果不懂哲学或缺乏基本的哲学素养，便如一个在黑暗中摸索的瞎子。对于在黑暗中感到困顿的人，哲学将会开启他的智慧，并赋予他一盏明亮的灯，照亮他前进的道路。
  最近试图与几位著名的数学背景的统计学家交流自己的思想，但无一愿意给出有价值的东西，他们基本采取了沉默不语或不屑理睬的态度。为此，我把这个试图与他们交流的东西发表在自己的博客里，作为十四年多来自己对整个系统的持续挑战的组成部分之一。这个挑战将一直存在于这里，以便人们可以观瞻这一科学史上的悲剧。

Dear Dr. XXX，

您能够解答我的以下两个困惑吗？
  我在长达近14年多的时间里做的是关于临界回归分析或分段回归分析（segmented regression or piecewise regression）的逻辑与算法的重建。我之所以坚持不懈地这样做，是因为我相信没有一套数学公理系统可以演绎出这个方法论，而当前的方法论存在严重的理论错误。这个领域里最困扰我的问题有以下两个：
  第一，在基于样本测量的基础上在样本可测空间上搜索未知临界点时，目前的经典方法论是以随机分段模型组中最小合并预测残差（min(combined residuals)）作出一组“最优”的模型决策，也就是所谓的最优化决策。我想请问，这个决策的数学根据是什么？谁已经或能够从概率论上证明那个最小合并预测残差与所谓的“最优临界模型组”的随机参数集合之间的对应是一个“可期望的”或“可靠的”对应，或者说，上述两个随机测度的收敛在各自的可测空间上具有概率上最大且充分的一致性。
  我从直觉上看这个对应是不可期望的，因为无论是最小合并预测残差，还是对应于它的随机临界模型组的各个统计量都是随机的“点”测量，它们之间的对应关系就好比我们在一定的样本量条件下得到的一组同质人群的身高与体重之间的随机的点对应一样。如果我们的研究目的是试图用“身高”这个随机变量来对“体重”这个随机变量的某个属性做出统计决策，我们显然是不可能使用min(身高)或max(身高)来做出一个关于“体重”的那个属性的稳定而可靠的决策的。这样的“最优化”在统计学上是绝对不可接受的，因为，If we could use min(X) or max(X) to make a statistical decision for Y, where both X (maybe an optimizer) and Y (maybe a set of parameters of a set of threshold models) are randomly variable, then all the fundamentals of Statistics would be collapsed. 其实，早在1962年，John Tukey就在其著名的长篇文章《The Future of Data Analysis》里警告过人们“最优化”在统计学中的危险性。
  第二，关于spline技术在临界回归分析中的应用。这里有一个前提假设，即所谓的enforced continuity，这个假设是以数学函数理论求解临界点的关键条件。没有这个假设的给定，就无法使用解联立方程组的方法求解未知临界点。但是，从统计学的角度，如果一个总体中存在一个临界点，那么，在随机抽样的条件下，在样本临界点（如果它可以被以另外的方法估计出来的话）附近的两个临界模型间将必然存在一个抽样的连接变异（这是一个确定性的存在），至于这个连接变异有多大多小，nobody knows（也即这是一个非确定性的存在），从而，我们不可以强制性地预设那个“连续性”来建立一套方法论。反之，如果坚持采用那个强制连续性的假设，就等于是用一个确定性的假设来否决了一个确定性的存在，并以假定的方式肯定了一个“非确定性的存在”的不存在（非确定性的连接变异 = 0，即肯定了“非确定性的连接变异”的不存在）！这是一个令人惊叹的低级错误。
  If the continuity between two adjacent threshold models is not inferred in a probability, it is not a statistical method but a mathematical game with an arbitrary assumption in a certainty for an uncertainty.
  所以，我认为以上两个问题可能是统计学方法论发展史上的两个悲剧性错误。我在2007年和2009年的JSM会议上曾两次谈到了这两个错误，也曾试图投稿发表自己的见解，却被所有杂志社拒绝了，但却从来没有人对这类拒绝的理由给出任何专业方面的解释。这些期刊包括（按投稿时间顺序）：
   Biometrics (2次修稿。唯一评论：目前的方法比这个好)
   Statistics in Medicine (1次投稿。唯一评语：没有创新)
   JASA (3次修稿。第一个评语：本文的思想确实有趣(definitely interesting)，但数学表达不规范，会使审稿者感到burden。最终评语：该文不适合发表)
   Biometrika (1次投稿。唯一评语：本刊空间有限)
   Annals of Statistics (7次修稿。第一个有意义的评语：本文试图挑战the large body of Statistics and Mathematics,但以本文目前的英语写作水平，不足以令读者信服。最终评语：建议投稍微低一点的刊物)
   Computational Statistics and Data Analysis (2次修稿。唯一评语：作者有点妄言)
   The American Statistician (1次投稿，唯一评语：无法判断本文的观点和方法是否正确)
  上述两个问题我曾请教过哈佛统计系的主任孟晓犁(Xiao-Li Meng)以及当前的Annals of Statistics的副主编蔡天文(Tong Cai)，然而，这两位杰出的数学背景的统计学家无一愿意回应。所以，那两个困惑对于我依然待解，我相信没有哪个数学背景的数理统计学家可以给出关于它们的肯定的论证，因为它们本是统计学领域的两个谬论，是由于概念缺失导致的分析逻辑和数学算法上的错误。
  人们可以继续无视我所做出的东西，因为作为国内医学院毕业的master-level的我在统计学领域的credit可以被忽略不计，但问题将依然存在。正如Dr. Huber在讨论导致他所说的那些错误的原因时所指出的那样，“一些数学家习惯于以他们的确定性思维模式来解决非确定性领域的问题”，这是统计学领域中一切错误和问题的根源所在。

[ 打印 ]

[ 加入书签 ]

阅读 () ┆ 评论 (152)

TNEGI//ETNI 2012-09-01 12:04:21 回复悄悄话回复chinomango的评论:

很遗憾，你连我的第一个问题及其所涉及的领域都没搞懂。你的观点与本人的话题没有多少关系。

chinomango 2012-08-31 23:44:16 回复悄悄话我不是专家甚至读不懂你“第二”里那些拗口的段落。不过“第一”的问题，好比你要估计班上同学的身高，用的是随机分组后身高最接近的一组的身高来建立模型。没人可以证明那是最优的，但由直觉可以认为它是局部最优的。除非你能提出更好的建模方法，你也不必从理论上证明最优，只要实际中有几个重要的例子就值得发表了。
统计学里许多东西未必可以证明，即便可以证明，实践中样本有限也未必没有误差。就像结构力学的计算，要保险的话加裕量是唯一办法。

YY101 2012-08-31 06:06:29 回复悄悄话回复TNEGI//ETNI的评论:我说的不是数学定理,而是误差在你模型构造中的表达.不在模型构造中的误差,就没有什么统计可言.

TNEGI//ETNI 2012-08-30 20:31:09 回复悄悄话
回复YY101的评论:

>在你的眼光里面，均值为零的是随机误差，均值不为零的是系统误差，……<

这是你对我的话语的误解。我从来没有这样说过随机误差和系统误差的含义是这样的。误差在测量行为中，不在数学定理中。

我们之间对统计学的理解确实存在很大的差异。我无法相信一个数学背景的统计PhD会如此理解和操作统计学。

YY101 2012-08-30 19:53:04 回复悄悄话同时,即便按照你的说法,θ也是由系统误差与随机误差两部分组成,二者仍然分不开.

YY101 2012-08-30 19:29:44 回复悄悄话回复TNEGI//ETNI的评论:好了,我不在继续参加这样的讨论了.我前面提到过,你必须给出你的观点的准确数学定义与描述。从你这个贴里面，我可以看到你对所谓系统误差与统计测度等概念的认识,与我所知道的完全是两码事情。在你的眼光里面，均值为零的是随机误差，均值不为零的是系统误差，这与我的认知不同.我也不想继续争论下去，这样没有共同基础的讨论不具备实际意义。

TNEGI//ETNI 2012-08-30 17:27:26 回复悄悄话回复YY101的评论:

>你说利用两组采样样本来分离系统误差与随机误差,而两组数据中都包含两种误差,这种分离是不可能的.<

你再次令我瞠目结舌。我不知道你学的是何方统计学，也不知道你的学历背景究竟是否与统计学有关，更不知道你是否在统计学这个领域从事过多长时间的工作。你连t-test最基本的思想都没弄清楚。

我所说的是，在两个样本的“均数之差”这个测度中，存在着系统误差和随机误差，因为这两个样本毕竟来自可以区别定义的两个总体，或两个“系统”，但我们不知道这两个“系统”的随机抽样分布是否具有一致性，因为无论我们怎样抽样，也无论抽多少次样，每次一抽样结果中的两个样本的均数间一定存在一个差异，这个差异本身也是一个随机测度。如果两个总体的分布一致，则多次抽样的两个样本均数之差的分布应该服从均数为μ=0，标准差为θ的正态分布；反之，如果这个差偏离μ=0，则表明两个“系统”间存在有显著意义的差异。此时，我们将可以看到两个均数之差除了随机误差（它在这个差的一次性随机测量中发生的概率很小）之外，其系统误差便有了显著性的意义。

在两个样本的某一同名连续型随机变量的分布比较中，在各自样本内部应该没有系统误差，而该随机变量的测量方法和工具对于两个总体也必须是一致的。因此，在比较中的两个样本均数之差中的“系统误差”便只来源于那些用来有区别地定义两个总体的不变属性，例如，一组“高血压病”患者的血压，和“健康”人的血压。这里，“高血压病”和“健康”分别是用来定义两类人群的不变属性，亦即两个类别群体中的每个个体都分别拥有各自的同一属性，即对各自总体来说不变的属性。

YY101 2012-08-30 15:16:05 回复悄悄话回复TNEGI//ETNI的评论:无论是抽象的还是具体的,我没有必要去重温T TEST.你说利用两组采样样本来分离系统误差与随机误差,而两组数据中都包含两种误差,这种分离是不可能的.许多人热衷于抽象思维,但最容易犯的错误是在开始阶段就忽略了细节,从而所有讨论实际上没有意义.换句话说,在1+1=3的前提下,四则运算的规则都可以重新讨论了.

TNEGI//ETNI 2012-08-30 14:57:04 回复悄悄话回复YY101的评论:

>也许你应当把你那两个样本是如何得到的描述一下,我们来看一看其平均数只差是什么.<

我在前面以t-test为例和你展开了一点讨论。这个例子是一个抽象的t-test例子，具有一般两样本t-test的全部特征。建议你去重读一本统计学教材中关于t-test的内容，并重温一下最基本的统计学概念。

YY101 2012-08-30 10:59:15 回复悄悄话回复TNEGI//ETNI的评论:也许你应当把你那两个样本是如何得到的描述一下,我们来看一看其平均数只差是什么.

TNEGI//ETNI 2012-08-30 04:17:03 回复悄悄话回复YY101的评论:

>也许我需要你用完整准确的数学语言将你的假设写出来,……<
>你的H0与H1是互补的吗?<

关于一个假设检验中的两个假设的哲学式的或数学化的陈述可以参考任何一本统计学教材。一般而言，两个陈述是互为对立的，因而也是互补的，因为要检验的那个差别（例如两个样本的平均数之差）由且仅由两个部分构成。

>如果随机误差在全部差中发生也在两个总体间的系统性差别在样本所体现的信息中发生,算哪边的呢?<

这个问题不成立，因为随机误差与系统误差属于两类不同性质的误差，因而不可能发生在对方的范畴内。

由于总体中的个体变异和抽样的随机性，在一个假设检验中，我们不能通过一次抽样直接计算出两类误差分别有多大，于是采用一个概率来衡量各自发生的可能性大小。

YY101 2012-08-29 21:14:24 回复悄悄话回复TNEGI//ETNI的评论:首先,你的H0与H1是互补的吗?如果不是互补的,假设检验的设立就有问题.如果随机误差在全部差中发生也在两个总体间的系统性差别在样本所体现的信息中发生,算哪边的呢?

YY101 2012-08-29 21:07:57 回复悄悄话回复TNEGI//ETNI的评论:也许我需要你用完整准确的数学语言将你的假设写出来,不过我相信这里肯定有你忽略的东西在里面,而且这种忽略是有问题的.

TNEGI//ETNI 2012-08-29 21:03:14 回复悄悄话回复YY101的评论:

>难道你是说两个样本均值中间一个有系统误差,一个没有系统误差?……<

No,两个样本的均值之差在结构上由两类误差组成。所以，检验的假设是两个，即H0和H1。检验概率p判断的就是随机误差在全部差中发生的可能性，而其对立面1-p就是用来判断两个总体间的系统性差别在样本所体现的信息中发生的可能性。

YY101 2012-08-29 20:56:29 回复悄悄话回复TNEGI//ETNI的评论:难道你是说两个样本均值中间一个有系统误差,一个没有系统误差?如果你能够得到没有系统误差的均值,有系统误差的测量还有意义吗?同时,你如何保证两组数据中的随机误差是一样的呢?这是做不到的.量一组人身高,然后让他们站在凳子上再量一次.测量误差会不同的.

TNEGI//ETNI 2012-08-29 20:47:57 回复悄悄话回复YY101的评论:

>你用T-TEST就隐涵了你把系统误差作为随机误差的一部份.<

这句话让我感到震惊了。假设检验的两个选项就是根据系统误差和随机误差来分别设定的。

TNEGI//ETNI 2012-08-29 20:46:00 回复悄悄话回复YY101的评论:

>这样定义个体变异对统计学来说是没有意义的.一捆一尺长的尺子,长度有微小差别,均值应当接近于一尺.每抽出一支,你都可以称其为一尺,而不是说一尺加一个变异.如果这样,卖布的就开不了张了.<

这样看来，你似乎没弄懂总体中的个体变异与样本中的随机误差之间的关系。

YY101 2012-08-29 20:44:51 回复悄悄话回复TNEGI//ETNI的评论:你用T-TEST就隐涵了你把系统误差作为随机误差的一部份.

YY101 2012-08-29 20:41:56 回复悄悄话回复TNEGI//ETNI的评论:这样定义个体变异对统计学来说是没有意义的.一捆一尺长的尺子,长度有微小差别,均值应当接近于一尺.每抽出一支,你都可以称其为一尺,而不是说一尺加一个变异.如果这样,卖布的就开不了张了.

TNEGI//ETNI 2012-08-29 20:37:06 回复悄悄话回复YY101的评论:

t-test的逻辑就是在全部误差中以概率判断随机误差发生的可能性。我们确实不知道两类误差各自的实际大小，否则就不需要这个检验概率了。

YY101 2012-08-29 20:26:31 回复悄悄话回复TNEGI//ETNI的评论:如果数据中同时包括随机误差与系统误差,你可能就无法分离二者.不可能对随机误差下单独的结论.当然,有可能有例外,但需要的是大量的数据.譬如,在确定一个上鞅的时候,一个上鞅可以分解为一个升寒数与一个鞅的叠加.注意,这里讲的是升函数,与系统误差还是有区别的.两个误差量的叠加是不容易分离的.唯一可以做的是加假设,也就是我说的模型集合.

TNEGI//ETNI 2012-08-29 20:21:29 回复悄悄话回复YY101的评论:

>我有些怀疑甚至你对随机误差的理解也是不对的.我们说的是对每一个个体进行测量.随机误差的产生主要是由于被测总体中的个体变异造成。测一次,有随机误差;难道你说的是前后测几次,其间个体变异?即便这样,每次都有随机误差.我不能说随机误差一定比系统误差小,都有可能.<

关于连续型随机变量的随机误差，可以把它们看成是总体中的个体对总体分布期望的随机变异。

测量中的工具使用中造成的误差也是样本中全部随机误差的一个组成部分，还有精度的选择带来的误差，则是另一类随机误差；你还可以根据具体情形定义其它类别的随机误差。但一个样本中的随机误差的主要来源是由于个体对总体分布期望的随机变异造成的。没有个体变异，便没有统计学。

YY101 2012-08-29 20:15:09 回复悄悄话回复TNEGI//ETNI的评论:我有些怀疑甚至你对随机误差的理解也是不对的.我们说的是对每一个个体进行测量.随机误差的产生主要是由于被测总体中的个体变异造成。测一次,有随机误差;难道你说的是前后测几次,其间个体变异?即便这样,每次都有随机误差.我不能说随机误差一定比系统误差小,都有可能.

TNEGI//ETNI 2012-08-29 20:15:01 回复悄悄话回复YY101的评论:

我在前面回答你时说过，“系统误差可以量化，也可能无法量化；随机误差也是如此。”

>如果随机误差可以量化,测量本身就失去意义了.<

让我们看一个两样本t-test的例子。在这个例子中，t值的构造是，分子是两个样本的均数之差。这个差就包含着两类误差：系统误差和随机误差。检验的目的是要用概率来衡量随机误差发生的概率大小。我们可以把整个差异看成是1（即全部），那么，随机误差发生的概率大小可以部分地反映出两类误差在全部误差的结构上的相对差异，从而得到两者的部分程度的量化。

YY101 2012-08-29 19:59:32 回复悄悄话回复TNEGI//ETNI的评论:如果随机误差可以量化,测量本身就失去意义了.就如同你上街可以喊所有卖肉的都是奸商,因为他们的称没有一个是准的.多给你肉的是不小心的,少给肉的是明知故犯的.

TNEGI//ETNI 2012-08-29 19:52:45 回复悄悄话回复YY101的评论:

由测量精度引起的误差是很小的，而且由于对精度的偏离呈现出正态分布的对称性特征而在计算中可以被相互抵消；随机误差的产生主要是由于被测总体中的个体变异造成的，而非测量精度的定义引起的。

TNEGI//ETNI 2012-08-29 19:47:13 回复悄悄话回复YY101的评论:

系统误差可以量化，也可能无法量化；随机误差也是如此。

YY101 2012-08-29 19:46:11 回复悄悄话人在地球上的体重与月球上的体重差是系统误差,当然测量精度决定了这里仍然有随机误差的因素.

TNEGI//ETNI 2012-08-29 19:44:37 回复悄悄话回复YY101的评论:

对不起，我忘了给定一个条件：如果两种工具间没有一个已知的转换手段。单纯从测量结果的数字表现来看，它们之间的差异存在系统误差，如果直接对这样的数据进行统计分析，会造成错误。所以，如果已知某种转换手段，便可以消除这个系统误差了。

YY101 2012-08-29 19:43:29 回复悄悄话无法量化的差不能称为系统误差,只能算为随机误差.

YY101 2012-08-29 19:39:05 回复悄悄话回复TNEGI//ETNI的评论:使用公制还是英制,这是定义测度的问题,与误差无关.你没有规定读数的精确度,也就谈不上误差.看来你对系统误差概念的模糊.如果读出来的数经过换算有偏差,那个偏差就是随机误差.如果你上街买两斤排骨,人家给你称了一公斤,说系统误差是什么呢?

TNEGI//ETNI 2012-08-29 19:32:52 回复悄悄话前面和你的讨论中有句话不严谨，纠正如下：

回复YY101的评论:

>比方说你拟合一条Y相对于X的回归曲线,如果是限定于线性模型,肯定有一跳最佳曲线,使残差平方和最小.……<

我在本文里讨论的最优化不是这个情形下的最优化，而是指的类似于在分段回归中使用合并残差最小化来决定分段模型的“最有化”，因为那些方法论构建者认为，最小的合并残差对应的分段模型就是他要的或期望的。这是不可能的。从你的那段话来看，你没搞清楚我所说的存在错误的最优化是怎么回事。

当使用全部样本建立单一模型时，如果需要在不同的模型类型间作出选择，可能会面临何者“最优”的问题，但不论哪一个类型的模型被选定，被选定的模型的参数集合都只有唯一的解。这里没有最优化问题。各种不同类型的模型的参数间的差异不是随机误差，而是系统误差。（此话不严谨，应该是：各种不同类型的模型的参数间的差异不仅有随机误差，还包含着一部分系统误差。）

我不知道你是否有过测量中的系统误差和随机误差的理论训练和测量实践。如果你不曾有过这类训练和实践，我会感到很遗憾。

TNEGI//ETNI 2012-08-29 19:26:30 回复悄悄话回复YY101的评论:

>采用不具备一致性的方法得到的数据就不是随机数据了吗?一致性需要证明吗?能够用更加初级的概念及定理证明吗?<

你前面说过你受过测量中的系统误差和随机误差的训练。我很怀疑。

一致性需要证明吗？这是对一个测量中所使用的测量工具的性质进行判断的问题。怎么会需要证明？举例来说，测量一组人群的身高时，一部分人使用的是厘米制工具，另一部分人使用的是英尺制工具；或者测量血压时，一部分人使用的水银血压计，另一部分人使用的是气压计。这类测量中便会包含系统误差。我判断出来了，难道你还要我证明给你看吗？

当然，不论使用的工具是否一致，测量结果中都会包含着随机误差。这难道也需要证明？

YY101 2012-08-29 19:18:08 回复悄悄话回复TNEGI//ETNI的评论: 我们可以以欧氏几何为例子.欧氏几何有五大公理:1.过相异两点，能作且只能作一直线（直线公理。2.线段(有限直线)可以任意地延长。3.以任一点为圆心、任意长为半径，可作一圆(圆公理)。 4.凡是直角都相等(角公理)。5.两直线被第三条直线所截，如果同侧两内角和小於两个直角，则两直线作延长时在此侧会相交。其它所有定理都可以从这五条公理推导出来.缺少了任何一条,就会出现矛盾.有人发现地球上的经纬线不符合第五公理,取消了第五公理就成了非欧几何.

YY101 2012-08-29 19:04:24 回复悄悄话回复TNEGI//ETNI的评论:看来你对公理系统的理解有偏差.你所说的都不可能成为公理系统的要素.公理系统是构成一门学问的基本要素,任何定理可以从公理系统导出来,而任何与公理相违背的都是谬论.如果测量的一致性是公理系统的要素,采用不具备一致性的方法得到的数据就不是随机数据了吗?一致性需要证明吗?能够用更加初级的概念及定理证明吗?如果可以,它就不是公理.

YY101 2012-08-29 18:50:42 回复悄悄话回复北极企鹅的评论:这是对数学的误解.数学研究的对象可以是确定性的,也可以是随机的.认为先进的确定性数学分析可以准确预测股票,那么股票市场就不可能存在了.从博弈论的角度出发,没有谁比对方更聪明.你能想到的,对方也能想到.你靠你手里的PC赚钱,人家用高性能计算机算,你就只有赔了.大家都不玩了,对方赚谁的钱呢?自己买,自己卖?只有存在随机性,才使大家都有赚钱赔钱的机会.至于说你是赚还是赔,只有看你的运气了.

TNEGI//ETNI 2012-08-29 18:40:33 回复悄悄话回复YY101的评论:

其实，统计学是一门认知方法论，直观地说，它近乎于一门测量技术的汇总。它有两个基本形态或层面：1）方法论的构建；2）方法论的应用、检验和改建或重建。

统计学有自身的公理系统，这个公理系统并不总是与数学的公理系统一致，例如测量的一致性，系统误差的发现与排除，随机误差的最小化等，这些与数学的公理系统风马牛不相及。

北极企鹅 2012-08-29 18:34:23 回复悄悄话回复easycity的评论:
我很赞成您所言，将来会有真相大白的时候！

YY101 2012-08-29 18:25:21 回复悄悄话要知道就连统计学中的最大争论,传统频率学派与贝叶斯学派只争也不能上升到公理系统之争,大家都仍然人为平行线不相交.有时候不要人为地将问题复杂化了.

北极企鹅 2012-08-29 18:25:11 回复悄悄话楼主对统计学的深入思考值得敬佩！赞！

我觉得统计的模型没有最好，只有更好。统计学还是在发展阶段，有太多理论需要补充。尤其是计算机的发展促进了统计的深入，但是和每天出现大量的数据相比还是远远不够的。

统计往往先假设一个现有的模型然后对照数据检验，这样是做不到百分之一百的准确性的，一个模型能做到百分之七十吻合就是很不错的了，但是这样依然是很难的。

基于这个原因，我是不大相信任何股票价格的，说白了，统计到现在想做到像数学那么精准是不可能的。它对一切的解释只能是个大概而已，这就不是科学，我想。

金融危机前，往往先假设数据是正态分布，然后再去做研究，现在发生了金融危机知道了很多数据不是正态分布的，那以前的模型还可信么，带来的损失该是多么巨大。
拙见，欢迎拍砖。

YY101 2012-08-29 18:20:13 回复悄悄话回复TNEGI//ETNI的评论:在将哲学概念引入讨论之前,首先要搞清楚数学的公理系统与统计学的公理系统都包含哪些,也许你会发现实际上他们是重合的.一般很少有人讨论统计学的公理系统,这个词汇很有可能是臆造的.没有公理系统的完整理论只可能是两种情况,一是胡说,二是某一完整系统的子集合.

TNEGI//ETNI 2012-08-29 17:52:12 回复悄悄话回复YY101的评论:

>从我的观点看,统计是数学的真子集.<

只要从统计学的全部概念中找出一个不属于数学范畴，那么，统计学就不完全是数学的分支。

搞数学的人是最讲究严谨的，你应该可以找出至少一个不是纯数学可以讨论的统计学概念，例如，总体和样本及其相互关系，还有统计认知的哲学基础，等等。更重要的是，任何一个统计分析的方法都不是从数学公理系统演绎出来的，而是一种简单的分析逻辑。这种分析逻辑通常属于哲学性的分析和思考，然后在此基础上才能引入数学计算技能来构建统计算法和公式。

YY101 2012-08-29 17:33:15 回复悄悄话回复TNEGI//ETNI的评论: 如果从可测空间的角度去看问题,统计学要讲的东西就多了.现在常用的所谓一类二类误差就完全是胡说八道.两种误差不能用同一个分布来衡量,要假设两个不同的分布.而统计测度与分布是相关的,同时引入两个测度,就永远是公说公有理,婆说婆有理.

YY101 2012-08-29 17:17:56 回复悄悄话回复TNEGI//ETNI的评论:很多时候一个学科的定义不能命名来狭义解释.实际上,学科命名就是约定俗成的称呼.就好物理化学是物理还是化学.如果追究起来,谈到分子结构似乎是化学,谈到原子结构是物理,两个一块谈,化学与物理的界限就分不清了,就算是科学吧.从我的观点看,统计是数学的真子集.

TNEGI//ETNI 2012-08-29 17:07:48 回复悄悄话回复YY101的评论:

关于统计学的学科性质，我想请你回答一个简单的数学集合论的问题：

{统计学的全部概念}是否属于{数学的全部概念}的一个真子集？如果是，你可以说统计学是一个纯粹的数学分之学科；反之，就不是。你是搞数学出生的，应该可以回答这个问题。

其实，Mathematical Statistics应该被称为The Mathematics in Statistics. 前者说的是“统计学是数学的”，而后者是在说“统计学里的数学”。

TNEGI//ETNI 2012-08-29 16:50:53 回复悄悄话回复YY101的评论:

>但不论哪一个类型的模型被选定，被选定的模型的参数集合都只有唯一的解。不一定,如果你有100个数据点,拟合一个101阶多项式,参数估计就不可能唯一.<

很遗憾，你把一个给定的样本数据看成是一推抽象的数字，可以任意玩弄了。你完全忽视了针对该样本的统计认知的理性基础，以为只要数学计算上可行，就可以任意而为。

TNEGI//ETNI 2012-08-29 16:42:35 回复悄悄话回复YY101的评论:

>分段回归中段点必须要在拟合曲线以前确定,这属于确定集合时讨论的问题.当然你也可以将其作为一个变量一同估计.<

显然，在对未知总体进行随机抽样的条件下，临界点一定是且只能是一个随机变量，因而需要找到它的可测空间并进行测量，从而以期望和可信区间估计来决定它的位置，而不是以“最优化”搜索和解联立方程组的方法来求解。后一种方法连随机临界点的可测空间在哪里都没有搞清楚。我不知道那些人的概率论是怎么学的。

显然，如果样本空间（X,Y）里只有一个临界点被假设在X上，则临界点的可测空间与X是完全一致的。但X的期望和可信区间并非就是其上的那个临界点的期望和可信区间，因为这里存在着每一样本点作为临界点时的重要性的差异的随机变异，我们需要测量这个重要性，然后以此为权重来估计X的加权期望和加权基础上的可信区间。这个加权期望和加权基础上的可信区间才是对临界点的正确估计。除此以外没有它途。

>在合并残差最小化准则下得到的最优曲线对每一段来说不一定是最优的,但这取决于你的模型结构,例如相邻段结点是否要求平滑.<

在临界点通过上述加权估计得到后，事情便简单了，可以建立连续性检验来取代平滑化，因为是否平滑地连接两个分段模型已经不是一个数学美化的问题，而是一个概率检验的问题。这才是真正的统计学思维。一个看起来断开的两段模型并非就不是连续的，这取决于连接变异在其最大可测空间上发生的程度。

YY101 2012-08-29 16:30:29 回复悄悄话回复TNEGI//ETNI的评论:但不论哪一个类型的模型被选定，被选定的模型的参数集合都只有唯一的解。不一定,如果你有100个数据点,拟合一个101阶多项式,参数估计就不可能唯一.不同段曲线参数的差异不能被称为系统误差,甚至不能被称为误差.你在模型结构集合里面就是这样定义的.如果定义本身就有误差,这就要回到对什么是模型的讨论了.

YY101 2012-08-29 16:23:13 回复悄悄话回复TNEGI//ETNI的评论:分段回归中段点必须要在拟合曲线以前确定,这属于确定集合时讨论的问题.当然你也可以将其作为一个变量一同估计.在合并残差最小化准则下得到的最优曲线对每一段来说不一定是最优的,但这取决于你的模型结构,例如相邻段结点是否要求平滑.系统误差与随机误差的概念是有的,但这完全取决于你对集合的定义.譬如说你的估计本身就不是无偏的,什么是随机就要准确定义了.

TNEGI//ETNI 2012-08-29 16:01:37 回复悄悄话回复YY101的评论:

>比方说你拟合一条Y相对于X的回归曲线,如果是限定于线性模型,肯定有一跳最佳曲线,使残差平方和最小.……<

我在本文里讨论的最优化不是这个情形下的最优化，而是指的类似于在分段回归中使用合并残差最小化来决定分段模型的“最有化”，因为那些方法论构建者认为，最小的合并残差对应的分段模型就是他要的或期望的。这是不可能的。从你的那段话来看，你没搞清楚我所说的存在错误的最优化是怎么回事。

当使用全部样本建立单一模型时，如果需要在不同的模型类型间作出选择，可能会面临何者“最优”的问题，但不论哪一个类型的模型被选定，被选定的模型的参数集合都只有唯一的解。这里没有最优化问题。各种不同类型的模型的参数间的差异不是随机误差，而是系统误差。

我不知道你是否有过测量中的系统误差和随机误差的理论训练和测量实践。如果你不曾有过这类训练和实践，我会感到很遗憾。

YY101 2012-08-29 15:20:27 回复悄悄话回复TNEGI//ETNI的评论: 你说,在我看来，统计学根本不应被认为是一门纯粹的数学分支学科，它其实是一门数学化的认知方法论，而认知方法论原本属于哲学范畴内的认识论（epistemology）而非数学范畴的某个门类。也许首先要搞明白的是什么是数学.从广泛的意义上去讲,统计学肯定是一个数学的分支.并不是说数学只研究确定性的数字.如果从狭义的角度出发,应用数学与纯数学都不是一回事情.研究生物统计的人也许忽略一些数学基本的要求,譬如临床试验的渐进性.如果临床试验的结论取决于样本数量,小样本得到的结论在大样本下不成立,这在纯数学体系下是不行的.否则,哥德巴赫猜想就已经被证明了.所以,在讨论问题的时候,大家都要有一个共同承认的讨论基础.

YY101 2012-08-29 13:57:41 回复悄悄话比方说你拟合一条Y相对于X的回归曲线,如果是限定于线性模型,肯定有一跳最佳曲线,使残差平方和最小.如果说模型是X的多项式,在给定多项式阶数的条件下,最优也是成立的.如果不给定阶数,最优多项式的阶数可以超过样本数目,残差和为零,最优不唯一.这里,线性模型与多项式是我说的集合,残差平方和是我说的目标准则.缺少了任何一个,最优无从谈起.当然,这里的最优只是相对于现有数据而言.如果继续采样,已经得到的最优将不再是最优.同时,选定的集合与目标准则本身就可能有问题.因此有存在问题的最优.没有前提的最优是不存在的.这就是说所有模型都在一定条件下谈论的,都有局限性.没有什么模型在最广泛的意义下都可以被为最优.唯一的例外是不包含随机因素的问题,也就是你所说的数学家考虑的问题.

TNEGI//ETNI 2012-08-29 11:35:03 回复悄悄话回复3722的评论:

Thank you so much for the information.

TNEGI//ETNI 2012-08-29 11:23:47 回复悄悄话回复YY101的评论:

In a mathematician's eyes, a sample is a given set; and nothing is variable, so they treat the set as a certainty. However, a sample is a random set and variable to population. Nothing is certainty.

The optimization takes the idea of "one-to-one correspondence" to make the model selection. This is a shame for a mathematician doing in this way since nothinig is a one-to-one correspondence in a random sample. Every correspodence in a random sample is random.

YY101 2012-08-29 10:21:33 回复悄悄话实际上,你的问题本身有问题.这样的问题很容易让统计初学者与专家一同晃秋千.在统计分析中,没有什么东西叫最佳模型,所谓最佳只是讲在某一特定集合里面根据某种目标的最佳.因此,讨论最优,你首先要限定在哪个集合中以什么目标寻找最优.如果说拟合一条曲线,原始数据本身对于拟合来说就是最优,但对于模型简单明了来说却不是一个好模型.抛开集合与目标,优化这个词就没有意义了.

3722 2012-08-29 08:27:52 回复悄悄话 All models are wrong, but some are useful
--- Statistician George E P Box, in "Science and statistics", Journal of the
American Statistical Association 71:791-799, quoted in Holling, C S, Stephen R Carpenter, William A Brock, and Lance H Gunderson, “Discoveries for Sustainable Futures”, Ch. 15 in Gunderson, Lance H and C S Holling, Panarchy: Understanding transformations in human and natural systems, Island Press (2002), p. 409

nightrider 2012-08-28 21:14:37 回复悄悄话回复TNEGI//ETNI的评论:

Please refer to my response below inline between the dotted lines as such:
--------------
my response
---------------

回复nightrider的评论:

Thank you very much for your time and attention. I would like to take this opportunity to clarify something that I might not expressed clearly in this blog article, though they have been clearly stated in my papers in two JSM's proceedings.

> The "segmented regression or piecewise regression" you mentioned refers to this http://en.wikipedia.org/wiki/Segmented_regression, right? <

Exactly I would like to say, the concept of the "segmented regression or piecewise regression (I prefer the latter one as the formal term in the field)" are not referred from that website, but from several formal top journals in Statistics, like JASA, Annals of Statistics, etc.

The classical method in this field was developed from 1959 to 1979, then turned to spline as the modern form with the enforced continuity assumption and smoothing techniques. Although the methodology for piecewise regression has been continuously developed since then, the basic assumption and the computation techniques are almost the same or similar. What are improved are just the computation technqiues for estimating each threshold or change-point or node and for smoothing the connections in spline in different situations. No one had ever doubted the theoretical issues behind the assumptions and the computation techniques untill I began to doubt them in 2007.

-----------------
Good that you provide a little background information. But you still not have not stated clearly what your objection is.

------------------

> Of course the line can be replaced with nonlinear parametric curves.<

No, sometimes we don't need a smoothy non-linear curve to describe the entire process, but need a threshold to change something, i.e. a policy for investment, etc. A smoothy curve may not help to find the critical point to make a decision.
---------------------
You misunderstood my statement. I meant the curves between the break points or discontinuity be smooth parametric curves, linear or not. After all, the discontinuity is what you are after, isn't it? You do need only a finite number of discontinuity, don't you? So the rest of the curve has to be continuous or smooth, doesn't it?

-------------------------
> Does your first question concern with the legitimacy of the least square method for deducing the parameters? <

No, the LSM is correct for estimating model parameters covering a specific whole sample. What I criticized is the computation techniques ba23sed on an optimizational approach to make a decision for the piecewise models, and the assumption of enforced continuity for estimating the thresholds and smoothing the connection between any two adjacent piecewise models in a whole sample space.

In the current methodology, usually we don't know where a threshold or node is, so we have to search it in a sample space based on a real sample. This means that we have to assume each real sample point may be the threshold or node, thus, if the sample size is n; and there is only one threshold, we will have n pairs of piecewise models and n combined sums of squared residuals because of n pairs of piecewise models. Then, which is the pair that we can expect? The current method took the smallest combined sum of squared residuals (this is an optimizational approach) in the n combined sums of squared residuals to make the model selection, then to estimate a theoretical threshold by taking Model_1 = Model_2 (this is the so-called enforced continuity) in the selected pair of the piecewise models.

It sounds extremely solid in a mathemtical point of view, right? However, if the connection variablity at an unknown sampling threshold cannot be assumed to be zero, we cannont take the equation Model_1 = Model_2 to estimate the unknown threshold or node. This will be an ultimate obstacle to a mathematician in Statistics. This means that the curent methodology is a dead end or went onto a dead path! We have to find another way.

--------------------------
You need to be more specific to in explaining the present methodology of "estimating theoretical threshold by taking Model_1 = Model_2 and your objection concerning "connection variability". Could you give a reference for a thorough mathematically rigorous treatment of the present methodology and a link to your "papers in two JSM's proceedings"? The discussion would be much more efficient and concrete looking at the mathematics.

-------------------
> Is the "enforced continuity" in your second question referring to the whole of the regression curve consisting of the segments (straight line or not) having to be continuous? <

Yes!
-------------------
Now you are confusing me. If the curve is piecewise, then discontinuities are allowed and continuity is not enforced. Judging from your comments above, your answer here should be "No".
---------------------

TNEGI//ETNI 2012-08-28 21:09:02 回复悄悄话回复3722的评论:

>所有的模型都是错的，但是有的模型是有用的 (All models are incorrect, but some models are useful)。<

In my opinion, 这可能是一个无知者的谬论。他不去努力找到一个尽可能充分直至终极正确的途径，却以一种诡辩式的语气为自己开脱责任。

TNEGI//ETNI 2012-08-28 20:43:08 回复悄悄话回复nightrider的评论:

Thank you very much for your time and attention. I would like to take this opportunity to clarify something that I might not expressed clearly in this blog article, though they have been clearly stated in my papers in two JSM's proceedings.

> The "segmented regression or piecewise regression" you mentioned refers to this http://en.wikipedia.org/wiki/Segmented_regression, right? <

Exactly I would like to say, the concept of the "segmented regression or piecewise regression (I prefer the latter one as the formal term in the field)" are not referred from that website, but from several formal top journals in Statistics, like JASA, Annals of Statistics, etc.

The classical method in this field was developed from 1959 to 1979, then turned to spline as the modern form with the enforced continuity assumption and smoothing techniques. Although the methodology for piecewise regression has been continuously developed since then, the basic assumption and the computation techniques are almost the same or similar. What are improved are just the computation technqiues for estimating each threshold or change-point or node and for smoothing the connections in spline in different situations. No one had ever doubted the theoretical issues behind the assumptions and the computation techniques untill I began to doubt them in 2007.

> Of course the line can be replaced with nonlinear parametric curves.<

No, sometimes we don't need a smoothy non-linear curve to describe the entire process, but need a threshold to change something, i.e. a policy for investment, etc. A smoothy curve may not help to find the critical point to make a decision.

> Does your first question concern with the legitimacy of the least square method for deducing the parameters? <

No, the LSM is correct for estimating model parameters covering a specific whole sample. What I criticized is the computation techniques based on an optimizational approach to make a decision for the piecewise models, and the assumption of enforced continuity for estimating the thresholds and smoothing the connection between any two adjacent piecewise models in a whole sample space.

In the current methodology, usually we don't know where a threshold or node is, so we have to search it in a sample space based on a real sample. This means that we have to assume each real sample point may be the threshold or node, thus, if the sample size is n; and there is only one threshold, we will have n pairs of piecewise models and n combined sums of squared residuals because of n pairs of piecewise models. Then, which is the pair that we can expect? The current method took the smallest combined sum of squared residuals (this is an optimizational approach) in the n combined sums of squared residuals to make the model selection, then to estimate a theoretical threshold by taking Model_1 = Model_2 (this is the so-called enforced continuity) in the selected pair of the piecewise models.

It sounds extremely solid in a mathemtical point of view, right? However, if the connection variablity at an unknown sampling threshold cannot be assumed to be zero, we cannont take the equation Model_1 = Model_2 to estimate the unknown threshold or node. This will be an ultimate obstacle to a mathematician in Statistics. This means that the curent methodology is a dead end or went onto a dead path! We have to find another way.

> Is the "enforced continuity" in your second question referring to the whole of the regression curve consisting of the segments (straight line or not) having to be continuous? <

Yes!

3722 2012-08-28 19:33:54 回复悄悄话所有的模型都是错的，但是有的模型是有用的 (All models are incorrect, but some models are useful)。(忘了谁说的)

nightrider 2012-08-28 18:13:36 回复悄悄话 TNEGI//ETNI:

I am trying to understand your two questions. As it appears that you have expended so much time effort trying to understand and challenge what you call mistakes in statistics, would it not be helpful for you and for your audience to state clearly and rigorously the problems first? What you have written written here does not appear that you have not done that. If what appears here is what you wrote to the journals and the experts, at least it is not exactly clear to me what you are trying to say. I will have say that some of the review comments you quoted are not that off mark, regarding the clarity of your presentation.

As an attempt at clarification, allow me to ask you a few questions. The "segmented regression or piecewise regression" you mentioned refers to this http://en.wikipedia.org/wiki/Segmented_regression, right? Of course the line can be replaced with nonlinear parametric curves. Does your first question concern with the legitimacy of the least square method for deducing the parameters? Is the "enforced continuity" in your second question referring to the whole of the regression curve consisting of the segments (straight line or not) having to be continuous?

TNEGI//ETNI 2012-08-28 16:10:35 回复悄悄话回复半世的评论:

你让我感到有点可笑或自嘲。我本是想通过这篇拙文唤醒哪怕是一个统计学家，没想到却招来了你来试图唤醒我！看来，我得闭门反思了。多谢你的警醒。

在我看来，统计学根本不应被认为是一门纯粹的数学分支学科，它其实是一门数学化的认知方法论，而认知方法论原本属于哲学范畴内的认识论（epistemology）而非数学范畴的某个门类。只不过，统计学由于大量应用了数学技能构建算法而体现出了一定程度的“数学”属性，但其本质依然属于认知方法论，其目的绝非为了提出、论证和演绎数学命题，而是如何实现认识外部客观世界的某种更加可靠的途径。所以，一个数学背景的人如果不懂基本哲学，尤其是认识论的基本原理，它是没有资格在统计学领域从事方法学构建的。

我的上述论断可能会伤害某些数学背景的统计学专家。但愿人们能够理解我所说的道理。

TNEGI//ETNI 2012-08-28 15:52:39 回复悄悄话回复easycity的评论:

多谢你的激情参与，也感谢你的警醒和劝告。

我想我不是一个只会在嘴巴上说说的人。你认为“哲学和神学只有说教，没有基于事实的讨论。极端的固执，不顾事实。”我想，我在这篇拙文里陈述的很多东西应该属于“事实”而非臆造。如果统计学家们不能认真对待我所指出的事实和错误，那么，他们将没有能力开创新的局面。

至于你提到的统计学可能需要一次大的变革，我想我已经为此做出了自己的贡献。遗憾的是，它们尚未被学术界认真对待，或许他们根本就没有读懂我的思想和方法。我的医学和公共卫生的master背景在统计学这个被认为是数学分支学科的领域将不会被人认真对待。

除了这篇质疑和批判性的书信稿，我将在以后的博客文章里逐渐披露自己这些年来所做的工作。我想，如果你是一位卓有成效且功底很深的统计学家，你将会为此感到震撼不已——为什么一个如此背景的人能够完成这样的工作？

TNEGI//ETNI 2012-08-28 15:40:55 回复悄悄话回复needtime的评论:

当一个方法论不能自圆其说或自相矛盾时，就一定不是一个正确的方法论。你可以试各种方法，但只有那种能够自圆其说且不违背其fundamentals的方法才能够被认可；一旦某个方法被发现逻辑悖论或缺陷，它就必须被修正。

alsoRun 2012-08-28 10:59:58 回复悄悄话 Dear 立功,

Who is your 校友旭光? Is there any way I can get in touch with him?

Thanks and best regards,

alsoRun

半世 2012-08-28 09:13:49 回复悄悄话楼主啊，我是在唤醒您啊。。。。。。

有很多东西，是互相部分相连的，但又有本质上的不同。如果一定要用统计学去完全解释生物学，或者用哲学去解释统计学，或者统计学是否合乎哲学的解释，本身就是有点荒诞的。之所以他们以它们各自的独立身份存在，就是由于他们有本质上的不同。如果您硬是要找到他们的统一，就应当到更高的层次上去找，而不是到他们互相之间去找。您以为呢？好了，我就此 Shutup了。

TNEGI//ETNI 2012-08-28 07:48:53 回复悄悄话回复臭老王的评论:

Yes, you are right. Thanks very much.

臭老王 2012-08-28 07:34:49 回复悄悄话 “The American Statistics (1次投稿，唯一评语：无法判断本文的观点和方法是否正确)”

The American Statistics 是不是 The American Statistician 之笔误？

richard_hz 2012-08-28 07:26:39 回复悄悄话读读俺的这篇博文

http://blog.wenxuecity.com/myblog/29080/200910/31855.html

也许对理解这类问题有帮助。

easycity 2012-08-28 06:53:57 回复悄悄话敬佩博主对科学原理本源上的追寻，但希望博主不要停留在空泛的哲学/数学/统计学的研讨这个层次，大胆地在实际运用中验证和完善自己的理论。
本人看过大量的论文，参与过不少实际运算的研究项目，将各式各样的统计方法用于生物学的研究当中。到目前为止，在现有的数据和生物学知识的基础上，没有一种方向能为药物研制作出重大贡献，而公司和学校投入的资金至少是以亿（美）元计算了。
我非常悲哀地承认，统计学可能有重大的缺陷。就像牛顿物理学不能解释光线的波粒二项性一样，在商业和人工智能方面大显身手的统计学，可能需要一次大的发展才能对生物研究和药物开发有贡献。
但是，那么多的统计方法都失败了，现在任何一个人提出一个新的统计方法，在没有应用到药物研究中的基本的数据和证据之前，我都不会去多看一眼。让数据说话，让成果说话，不单单用舌头说话，是科学和哲学最基本的区别。
哲学和神学只有说教，没有基于事实的讨论。极端的固执，不顾事实，其实来源于个人多次的失败和内心的怯弱，以致于以强硬充门面。诚心希望博主的才华和努力，不要成为博主怯弱和固执的牺牲品。
不敢期望博主改变，如果能有一个来访者能受我一劝，不走进与博主类似的死胡同，我就满足了。

needtime 2012-08-28 05:47:40 回复悄悄话回复TNEGI//ETNI的评论:

唉。老兄别争论了吧。
正是因为有用，至少在我所知的实际领域如此，你一定要证明理论不成立，就很难说服人了。也许在你所知的例子，真的无效。

理论这样的东西，只要在特定情况下有效，就有人要用啊。
更别说，能用于赚钱实用方面了。实实在在的赚钱，你说它是怪论，无效，怎么能说服人？

needtime 2012-08-28 05:39:31 回复悄悄话看你纯粹不把统计用于实际的吧？

第一个用在股票的抄底摸顶。
第二个用在趋势跟随交易。

实实在在的每天应用着，你倒是争论着成立不成立呢。你看看杂志给你的投稿评论，也就是这个意思吧。

诚信 2012-08-28 05:08:56 回复悄悄话不明白为什么反感这样的讨论. 我不熟悉统计, 无法谈论本题. 但是科学史上错误的理论被广泛流传的例子很多. 质疑不应被指责. 近几年流行 compressed sensing 理论也是漏洞百出, 但被吹捧的不行. 很象皇帝的新装.

TNEGI//ETNI 2012-08-28 04:37:43 回复悄悄话回复玄米、半世和brent2008的评论:

风凉话少说，有本事请切入主题来点真格的；otherwise, 去杂志社投稿支持或反驳本文作者，或者，please shut up.

转贴原文以记录发布和最终修改日期和时间：

标题：数学家们在统计学领域犯下了几个严重的错误

稳健回归的开创者、美国著名的统计学家、前美国总统科技顾问Peter John Huber于1997年11月在北京中国科学院数理统计研究所演讲时说道：“很多数学背景的统计学家们在统计学领域犯下了严重的错误，导致了很多思想和方法上的混乱。”他并期待着一股来自数学以外的力量能够推动统计学和数学的变革。

听到这个演讲内容和观点后，我的第一感觉是，如果这个力量存在的话，那么，它只能是哲学，因为哲学是人类一切知识的认识论和方法论根源，因而也是一切知识的终极裁决者。

一个学统计的，如果不懂哲学，便如一个在黑暗中摸索的瞎子。对于在黑暗中感到困顿的人，哲学将会开启他的智慧，并赋予他一盏明亮的灯，照亮他前进的道路。

最近试图与几位著名的数学背景的统计学家交流自己的思想，但无一愿意给出有价值的东西，他们基本采取了沉默不语或不屑理睬的态度。为此，我把试图与他们交流的东西发表在自己的博客里，作为对整个系统的挑战之一。这个挑战将一直存在于这里，以便人们可以观瞻这一科学史上的悲剧。

Dear Dr. XXX，

您能够解答我的以下两个困惑吗？

我在长达近14年多的时间里做的是关于临界回归分析或分段回归分析（segmented regression or piecewise regression）的逻辑与算法的重建。我之所以坚持不懈地这样做，是因为我相信没有一套数学公理系统可以演绎出这个方法论，而当前的方法论存在严重的理论错误。这个领域里最困扰我的问题有以下两个：

第一，在基于样本测量的基础上在样本可测空间上搜索未知临界点时，目前的经典方法论是以随机分段模型组中最小合并预测残差（min(combined residuals)）作出一组“最优”的模型决策，也就是所谓的最优化决策。我想请问，这个决策的数学根据是什么？谁已经或能够从概率论上证明那个最小合并预测残差与所谓的“最优临界模型组”的随机参数集合之间的对应是一个“可期望的”或“可靠的”对应，或者说，上述两个随机测度的收敛在各自的可测空间上具有概率上最大且充分的一致性。

我从直觉上看这个对应是不可期望的，因为无论是最小合并预测残差，还是对应于它的随机临界模型组的各个统计量都是随机的“点”测量，它们之间的对应关系就好比我们在一定的样本量条件下得到的一组同质人群的身高与体重之间的随机的点对应一样。如果我们的研究目的是试图用“身高”这个随机变量来对“体重”这个随机变量的某个属性做出统计决策，我们显然是不可能使用min(身高)或max(身高)来做出一个关于“体重”的那个属性的稳定而可靠的决策的。这样的“最优化”在统计学上是绝对不可接受的，因为，If we could use min(X) or max(X) to make a statistical decision for Y, where both X (maybe an optimizer) and Y (maybe a set of parameters of a set of threshold models) are randomly variable, then all the fundamentals of Statistics would be collapsed.

第二，关于spline技术在临界回归分析中的应用。这里有一个前提假设，即所谓的enforced continuity，这个假设是以数学函数理论求解临界点的关键条件。没有这个假设的给定，就无法使用解联立方程组的方法求解未知临界点。但是，从统计学的角度，如果一个总体中存在一个临界点，那么，在随机抽样的条件下，在样本临界点（如果它可以被以另外的方法估计出来的话）附近的两个临界模型间将必然存在一个抽样的连接变异（这是一个确定性的存在），至于这个连接变异有多大多小，nobody knows（也即这是一个非确定性的存在），从而，我们不可以强制性地预设那个“连续性”来建立一套方法论。反之，如果坚持采用那个强制连续性的假设，就等于是用一个确定性的假设来否决了一个确定性的存在，并以假定的方式肯定了一个非确定性的不存在（非确定性的连接变异 = 0，即肯定了“非确定性的连接变异”的不存在）！这是一个令人惊叹的低级错误。

If the continuity between two adjacent threshold models is not inferred in a probability, it is not a statistical method but a mathematical game with an arbitrary assumption in a certainty for an uncertainty.

所以，我认为以上两个问题可能是统计学方法论发展史上的两个悲剧性错误。我在2007年和2009年的JSM会议上曾两次谈到了这两个错误，也曾试图投稿发表自己的见解，却被所有杂志社拒绝了，但却从来没有人对这类拒绝的理由给出任何专业方面的解释。这些期刊包括（按投稿时间顺序）：

Biometric (2次修稿。唯一评论：目前的方法比这个好)

Statistics in Medicine (1次投稿。唯一评语：没有创新)

JASA (3次修稿。第一个评语：本文的思想确实有趣(definitely interesting)，但数学表达不规范，会使审稿者感到burden。最终评语：该文不适合发表)

Biometrika (1次投稿。唯一评语：本刊空间有限)

Annals of Statistics (7次修稿。第一个有意义的评语：本文试图挑战the large body of Statistics and Mathematics,但以本文目前的英语写作水平，不足以令读者信服。最终评语：建议投稍微低一点的刊物)

Computational Statistics and Data Analysis (2次修稿。唯一评语：作者有点妄言)

The American Statistics (1次投稿，唯一评语：无法判断本文的观点和方法是否正确)

上述两个问题我曾请教过哈佛统计系的主任孟晓犁(Xiao-Li Meng)以及当前的Annals of Statistics的副主编蔡天文(Tong Cai)，然而，这两位杰出的数学背景的统计学家无一愿意回应。所以，那两个困惑对于我依然待解，我相信没有哪个数学背景的数理统计学家可以给出关于它们的肯定的论证，因为它们本是统计学领域的两个谬论，是由于概念缺失导致的分析逻辑和数学算法上的错误。

人们可以继续无视我所做出的东西，因为作为国内医学院毕业的master-level的我在统计学领域的credit可以被忽略不计，但问题将依然存在。正如Dr. Huber所指出的那样，“一些数学家习惯于以他们的确定性思维模式来解决非确定性领域的问题”，这是统计学领域中一切错误和问题的根源所在。

brent2008 2012-08-28 00:04:05 回复悄悄话 I stopped reading when I encountered "我从直觉..." Never seen a paper with such wording gets published.

仲伯由序 2012-08-27 22:39:28 回复悄悄话那么多的热心人，都在搜寻那些个矫情肆意的芙蓉姐夫的下落，怎么就没有人想到来这里考证一番？这可真是个莫大的漏洞啊！

半世 2012-08-27 22:32:20 回复悄悄话好像你在什么教吧？真信假信？难道教里没有答案？你这不是亵渎了你信的教吗？

半世 2012-08-27 22:29:35 回复悄悄话真是超级兴奋，30年了，再次遇到像你这么“二”的。当年同学中有过和你有一拼的，后来好像进了精神病院。老兄特哈马克思，说马克思主义里包含了对世界所有问题的答案。把一些姑娘镇的把他就当成了马克思。但不知道马克思脑子里哪里灌了水，就是没有给出他把不出娃儿的答案。哎。。。。。。

玄米 2012-08-27 21:23:38 回复悄悄话别动不动统计学家什么的，我一直以为你是呢，因为上大学时我的概率统计就考了64分，所以很佩服文学城还有统计学家坐镇。
上次看你辩论医学院教育的事，我才发现原来是你自己管自己叫统计学家。
我也是看了二姐的题目进来的，从上次以后，很怕点进你这里，文学城头的导读有时候挺坑人的。

TNEGI//ETNI 2012-08-27 20:21:03 回复悄悄话回复pillar的评论:

You are a great hero in the sports you just mentioned below. Hope you can win them. However, if you are a great statistician, please leave your answers for those questions since I have said that this blog is a challenge for anyone in the field of Statistics; otherwise, dream yourself as you wish you were whatever you want to be.

pillar 2012-08-27 20:09:22 回复悄悄话 I tried to challenge Federer on tennis but he did not answer; I tried to defeat Kobi on basketball but he did not show up; I tried to race with Bolts on 100m dash he ignored me. So I decide to record this here so mankind will witness such a great sport man has lived.

TNEGI//ETNI 2012-08-27 20:03:06 回复悄悄话回复needtime的评论:

The mathematics in Statistics should not be contraditory to itself!(统计学中的数学不应该与其自身相矛盾！)

你所说的话让我怀疑你是否有过现场调查和数据管理的经验。你很可能是一个学院式的统计学家，只会用几个数学概念在自己的脑袋里演绎外部客观世界，并坚信自己的演绎是正确的，因为它们在你看来可能符合你的假设条件和基于此上的数学原理。

needtime 2012-08-27 19:34:12 回复悄悄话鸭同鸡讲，你怎么不下水捉鱼啊？你看我们长的很一样，有羽毛，有腿的。

真的能一样吗？
统计学，不就是对存在的现象进行规范化后的描述。能用于实际上的有限预测，指导生产等。给出的是，一定的可能性。这些在数学上，如何纯理论性证明？你的第2个问题很符合股票价格的走势预测理论，原本也许就来自实际现象，钻什么牛角尖啊。

是一个很有用的交易手法。

TNEGI//ETNI 2012-08-27 19:33:46 回复悄悄话回复xwenxuecityy的评论:

如果你是一个数学背景的统计学家，如果你想接受那个挑战并在这里发言，就请说出几句有价值的话，否则，就让我的那个在你看来似“精神病患者般”的傻笑陪你进入梦乡好了。

TNEGI//ETNI 2012-08-27 19:19:26 回复悄悄话回复pillar的评论:

如果你是某个统计杂志的编辑或同行评议者，如果你曾犯下了类似的错误，你会允许我的思想发表吗？

xwenxuecityy 2012-08-27 19:07:32 回复悄悄话看你那副精神病患者的傻笑，文学城简直被你糟蹋了。

要不是“二姐”，我根本不会回这文学城了。

http://blog.wenxuecity.com/myblog/40482/201208/17777.html

pillar 2012-08-27 19:04:54 回复悄悄话 "我把试图交流的东西发表在自己的博客里，作为对整个系统的挑战。这个挑战将一直存在于这里，以便人们可以观瞻这一科学史上的悲剧。" That's a huge statement. It's only logic that whoever makes such a statement should know the best place to discuss the issues are the leading scientific journals,not here with the laymen.

[1]

[2]

[3]

[下一页]

[尾页]

登录后才可评论.