5月就业数据官方造假了吗?请看官方数据:
劳工统计局真正的失业数据:5月失业人数3000万,失业率18%,4月20%,3月7%
美国5月份就业报告昨天发布后,还仍在引发双方专家的持续争论:是否数据造假?
本文尝试从BLS原始取样方法和数据记录来回答这个问题。
1. BLS 按照传统方法定义的直接的失业人口数是多少?(约=3000万)
周末今天抽空仔细读了劳工统计局BLS的5月报告,其实其报告里面写得很明白,摘录如下:(见原文说明第18项)
If all people who want a job but were not in the labor force were added to the total 21.0 million people unemployed in May, the resulting 29.9 million people would represent 17.9 percent of the combined total of the labor force plus those who want a job. A similar calculation results in 19.8 percent for April and 7.5 percent for March.
”如果将所有想要工作但不在劳动力中的人加到5月份的2100万失业总人数中,则由此产生的2990万人将占劳动力总和的总人数的17.9%。类似的计算得出4月份为19.8%,3月份为7.5%。 “
2. 那为什么与各新闻头条的5月新增就业250万的一片欢腾差别如此之大?(对应13.1%的失业率和总失业约2100多万,但后者基本不被新闻重点提及)
这里先不讨论那个老生常谈的各国失业率数据都在定义上就开始的传统造假问题:即定义的失业率数据(只统计想要找工作但没有工作的人口),其实也是低估真实失业人口的(因为真正失业率数据还应包括那些放弃找工作的人口)。
这里只讨论即使按照BLS传统失业定义,得到的就是上面劳工统计局BLS自己的数字。而为什么BLS公布的5月失业率是13.1%呢?按照BLS自己的说法(见原文第12项),
Of the 8.4 million employed people not at work during the survey reference week in May 2020, 5.4 million people were included in the “other reasons” category, much higher than the average of 549,000 for May 2016–2019 (not seasonally adjusted). BLS analysis of the underlying data suggests that this group included workers affected by the pandemic response who should have been classified as unemployed on temporary layoff. Such a misclassification is an example of nonsampling error and can occur when respondents misunderstand questions or interviewers record answers incorrectly. BLS and the Census Bureau are investigating why this misclassification error continues to occur and are making changes for the June collection. (See item 14 below.)
According to usual practice, the data from the household survey are accepted as recorded. To maintain data integrity, no ad hoc actions are taken to reassign survey responses.
在2020年5月的调查参考周内的有840万人受雇但没有工作,其中有540万人归属于“其他原因”类别,远高于2016-2019年5月的平均水平549,000(未经季节调整)。 BLS对基础数据的分析表明,该群体包括受大流行反应影响的工人,应将其归为临时裁员的失业人员。这种错误分类是非抽样错误的一个示例,当受访者误解问题或访调员错误地记录答案时可能会发生。 BLS和人口普查局正在调查为什么这种错误分类错误继续发生,并对6月的收藏进行更改。 (请参阅下面的第14项。)
上面这段话仍然说得云里雾里的,不是太好理解,或者说为什么为发生这样的失业归类巨大误差?我再解释下:
原因是统计时设计的问题是这样问的:
第一个问题是你是否从事任何“赚钱还是不赚钱的工作?” 然后是45页的后续问题。接下来其中一个重要问题,是问是否“暂时不在”(absent)工作中,以及为什么会absent。回答者的答案选项之一是“其他”。然后真正的归类问题就出现了:
美国劳工统计局(BLS)指示提问者试图确定是否有人因这次的病毒流行而缺席,如果回答者说是,则将其归类为“临时裁员”,这意味着他们将计入失业数据中。但是有些人继续坚持说他们不是失业,他们在大流行期间只是“缺席”(absent),而BLS的政策是一旦记录下来,就不会改变人们的答案。BLS就是这样来防止偏差或数据操纵。
所以这里的问题就是:为什么有些人会明明没有工作还会认为自己没有失去工作呢?一种常见情况就是因为此前通过的一个PPP救援计划,这个计划会提供雇主继续给付员工工资。所以会有相当多的 人,虽然没有工作在家里呆着(absent),但还在继续从雇主那里领工资。这部分人坚持自己没有失业,而认为自己是休假是可以理解的。当然还有少部分人认为自己是无薪休假,也不算失业。而调查员不可以篡改这些原始数据,虽然按照以前的分类,这些人本应该算失业,但由于PPP的存在,这类人不算失业,就只好归类到其他分类中。而这部分人口巨大,高达840万人。就出现了各种失业数据互相矛盾的情况。
那这部人会以后会真正失业吗?很大程度上取决于PPP计划是否继续给钱。第一期PPP计划的3000多亿美元早已经用尽,时间是两个月援助期。第二期也是3000多亿美元,川普昨天签署了部分修改条文,比如可以将援助期延长到6个月,但估计可能也很快在2-3个月用完。所以这840万人是否失业,有很大部分取决于PPP是否继续给钱,比如第三期,4期等是否还有。这也是双方专家吵架的一个重要的方面。
如果疫情得到充分控制,复工继续扩大,那么这840万人还有部分可能被原雇主雇佣。所以最后又回到那个老问题:经济恢复,包括失业人数,最后还是要依赖对疫情的控制。
因此现在这个13.1%的失业率(相当于2100多万人失业)可以理解为暂时失业率,没有包括这840万潜在的没有工作的人口。如果包括进去,就刚好是约3000万人失业。
这里值得注意的是,这840万人仍然需要继续找工作,否则他们将来会被从失业人口中去除,即使他们将来永久失业。实际上美国现在有几百万永久失业人口,就是长时间找不到工作放弃找工作的,这几百万人(实际更多)的人不被统计到失业率中。也就是说,将来即使失业率数据变好,可能更多的人反而永久失业了,也是存在的。
3. 那么这样的统计归类误差发生了多久?以后会修正吗?
原文也回答了这个问题。来看第14项:
Prior to the March data collection, instructions were provided to survey interviewers on how to answer the temporarily absent question if a person said that they had a job but did not work due to the coronavirus pandemic. (See item 8 above.) Prior to April data collection, an email was sent to all interviewers that included instructions with more detailed examples and a reference table to aid in coding responses. Prior to May data collection, every field supervisor had a conference call with the household survey interviewers they manage. In these conference calls, the supervisors went over the detailed instructions and examples and were available to answer interviewers' questions.
We will continue to investigate the reasons why the misclassification error persists. In addition, we are making further changes prior to the June collection. The Census Bureau will conduct additional training to review the guidance. Also, we are embedding instructions into the data collection instrument to make them more accessible during survey interviews.
在三月份的数据收集之前,已向调查访问者提供了有关如何回答一个人说自己有工作但由于冠状病毒大流行而没有工作的暂时缺席问题的说明。 (请参阅上面的项目8。)在四月份收集数据之前,已向所有访问者发送了一封电子邮件,其中包括说明,更详细的示例和参考表,以帮助对响应进行编码。在五月份收集数据之前,每个现场主管都与他们管理的住户调查访问员举行了电话会议。在这些电话会议中,主管们浏览了详细的说明和示例,并可以回答访调员的问题。
我们将继续调查错误分类错误持续存在的原因。此外,我们将在6月的系列发布之前进行进一步的更改。人口普查局将进行额外的培训以审查指南。另外,我们正在将说明嵌入数据收集工具中,以使它们在调查访谈中更易于访问。
也就是说,这样的归类误差已经发生了3个月,从3月就开始这么做了,没有把这些absent from work的人,算到失业人口中。如果算进去,那么:
3月失业率是7%,也就是1100万人多一点,
4月失业率19.8%, 也就是3300万人左右
5月失业率是17.9%, 也就是约3000万人。
并且BLS说了,会在本月的数据中,修正这个误差。也就是现在的840万人以及新的这类数据,会被重新归类到失业或者就业中,而不是笼统的其他。6月就业报告会在7月3日股市开盘前发布,那么很明显,这样的大幅修正肯定是对失业率和失业人口数据都是不利的。当然有利的方面是,6月份的继续复工会带来就业新增。另一个问题就是,如果这种分类误差被归类后,那么PPP带来的模棱两可的回答就不再重要。因为调查员和统计员会自己归类。也就是PPP对失业数据的影响会不再像现在这样大幅度。这可以相当程度上停止双方专家对就业数据造假的争吵。
4. 最后小结:
劳工统计局工作基本不及格。实际上前BLS的雇员也对此提出纷纷批评。为什么会出现这样的情况?答案就是政治决定。因为整个白宫管理层都需要这样的操作。或者说下面的人需要心领神会或者被指导故意这样做。他们并没有作假,因为所有的细节和数据都在那里。但在提交给公众媒体时候,就只重点提交了去掉归类于其他的840万人后的数据,理由是要与3月,4月的数据保持统计的一致性。所以就变成了月新增250万人(对应于失业总人口2100万人多点),失业率13.1%,而不是失业总人口2990万人,失业率17.9%
如果看官不想被媒体和专家误导,想自己如何成为就业数据方面的专家,不妨去阅读详细报告全文:
劳工统计局BLS的5月就业数据报告的详细官方说明,见
https://www.bls.gov/cps/employment-situation-covid19-faq-may-2020.pdf
疫情不控制,这些基本面都不是短期能恢复的。还有秋冬季非常可能来到 第二波,一旦发生,股市还是会崩,因为即使全面救援,把几乎所有公司全部国有化,但被救援的公司股票还是会接近清零。
最后唯一的办法,就是直接给所有面临破产的公司直接送钱,按照市值估计,这需要至少10-20万亿美元才够。仅仅非金融企业的总债务2019年就超过10万亿美元,相当于半个美国GDP。那样通货膨胀又会发生,美元和债务都会出问题。
总之,救援是不可能长期持续的。
疫情,只有控制住疫情,股市才有可能不崩盘的希望。
哈哈。感觉大盘可能会在7月季报前后开始崩,一个是季报不好,第二个是GDP目前预测是20-40%的跌幅,第三个是失业率会被重新修正,不乱报的话,出现失业率反而在复工以后上升的奇葩情况,第四个是新冠感染因为这两周的抗议聚集可能出现大幅度上涨。
唯一的问题是,在这样4大利空的冲击下,MM还愿意选择继续维持高位吗?
对MM心疼一秒钟。
也是真的。
即使从真实的总失业人口看,也是符合的。4月3300万人失业减少到了5月3000万人,就业增加了250万人-300万
所以这就是美国媒体的高明之处,以及华尔街的手段。
告诉你的都是真的,实际却是大大的误导。
对投资者来说,6月的非农就业数据会大幅度修正,相当于是absent的840万算入失业人口,加上复工带来的新增就业两方面的互相抵消后剩下的净增就业人口。一个月的复工会新增800多万以上的就业吗?可能有点困难。
所以不排除6月就业新增反而是负增长,也就是失业率反而会上升。尽管新增就业实际增加的可能有几百万。
6月的就业数据会在7月3日发布