润涛阎的小天地

政治面目:瓜子脸。要招人恨,恨得咬牙切齿;要惹人爱,爱得死去活来;要让人服,服得五体投地。
个人资料
润涛阎 (热门博主)
  • 博客访问:
归档
正文

“一人打败全球”的科学家:史密斯(图)

(2009-02-09 21:40:08) 下一个
“一人打败全球”的科学家:史密斯(图)



润涛阎


2-9-2009


很多科学家提出了与众不同、前无古人的思路、定理或结论而震惊世界,这些科学家的一部分获得了诺贝尔奖,如果发生在100年内的话(诺贝尔奖刚好100年了,在这之前也有不少该得奖的科学家),这很正常。这些不是本文要谈的。

本文今天要谈的内容跟题目吻合,就是说这位科学家是提前提出设想,想申请美国NIH的科研经费,由于他的设想在全球所有国家的同行眼中是地地道道的信口开河,必然遭到了没完没了地羞辱---不仅得不到一分钱的资助,而且成为科学家眼里胡言乱语的典型。

我在前文中一开头就提到了这位科学家,当时并非要写他的专文而卖关子。我那篇文章的写作方式是用电影镜头由远而近的技巧,就是先介绍约翰霍普金斯医学院所在地,接着是我们所在的楼,然后是我们实验室,下面便是实验室的人物了。文中介绍了那栋楼就是给他盖的。请看润涛阎《日本人印度人;犹太人伊斯兰人》一文。我那篇文章吸引了很多人,有人想知道文中更多的人和事,也有人提出对史密斯感兴趣,让我介绍一下。今晚有点空,就补写一篇。其他的人物,以后再谈。

他的名字全文是汉密尔顿O.史密斯,英文Hamilton O. Smith。他就是本文要介绍的一人抱打全球最后得胜的科学家。

史密斯由于发现了限制性内切酶(Restriction Enzyme)开创了基因克隆新纪元而获得了诺贝尔奖,那是以前的事了,在此不赘。当DNA顺序(生命密码)的测序方法普及以后,尤其是荧光扫描测序仪的诞生,生物领域里的科学家们必然想把各个生物的生命密码解密,也就是把细胞核里的整个遗传物质---基因组,称为染色体的所有碱基对顺序搞出来。

为了让不是在生物领域里的读者也能明白到底这生命密码是怎么回事,我不得不先给个外行人也能搞明白的解释。

生命密码是由四种碱基组成的一个很长很长的链条(因为能被染色而被称为染色体)。不同生物的链条数不同,比如人,就有23对。其中有一对是性染色体。那么,人的23对染色体链条拉直并接起来后有多长呢?润涛阎做过简单的计算:把一个碱基对放大到一块一尺长的砖,那这个链条就是用四种不同颜色的砖用水泥接在一起(化学名称就是共价键)的薄墙(只有一砖高)。这个由四种颜色的砖连接起来的长墙恰好一百万公里(10亿米)!

由于构成这个长链的碱基对只有四种,不同的排列而已,如何完成测序,便是摆在科学家们面前的难题。

因为必须先把这长链用限制性内切酶切成一段段的,把这一段段的DNA装入载体,载体进入细菌体内进行繁殖,我们才能从细菌体内得到大量的能用于实验室测序的DNA。还好,每个细菌只能接受一个载体,这就是所说的“克隆”了,我们就可以纯化那一段DNA,测出那一段DNA的碱基对顺序。就像知道了这段墙的四种颜色砖的连接顺序。

我们测序是通过电泳跑胶,放射性标记,显影 后读出DNA顺序的。后来有了荧光标记和荧光测序仪,速度增加了很多。工具的革命其重要性不言而喻。

全世界的科学家们无一例外地明白,只有先给这么由一百万公里长的砖墙每隔一段找出一个标记,然后对每段测序。因为这一百万公里长的墙割成一百万段,分别测序的话,如果不提前标记上哪段跟哪段相连,到头来就是一锅粥。反正就那么四种颜色的砖啊。

所以,包括美国、欧洲、亚洲、南非以及遍布地球上的每个角落的生物科学家都参与了标记定位伟大工程。有的给细菌,有的给真菌,有的给植物,有的给动物(老鼠、人等)标记定位。各就各位,忙得不亦乐乎。

此时,史密斯教授提出了走近路的方法:用shotgun(翻译成“扫射”法?)可以完成,也就是说,把这个一百万公里长的墙切成长短不等的段,随机装入载体到细菌体内繁殖,然后测序,抓着谁算谁。他预测:测序读出30亿块砖的时候,这人体的生命密码---10亿块砖的四种颜色顺序就知道了。也就是说,仅仅三倍于整个基因组的测序就可以把整个基因组图谱给接上!

要知道,分离细菌DNA的时候,需要大约一万到一百万个基因组拷贝进行切割。换句话说,就是这个长墙不是一条长链,而是一万条甚至一百万条完全相同的墙,每条长度、砖的颜色顺序都一模一样。把这些切割后搅合在一起。

上面介绍完了专业知识。下面讲史密斯如何一人抱打全球的。精彩的故事便开始了。

他提出了这个“扫射”法测序,他交了申请科学基金的研究报告给NIH,专业术语叫grant.当时NIH正在如火如荼地标记定位基因组,就是上面说的给这个一百万公里长的由四种颜色的大砖连成的墙做标记。看到史密斯的申请报告,审批者们愣了:这是诺贝尔奖得主汉密尔顿.史密斯?他的脑袋灌了水了?

按照最简单的数学计算,全世界正在标记定位基因组的科学家们都停下来跟着史密斯搞扫射法测序的话,那几十年也干不完啊!因为要反复重复同一段,而只差哪怕几个碱基对都无法知道哪跟哪对接!史密斯竟然说他自己一个实验室就能用这种扫射法五年内完成一个细菌基因组的测序,要对接成功。细菌的基因组虽然比人比老鼠小得多,但无论如何也是信口开河。问题在于:这种扫射法根本行不通!

史密斯不依不饶,非要自己证明自己的预测是对的不可。可他没钱买荧光测序仪器,他有个曾经是护士的妻子,可以帮忙。这样,两口子就每天用手工方法测序,白天两口子跑电泳,晚上洗出照片后用放大镜读碱基对顺序。

有一位在美国的日裔科学家叫K.山本(Keith Yamamoto)加州大学教授,他认为,NIH给那么多实验室经费搞基因组定位标记,就不能给史密斯一点钱搞点有风险但与众不同的研究吗?

NIH的主席发话了:我们不能因为史密斯是诺贝尔奖得主,他信口开河的胡乱搞也要给钱。他能说服谁呢?这又不是什么神秘的东东?如果诺贝尔奖得主就可以信口开河而给钱,那诺贝尔奖提名人给不给?其他科学院院士给不给?这个要一视同仁,除非改变NIH审批规则。

医学界数学好的海着去了,就拿史密斯本人来说吧,他的大学就是在伯克利数学系念的,他的学士学位就是数学。你史密斯自己算算你那方法能对接上吗?

史密斯每年都申请,每年的申请内容都差不多,反正就是简单不能再简单的扫射法。

NIH每年都驳回史密斯的申请,每年的驳回内容都差不多,反正就是您老信口开河,专业术语就是“没有依据,风险太大”。

NIH按照投资的思路,就是不搞“风险投资”这是NIH通过的基金审批规则:“有风险,不给钱。”道理就这么简单。

这个世界总有迷信者。

史密斯此时有一个迷信者。其他迷信者不重要,这位迷信者重要,重要之处不在于他多有名气,山本有名气,没用。这位迷信者有用,因为他有钱。

这个事件后,润涛阎突然醒悟:迷信是不能、也不应该破除的。

迷信史密斯的这位看到了DNA测序的时髦,便办了测序公司,就是买一台荧光测序仪,给各个实验室的科学家们测序。你出钱,把样品给他,他给你测序,告诉你你那段DNA的四个碱基对顺序。他的生意红火起来了,就多买荧光测序仪器,滚雪球。他看到史密斯两口子用肉眼读片子,便说我给你测序,不要钱。史密斯说,那就是合作了。成!二人一拍即合。

当全球的科学家们轰轰烈烈地给不同物种的基因组标记的时候,突然看到三大顶尖杂志(细胞、自然、科学)中的《科学》刊登出来了人类历史上第一个完成了生物基因组全部顺序解密的论文,全都傻眼了!人家都把整个基因组的碱基顺序搞完了,我们还搞什么搞?标记标记,定位定位,扯什么扯?封面看完了,打开里边的文章定睛一看,竟然是史密斯和他的粉丝们用扫射法搞出来的!

美国国会不干了!凭什么花这么多钱搞标记,而不给史密斯一分钱?!

NIH的总头只好辞职了。山本教授立刻被招,组成NIH经费审批改革。山本教授着实风光了一阵。在他的主持下,NIH改革了grant 的规则。那是1997年的事了,但今天的5项规则,依然有效。其中之一就是要有“创造性”就是Innoative。史密斯改写了美国NIH的历史。

史密斯本人很低调,那时间你在报道上看到的都是别人的评论,为他鸣不平。照片也是山本先生,报纸杂志都是他。

史密斯的文章出来后,全球所有正在忙于搞标记的立刻停了下来,全部采用史密斯的扫射法。很快大家就看到了一个个生物,从细菌到真菌到老鼠到人,基因组的测序报告。

所有的测序结果证明:平均只有2.5倍于总长度,这扫射法就可以把整个顺序对接。比史密斯预测的工作量还小。

有人事后说史密斯是碰巧了有个有荧光测序仪器的粉丝加入,否则,靠老两口子人工测序,靠放射性显影后用放大镜读,他至少还需五年完成。但事实是:即使没有粉丝用荧光测序仪帮忙,他两口子照样抱打全球!因为完成基因组标记,全世界在这个领域里的科学家们通力合作,也要10年甚至15年才能完成。不论有没有资助,不论有没有粉丝加入,史密斯与全球成千上万的科学家对打,而且是人工对付机器,史密斯都是赢定了。

当时我每天看到史密斯夫妇起早贪黑地干,恨不得自己是个富豪,买台荧光测序仪器给他,不论他的结论是对是错,社会总不能这么对待一位痴情、好胜的长者。尤其是他没钱,实验室缩小到了只有半间。而我们那座大楼当初就是给他盖的。

史密斯的故事告诉人们:真理总是在少数人手里。

大家都有这么个共识:“群众的眼光是雪亮的。”润涛阎也承认这句话当真,只是需要给大家解释一下这句话:

雪是亮的,但不透明。别说雪山下面覆盖着的是铁矿石还是花岗岩,就是一层薄雪下面是红土还是黄土,群众的眼光是无法得知的。

当极少数智者把真理告诉群众后,群众慢慢地明白了,其结果就是用这点知识顽固地反对新的智者的新知识。群众的眼光只有条件反射的功能。

群众的眼光是雪亮的,不透明;智者的眼光是水晶的,能看透本质。

史密斯的故事表明:一些数理化常识在微观领域未必那么铁板一块。润涛阎曾经请教过史密斯教授一个问题:如果把DNA碱基对放大至一尺长的一块砖,人的基因组就是一百万公里。那DNA合成酶合成DNA的速度就是每小时一百一十公里,相当于大约70迈。DNA合成酶把四种颜色的砖用水泥连成一个长链,砖的顺序是根据母链做模板,一旦发现刚连上的那块砖的颜色不对,立刻刹车,把刚才那块错的砖拆下来,再把对的颜色的砖接上。问题是:这么快的速度,它是怎么刹车的呢?汽车跑70迈,急刹车,那也不可能一块砖的打滑都不发生,何况这合成酶是在细胞液里,怎么刹车?在水里的潜水艇最大航速也不过是合成酶的一半不到,潜水艇立刻刹住要走很远一段距离,别说连一块砖的距离都不能超过,对潜水艇来说是无法办到的。史密斯教授听后哈哈一笑,说这个问题好玩。

是的,宏观的数理化常识未必适合于微观领域,至少不是任何时候都能照搬。

我一直纳闷的是:史密斯为何对他那些在别人看来是荒唐的预测如此自信呢?难道是因为他相信当初就是这个细菌让他发现了限制性内切酶而获得了诺贝尔奖,这个细菌的基因组碱基对顺序就得让他完成?也不管他采用什么荒唐的方法?

如果说史密斯应该得第二个诺贝尔奖,恐怕生物界的科学家们没人反对。他的贡献不仅仅是诺贝尔奖青睐的特立独行,还在于他一方面影响了美国NIH的改革,更让全世界范围内同行科学家节省了数年的时间和无数的精力。

史密斯宝刀不老,他立刻着手向另一高峰攀登了。他要攀登的他一生中的第三座大山是“人造生物”,就是根据已知的基因组顺序,重新人工组装基因组,创造地球上从未有过的生物。

但愿他在有生之年再创辉煌。即使他由于年龄因素无法完成这第三座大山的攀登,他的路子会有粉丝追随的。



获得诺贝尔奖时的史密斯教授




当今的史密斯教授


史密斯教授最近几年的论文:

Gibson, D. G., Benders, G. A., et al.
Complete Chemical Synthesis, Assembly, and Cloning of a Mycoplasma genitalium Genome
Science. 2008 Jan 24;

Lartigue, C., Glass, J. I., et al.
Genome transplantation in bacteria: changing one species to another
Science. 2007 Aug 03; 317(5838): 632-8.

Glass, J. I., Assad-Garcia, N., et al.
Essential genes of a minimal bacterium
PNAS USA. 2006 Jan 10; 103(2): 425-30.

Hutchison, C. A., 3rd, Smith, H. O., et al.
Cell-free cloning using phi29 DNA polymerase
PNAS USA. 2005 Nov 29; 102(48): 17332-6.

Smith, H. O., Hutchison, C. A., 3rd, et al.
Generating a synthetic genome by whole genome assembly: phiX174 bacteriophage from synthetic oligonucleotides
PNAS USA. 2003 Dec 23; 100(26): 15440-5.

Venter, J. C., Smith, H. O., et al.
A new strategy for genome sequencing
Nature. 1996 May 30; 381(6581): 364-6.

Fraser, C. M., Gocayne, J. D., et al.
The minimal gene complement of Mycoplasma genitalium
Science. 1995 Oct 20; 270(5235): 397-403.

Fleischmann, R. D., Adams, M. D., et al.
Whole-genome random sequencing and assembly of Haemophilus influenzae Rd
Science. 1995 Jul 28; 269(5223): 496-512.

Fields, C., Adams, M. D., et al.
How many genes in the human genome?
Nature Genet. 1994 Jul 01; 7(3): 345-6.

[ 打印 ]
阅读 ()评论 (45)
评论
peacemind2 回复 悄悄话 回复 'clinton-2007' 的评论 :
是啊,我想了一下这其实是一个数学问题,史密斯那么大名气,评审人肯定不止一个,这些评审人得有多大偏见不去做一下计算。其实不做计算直观上也可以明白其中的道理。
peacemind2 回复 悄悄话 "如果把DNA碱基对放大至一尺长的一块砖,人的基因组就是一百万公里。那DNA合成酶合成DNA的速度就是每小时一百一十公里,相当于大约70迈。DNA合成酶把四种颜色的砖用水泥连成一个长链,砖的顺序是根据母链做模板,一旦发现刚连上的那块砖的颜色不对,立刻刹车,把刚才那块错的砖拆下来,再把对的颜色的砖接上。问题是:这么快的速度,它是怎么刹车的呢?汽车跑70迈,急刹车,那也不可能一块砖的打滑都不发生,何况这合成酶是在细胞液里,怎么刹车?"
这个问题很好解答啊,类比有类比的局限性,有质量的车存在惯性需要刹车,而合成酶反应中可能不存在对应的惯性特性不需要刹车。换句话说,这个类比引用了额外的但是不是实际存在的特性。
polar_bear 回复 悄悄话 回复 '梁山石燕' 的评论 : 因为玩不了。
旮旯儿 回复 悄悄话 老阎了不了解,你古拉,特斯拉,人类历史上的科学巨匠,据说比爱因斯坦牛多了,可好多人却不知道其人其事,期待老阎的观点!~
uszxcvbnm 回复 悄悄话 说真的,我们都是人造生物。只是因为地球被重复毁灭了N次,一切记录和痕迹都没有了,人类重复着从石器时代到高科技的发展。但愿这一次文明的持续,能让人类在地球灾难性毁灭前找到飞出银河系的途径并安全移民。
★火眼金睛☆ 回复 悄悄话 回复梁山石燕的评论:

我C,总有这样的SB跳出来。没事趁早死远!
tibuko 回复 悄悄话 I don't get it. Even if (a) there are 50,000 copies of each segment, (b) 1million segments, so long as each segment is long enough, then it's obvious the shotgun approach would work statistically. NIH's math needs some work?
梁山石燕 回复 悄悄话 润涛阎曾经请教过史密斯教授一个问题:如果把DNA碱基对放大至一尺长的一块砖,人的基因组就是一百万公里。那DNA合成酶合成DNA的速度就是每小时一百一十公里,相当于大约70迈。DNA合成酶把四种颜色的砖用水泥连成一个长链,砖的顺序是根据母链做模板,一旦发现刚连上的那块砖的颜色不对,立刻刹车,把刚才那块错的砖拆下来,再把对的颜色的砖接上。问题是:这么快的速度,它是怎么刹车的呢?汽车跑70迈,急刹车,那也不可能一块砖的打滑都不发生,何况这合成酶是在细胞液里,怎么刹车?在水里的潜水艇最大航速也不过是合成酶的一半不到,潜水艇立刻刹住要走很远一段距离,别说连一块砖的距离都不能超过,对潜水艇来说是无法办到的。史密斯教授听后哈哈一笑,说这个问题好玩。""其实涛哥擅长的是这个领域,只是可惜为何不去为这这个绝妙的问题寻找答案呢?反而花那么多时间去灌水,搞些没多大意义的东西呢?
mmgmmg 回复 悄悄话 回复润涛阎的评论:
谢谢
润涛阎 回复 悄悄话 回复mmgmmg的评论:

我文章说的是他在95年发表的细菌,而非后来的人的基因组。由于他用鸟枪扫射法完成了一个细菌的基因组测序,人的基因组测序也就立刻改用此法了。他也是参与者之一。

谢谢您的工作与评论!
mmgmmg 回复 悄悄话 Sorry I can not type Chinese with my computer.

I am very gland to read anther very good paper from润涛阎. Driving by the curiosity I checked the paper Smith HO published in Science and nature. My software provides an extra very useful information that is the time cited for each papers. Paper #9 published 0n 2001 had been cited most frequently, that is 4,746.

After check with 润涛阎’s article, I realized that 《科学》刊登出来了人类历史上第一个完成了生物基因组全部顺序解密的论文 should be before 1997. Is it the Paper #28 published 0n 1995, which was cited 3,098 so far.

Dr. 润涛阎, is there any comments about paper #9?



1. Title: Complete chemical synthesis, assembly, and cloning of a Mycoplasma genitalium genome
Author(s): Gibson DG, Benders GA, Andrews-Pfannkoch C, et al.
Source: SCIENCE Volume: 319 Issue: 5867 Pages: 1215-1220 Published: FEB 29 2008
Times Cited: 34


2.
Title: Genome transplantation in bacteria: Changing one species to another
Author(s): Lartigue C, Glass JI, Alperovich N, et al.
Source: SCIENCE Volume: 317 Issue: 5838 Pages: 632-638 Published: AUG 3 2007
Times Cited: 38


3.
Title: Environmental genome shotgun sequencing of the Sargasso Sea
Author(s): Venter JC, Remington K, Heidelberg JF, et al.
Source: SCIENCE Volume: 304 Issue: 5667 Pages: 66-74 Published: APR 2 2004
Times Cited: 894


4.
Title: The genome sequence of the malaria mosquito Anopheles gambiae
Author(s): Holt RA, Subramanian GM, Halpern A, et al.
Source: SCIENCE Volume: 298 Issue: 5591 Pages: 129-+ Published: OCT 4 2002
Times Cited: 739


5.
Title: Genome sequence and comparative analysis of the model rodent malaria parasite Plasmodium yoelii yoelii
Author(s): Carlton JM, Angiuoli SV, Suh BB, et al.
Source: NATURE Volume: 419 Issue: 6906 Pages: 512-519 Published: OCT 3 2002
Times Cited: 318


6.
Title: Sequence of Plasmodium falciparum chromosomes 2, 10, 11 and 14
Author(s): Gardner MJ, Shallom SJ, Carlton JM, et al.
Source: NATURE Volume: 419 Issue: 6906 Pages: 531-534 Published: OCT 3 2002
Times Cited: 78


7.
Title: A comparison of whole-genome shotgun-derived mouse chromosome 16 and the human genome
Author(s): Mural RJ, Adams MD, Myers EW, et al.
Source: SCIENCE Volume: 296 Issue: 5573 Pages: 1661-1671 Published: MAY 31 2002
Times Cited: 178


8.
Title: Complete genome sequence of a virulent isolate of Streptococcus pneumoniae
Author(s): Tettelin H, Nelson KE, Paulsen IT, et al.
Source: SCIENCE Volume: 293 Issue: 5529 Pages: 498-506 Published: JUL 20 2001
Times Cited: 477


9.
Title: The sequence of the human genome
Author(s): Venter JC, Adams MD, Myers EW, et al.
Source: SCIENCE Volume: 291 Issue: 5507 Pages: 1304-+ Published: FEB 16 2001
Times Cited: 4,746


10.
Title: DNA sequence of both chromosomes of the cholera pathogen Vibrio cholerae
Author(s): Heidelberg JF, Eisen JA, Nelson WC, et al.
Source: NATURE Volume: 406 Issue: 6795 Pages: 477-483 Published: AUG 3 2000
Times Cited: 681


11.
Title: The genome sequence of Drosophila melanogaster
Author(s): Adams MD, Celniker SE, Holt RA, et al.
Source: SCIENCE Volume: 287 Issue: 5461 Pages: 2185-2195 Published: MAR 24 2000
Times Cited: 2,668


12.
Title: Complete genome sequence of Neisseria meningitidis serogroup B strain MC58
Author(s): Tettelin H, Saunders NJ, Heidelberg J, et al.
Source: SCIENCE Volume: 287 Issue: 5459 Pages: 1809-1815 Published: MAR 10 2000
Times Cited: 536


13.
Title: Global transposon mutagenesis and a minimal mycoplasma genome
Author(s): Hutchison CA, Peterson SN, Gill SR, et al.
Source: SCIENCE Volume: 286 Issue: 5447 Pages: 2165-2169 Published: DEC 10 1999
Times Cited: 358


14.
Title: Genome sequence of the radioresistant bacterium Deinococcus radiodurans R1
Author(s): White O, Eisen JA, Heidelberg JF, et al.
Source: SCIENCE Volume: 286 Issue: 5444 Pages: 1571-1577 Published: NOV 19 1999
Times Cited: 454


15.
Title: Evidence for lateral gene transfer between Archaea and Bacteria from genome sequence of Thermotoga maritima
Author(s): Nelson KE, Clayton RA, Gill SR, et al.
Source: NATURE Volume: 399 Issue: 6734 Pages: 323-329 Published: MAY 27 1999
Times Cited: 720


16.
Title: Science over politics
Author(s): Lanza RP, Arrow KJ, Axelrod J, et al.
Source: SCIENCE Volume: 283 Issue: 5409 Pages: 1849-1850 Published: MAR 19 1999
Times Cited: 5


17.
Title: Chromosome 2 sequence of the human malaria parasite Plasmodium falciparum
Author(s): Gardner MJ, Tettelin H, Carucci DJ, et al.
Source: SCIENCE Volume: 282 Issue: 5391 Pages: 1126-1132 Published: NOV 6 1998
Times Cited: 350


18.
Title: Complete genome sequence of Treponema pallidum, the syphilis spirochete
Author(s): Fraser CM, Norris SJ, Weinstock CM, et al.
Source: SCIENCE Volume: 281 Issue: 5375 Pages: 375-388 Published: JUL 17 1998
Times Cited: 504


19.
Title: The complete genome sequence of the hyperthermophilic, sulphate-reducing archaeon Archaeoglobus fulgidus (vol 390, pg 364, 1997)
Author(s): Klenk HP, Clayton RA, Tomb JF, et al.
Source: NATURE Volume: 394 Issue: 6688 Pages: 101-101 Published: JUL 2 1998
Times Cited: 10


20.
Title: Shotgun sequencing of the human genome
Author(s): Venter JC, Adams MD, Sutton GG, et al.
Source: SCIENCE Volume: 280 Issue: 5369 Pages: 1540-1542 Published: JUN 5 1998
Times Cited: 165


21.
Title: Genomic sequence of a Lyme disease spirochaete, Borrelia burgdorferi
Author(s): Fraser CM, Casjens S, Huang WM, et al.
Source: NATURE Volume: 390 Issue: 6660 Pages: 580-586 Published: DEC 11 1997
Times Cited: 968


22.
Title: The complete genome sequence of the hyperthermophilic, sulphate-reducing archaeon Archaeoglobus fulgidus
Author(s): Klenk HP, Clayton RA, Tomb JF, et al.
Source: NATURE Volume: 390 Issue: 6658 Pages: 364-& Published: NOV 27 1997
Times Cited: 960


23.
Title: The complete genome sequence of the gastric pathogen Helicobacter pylori (vol 388, pg 539, 1997)
Author(s): Tomb JF, White O, Kerlavage AR, et al.
Source: NATURE Volume: 389 Issue: 6649 Pages: 412-412 Published: SEP 25 1997
Times Cited: 25


24.
Title: The complete genome sequence of the gastric pathogen Helicobacter pylori
Author(s): Tomb JF, White O, Kerlavage AR, et al.
Source: NATURE Volume: 388 Issue: 6642 Pages: 539-547 Published: AUG 7 1997
Times Cited: 1,979


25.
Title: Complete genome sequence of the methanogenic archaeon, Methanococcus jannaschii
Author(s): Bult CJ, White O, Olsen GJ, et al.
Source: SCIENCE Volume: 273 Issue: 5278 Pages: 1058-1073 Published: AUG 23 1996
Times Cited: 1,823


26.
Title: A new strategy for genome sequencing
Author(s): Venter JC, Smith HO, Hood L
Source: NATURE Volume: 381 Issue: 6581 Pages: 364-366 Published: MAY 30 1996
Times Cited: 170


27.
Title: THE MINIMAL GENE COMPLEMENT OF MYCOPLASMA-GENITALIUM
Author(s): FRASER CM, GOCAYNE JD, WHITE O, et al.
Source: SCIENCE Volume: 270 Issue: 5235 Pages: 397-403 Published: OCT 20 1995
Times Cited: 1,462


28.
Title: WHOLE-GENOME RANDOM SEQUENCING AND ASSEMBLY OF HAEMOPHILUS-INFLUENZAE RD
Author(s): FLEISCHMANN RD, ADAMS MD, WHITE O, et al.
Source: SCIENCE Volume: 269 Issue: 5223 Pages: 496-512 Published: JUL 28 1995
Times Cited: 3,098


29.
Title: FREQUENCY AND DISTRIBUTION OF DNA UPTAKE SIGNAL SEQUENCES IN THE HAEMOPHILUS-INFLUENZAE RD GENOME
Author(s): SMITH HO, TOMB JF, DOUGHERTY BA, et al.
Source: SCIENCE Volume: 269 Issue: 5223 Pages: 538-540 Published: JUL 28 1995
Times Cited: 119


30.
Title: PLEA TO THE SCIENTIFIC COMMUNITY
Author(s): BALTIMORE D, BERG P, BLOCH KE, et al.
Source: SCIENCE Volume: 216 Issue: 4550 Pages: 1046-1046 Published: 1982
Times Cited: 0


To-morrow 回复 悄悄话 作为一个病理学家,你们的讨论有点艰深,但我很有兴读每一个人的见解,很有意思。
下次提问题。
叫我干吗? 回复 悄悄话 非常大的可能,本文作者不懂数学。估计随便一个搞统计的人就能解释为什么平均需要的时间是3年左右。虽然我不懂生物科学,但是我记得当初基因的概念被提出来的时候,就是简单的组合知识,使得发现者大胆提出了基因的概念。
twice10y 回复 悄悄话 James Watson and Francis Collins wasted lots of taxpayer's money and time for human genome project. They said dirty words on Shotgun and thought Craig Venter and Ham Smith had stolen public sequence data. Shame.
FA&TA=FAT 回复 悄悄话 In theory, with 3x coverage, one could recover 95% sequence by chance.
Coverage % Recovery
3x 95
4x 98
5x 99
天涯过客- 回复 悄悄话 既然真理总是在少数人手里,为什么总要少数服从多数?:-)
dongfangshaoer 回复 悄悄话 这篇很牛,支持一下:)
999ggg 回复 悄悄话 阎老师是真正的有才,与高人为伍的高人啊!由衷地钦佩您在各个方面的建树。全才,俺的偶像,这城里俺最佩服的人。
Edwardwxc 回复 悄悄话 谢谢楼主,SMITH 是那篇流感嗜血杆菌测序的作者,因为作者人数太多,PUBMED 隐藏了后半部分,我没看到,这个工作确实开创了鸟枪法随机测序的先河。不过参考文献的第二篇他的那篇Genome transplantation in bacteria: changing one species to another的工作争论很大,虽然碍于这些大牛在学界的影响很多人不敢公开质疑,但确实很多人对这个工作持怀疑态度。原因是这个试验没有一个好的对照。这个工作是用一个物种的完整的基因组A,当然是非常小的细菌支原体的基因组,去转化另一个物种B也是支原体,结果是A 完全转化了B从而B变成了A。问题是无法确认这个工作的真实性。如果转化真核细胞,我们可以根据线粒体的母系遗传,通过检测线粒体的基因来证明被转化的细胞,细菌没有线粒体,很难说得到的转化细胞是真实的,万一是不小心污染,或者是技术员偷懒接种了一个A菌进去了呢?很难说。毕竟转化用的是一个基因组,而感受态细胞只是一个很小的细菌--支原体细胞,而且没有一个对照。

他们这个团队的合成基因组工作有很强的新闻效应,说是人工合成了生命,很能唬住非专业人士。但是生命不仅仅是DNA, DNA只是一个程序,一个设定好的信息,如果不能提供让它表达的环境DNA只不过是一个多聚核苷酸大分子。这个工作只不过把一个基因组根据发表的序列分段合成连接在一起,所用的技术方法都是成熟的分子生物学技术,所以在科学上价值很有限,文章能发在SCIENCE上只能说明这个团队的人很有影响力(诺奖,院士,新闻名人),并不是他们的工作做得多好。不借助一个活的生物体去真正从零开始合成一个生命,估计还有很长的路要走。不过我还是挺喜欢他的seminar的。
clinton-2007 回复 悄悄话 回复润涛阎的评论:
30亿次就能测出10亿硷基序列不是他计算的结果吗
我知道他不可能取出一个单独的DNA测试,测试中有重复片段。
润涛阎 回复 悄悄话 回复clinton-2007的评论:

您这就错了。

不能拿出一个细胞的基因组来测序。每段都有上万个拷贝,你想想看,数学计算能站在史密斯一边吗?假如有一万个拷贝,你要用测序多少个克隆总数?
clinton-2007 回复 悄悄话 回复润涛阎的评论:
真的啊?真不敢相信NIH的人数学这么差。值要有高中数学基础就能明白这个原理啊。当然史能计算出30亿次就可测出10个硷基序列,要有一定的概率知识。史的数学学士学位不是图有虚名啊。

史的计算结果应该还有一些条件。如平均测试片段长度,测试结果是几个九的可信度。这都影响他的30亿次测试结论。
润涛阎 回复 悄悄话 回复clinton-2007的评论:

您所说的是对的。只是这个基因组很大,也就是说很长。而且有数以万计的拷贝。
clinton-2007 回复 悄悄话 楼主说的史密斯Shotgun方法没太看明白。是不是假设有一条DNA长链顺序为:
ABCDEFFG......WXYZ,当然我们事先不知道它的顺序是如此的.史的方法就是把N条这样的DNA长链按任意长度截断为一个个小段。然后随机测试任意一段,这样我们就可以知道这一段的DNA硷基序列。然后假设史在测式M段片段后,发现有一段为ABC,而另一段为BCD,它们有重复序列BC段,所以他就断定,这两段相邻,合起来就组成一个大段为ABCD。以此类推,只要他测试的段数足够多,他就能从中组成从ABCDE,,,,,,,WXYZ的完整DNA序列。是这样吗?
润涛阎 回复 悄悄话 回复Edwardwxc的评论:

这篇就是最早的测序文章,我的文章最后倒数第二个索引。您去查查该期杂志上史密斯的介绍,在同一期上。其他人只是帮忙的。

Fleischmann, R. D., Adams, M. D., et al.
Whole-genome random sequencing and assembly of Haemophilus influenzae Rd

Science. 1995 Jul 28; 269(5223): 496-512.
润涛阎 回复 悄悄话 回复Edwardwxc的评论:

您错了。

1.他的第一个发表的不是人的基因组,而是细菌H. Influenza的测序。那是在《科学》上发表的。

2.人类基因组的测序是后来的事了。我文章指的不是这个,而是第一个。

3.关于扫射法,我文章没说是史密斯的发明,我本人早就用这个方法。但没有人认为扫射法能把基因组测序对接。史密斯是唯一一人。受到了NIH不给钱的刁难。我文章给了详细的说明。那时我在美国,非常清楚这个事的来龙去脉。NIH的头辞职的时候,很多报纸报道。你如果那时在美国,你就明白了。

4.我给出了他的论文题目,你看看就知道了。在我身边发生的事,我不会搞错的。


Edwardwxc 回复 悄悄话 2008年六月在天津医科大学开会时我见到过他本人,还有他几个J Craig Venter研究所的同事。据我所了解,他不是第一个提出扫射法(又称鸟枪法)测序的,而且第一个用扫射法测序的是流感嗜血杆菌,发在《科学》上,作者名单中没有他的名字。关于人类基因组测序,当时有两个团队同时做这个工作,一个是国家资助的,另一个是私人公司。史密斯所在的团队是私人的,领导人是J Craig Venter,而不是他,并且他们的测序借用参考了很多国家测序团队公布的结果。发这个文章时,这两个团队同时发表的工作,一个是在NATURE(星期三),一个是在SCIENCE(星期四)。关于合成基因组,发起人是J Craig Venter,也不是SMITH。如果你注意到他们所发文章的通讯作者,你就会知道他只是参与,而不是第一个提出这个IDEA的人,更不要说他是“一人打败全球”了。
HalfFull 回复 悄悄话 Many overlapping reads for each segment of the original DNA are necessary to overcome the difficulties of shotgun sequencing in order to accurately assemble the sequence. For example, to complete sequencing the human Genome (contains more than 3.2 billion base pairs), most of the human genome was sequenced at 12X or greater coverage; that is, each base in the final sequence was present, on average, in 12 reads. Even so, current methods have failed to isolate or assemble reliable sequence for approximately 1% of the (euchromatic) human genome.
远去的时光 回复 悄悄话 这事听起来很蹊跷, 成功后的反推如果与当时史密斯提出的假设一致, 那他当初为什么不能给出更令人信服的计算呢?
千江水千江月 回复 悄悄话 专业普及没怎么看懂,不过如果我都看懂了当初这个教授就不会没人帮忙了。我不相信老教授的成功仅在于幸运,他这样的执著自己的信念一定是有他踏实的理论基础的。
润涛阎 回复 悄悄话 回复阿健的评论:

I think people at first hand belived he was lucky. now people think his idea is logic.

every new findings in science will pass three stages: first, people say it is not true;
then, people will say it is true but not important;
and finally, people will say it is true and important, but not new.

smith's theory is "not new" now, though it is true and important (in the last stage of the three stages)


thanks for your comments.
阿健 回复 悄悄话 回复润涛阎的评论:

(I don't have access to Chinese software at this moment)

I meant, IN THEORY, could his experiment be repeated to produce the same result (of course in a similar time interval). We don't need to re-do it in the lab but only to do a "thought experiment". If it could be repeated, which means his math was VALID and his result was not by luck but logic.
润涛阎 回复 悄悄话 回复阿健的评论:

您不是火星来的?他当初搞的是细菌,现在那么多物种的基因组都被测序完了,还怎么重复?重复几百遍了啊。连玉米大豆芝麻烂谷子的生命密码都快搞完了呀。人家都在搞人造生物了。
阿健 回复 悄悄话
他的实验能重做吗。如果能、似乎就暗示他在数学上正确。
如果不能、则就象博主说的、是上帝上次帮他而已。

润涛阎 回复 悄悄话 回复千重雪的评论:

真正的难题不在这里。这个好解决。




在接头的地方有重合的克隆就行。见下图:

A----------------------------B
C----------------D


真正的争议是:每个基因组每一段都有数以万计的拷贝,无法得到一个单链。这么多拷贝,他说没问题,只要3倍的总长度就可以了。而数学计算不可能。
千重雪 回复 悄悄话 老阎,不做标记,怎么知道对接是正确的?怎么证明所接的就是相邻的两段?
润涛阎 回复 悄悄话 答楼下各位:

我没说扫射是史密斯发明的,早在史密斯之前大家都用。我是说史密斯预测用扫射法不用标记就可以对接,而且只需要三倍的总长度。

关于数学计算:当年很多数学家参与了计算,跟史密斯对垒。微观领域里的现象尤其是生物体内,不是宏观理论一一对应的。有时间的话,我写一篇专文来论述其可能性。这篇太长了,不能不停下来。
dahaoren 回复 悄悄话 扫射法不是Craig Venter搞的吗?
bbbbtttt 回复 悄悄话 按偶的理解,应该又有新的数学理论要诞生了。
小马识图 回复 悄悄话 我赞同阿健的意见,他的结论应该在数学上也是正确的,只是别人没有理解。
小马识图 回复 悄悄话 大牛人啊,佩服!shotgun好像是散弹枪。
老阎,你的流血的婚姻还写不写了,我等的太久了。
润涛阎 回复 悄悄话 回复阿健的评论:

全世界的科学家都是按照概率计算来否定他的。按照数学计算,他是必输无疑。他的成功在于:上帝偏向他。好比飞机出事了,有人活了,其他人都死了。你要知道为何那个人没死,只有上帝有答案。
阿健 回复 悄悄话 抱歉、没有看懂、但依然好奇。
文中说
把这个一百万公里长的墙切成长短不等的段,随机装入载体到细菌体内繁殖,然后测序,抓著谁算谁。他预测:测序读出30亿块砖的时候,这人体的生命密码---10亿块砖的四种颜色顺序就知道了。

他是不是在说一个概率问题呢。就是说他是否找到了一个数学方法呢。如果是、他的方案被否决是因为别人不了解数学部分、还是认为技术部分不可行。谢谢
[1]
[2]
[尾页]
登录后才可评论.