个人资料
正文

学习使用Google工具

(2006-09-15 00:30:59) 下一个




 

 

 

学习使用Google工具

 

 

 

 







http://www.googlechinablog.com/google_bb.gif" width=248 border=0>

Google (谷歌)中国的博客网志,走近我们的产品、技术和文化





我们的新家






昨天休假回来的第一天 9 月 4 日正好赶上我们搬新家 -- 从清华科技园的临时办公室正式搬到旁边刚建好的 Google 大厦。刚走进办公室的时候还真有点不敢相信,10 层的大楼,宽敞明亮,到处都洋溢着 Google 的彩色元素,各色的 Google 节日图标挂在墙上...... 而最让我觉得 “震撼” 的就是工程师们对自己办公室环境的创意,平时就看到他们写程序了,没想到做起“设计”来也如此有灵气,再一次证明了人的想象力和创造力在各方面都是互通的。

当然有了足够的空间以后,公司也就可以更好的给员工提供各种各样的福利。我看到了新的瑜珈房(我的最爱:))、健身馆、按摩房、台球桌、卡拉OK室、跳舞机...... 在互联网公司平时大家节奏快压力大,工作加班都很辛苦,所以只要是公司能为大家想到的都想到了。大厨虽然还没正式到位,到据说已经在紧锣密鼓在招聘中了。

看看 Googlers 是怎么说的吧:

“我前前后后待过大约 10 个 office,这是我见过的最漂亮的 office. 很骄傲,很自豪。” -- 陶宁

“感觉蛮象家的,很温馨,愿意在这里待到挺晚。” -- 刘敏

“现在这里很安静,以前空间很小。感觉很自由。除了缺张床外,什么都有了。” -- 蔡健

“9月4号,Google 中国终于‘独立’了 -- 有了自己独立的办公大楼了。” -- 李大海

“这边办公条件比以前好太多了,有娱乐设备也有健身设备,我们可以开心的在这里工作和生活。” -- 刘黎

“很兴奋。一切都比我想象的要好。” -- 褚振宇

“舒适的办公环境,一流的休闲、娱乐、健身设施,只想说一句:吃的好,玩的好,更要把工作做好。希望未来能够象憧憬的那样:天天天蓝,日日日新。” -- 张霞

“健身房,火爆的跳舞机,还有台球桌,乒乓球桌。。。为了多玩一会,看来只能提高工作效率了。不过,最得意地还是亲自装饰过的办公室,和为 Team 设计的 logo 哦。” -- 胡坤

“更喜谷歌崭新窝,搬家之后尽开颜。” -- 李双峰

我不由想起在公司一直听到的一句话:

We provide exceptional work environment to attract the world’s best talents and make the best products for our users.(我们为员工提供一流的工作环境来吸引世界上最优秀的人才,让他们为用户开发出最好的产品)

下面跟大家分享一些我们新家的照片吧 --

http://googlechinablog.com/uploaded_images/googleppl-751802.jpg" border=0>

http://googlechinablog.com/uploaded_images/kfjohnny-715684.JPG" border=0>

http://googlechinablog.com/uploaded_images/sofa-733664.jpg" border=0>

http://googlechinablog.com/uploaded_images/sou-794363.jpg" border=0>

http://googlechinablog.com/uploaded_images/xucheng-740043.jpg" border=0>

http://googlechinablog.com/uploaded_images/dance-768118.jpg" border=0>

http://googlechinablog.com/uploaded_images/blackboard-788284.jpg" border=0>

http://googlechinablog.com/uploaded_images/cnknot-717724.JPG" border=0>

http://googlechinablog.com/uploaded_images/chatting-723753.JPG" border=0>

http://googlechinablog.com/uploaded_images/road-734975.JPG" border=0>

http://googlechinablog.com/uploaded_images/rail-781469.JPG" border=0>

http://googlechinablog.com/uploaded_images/cuijin-701369.JPG" border=0>



车牌的故事






1999年,Google 虽然还很小,但在大学校园里已小有名气了。当时一位好友毕业工作后买了一辆新车,加州交管局给她分配的车牌是:4GOG004。我们开玩笑说,“这么巧,这车牌怎么看上去像 Google?这可省得你买车牌了。”

原来,爱车族们可以向交管局申请http://www.dmv.ca.gov/online/elp/elp.htm" target=_blank>个性化的车牌,只要尚未被别人注册,每年缴纳一定的费用即可。广大车主们这时往往是各尽所能,发挥出无穷的想象力和创造力。

有关于家庭的,例如,PRD DAD (骄傲的父亲);

有关于理念的,例如,GREEN(绿色环保))或者 45MPGhttp://www.google.cn/search?hl=zh-CN&q=45+%E8%8B%B1%E9%87%8C%E6%AF%8F%E5%8A%A0%E4%BB%91%E7%AD%89%E4%BA%8E%E5%A4%9A%E5%B0%91%E5%85%AC%E5%8D%87%E6%AF%8F100%E5%85%AC%E9%87%8C&btnG=Google+%E6%90%9C%E7%B4%A2&meta=" target=_blank>一加仑汽油可以跑45)一看便知车主是一位铁杆儿环保主义者;

还有调皮捣蛋的,例如,MWMWMNW,整个儿是考验你视力的。这位十有八九是想超速,却又不想被警察记下牌照,故意让人看不清楚!

当然,身处计算机工程师云集的硅谷,也不时能见到一些有计算机特色的车牌。例如:

DRWXRWX - 这位车主显然是爱用 Unix 或者 Linux (注:想想命令ls -l);
NOT PC - 这位车主恐怕是苹果超级爱好者吧。

后来到 Google 工作,才发现 Google 也是一个个性化车牌云集的地方,真是大饱眼福。在公司的停车场里曾见到过下列车牌:

GOOGLER

GOOGLR
GQQGLE
GOOOGLE
GOOGLEE

ORKUT
BLOGGER
IGOOGLE

这里讲一个小插曲,GOOGLER (Google 人) 这个车牌是 Google 的一位较早的中国工程师率先注册的。据介绍,这令周围的同事们羡慕不已,也令其中一位同事懊悔不已。原来,那位同事早有此意,只是因为尚在偿还学生贷款,他觉得应一切从简,等贷款还完之后再花钱注册。看来,真是应该该出手时就出手啊。不过,Google 的同事们还是纷纷想出了各种关于 Google 或者 “Google人”的变种,来过过瘾。

据说,这个“Google 人” 的车牌还被收入了维基百科全书,作为 Google 企业文化的一个见证。

http://googlechinablog.com/uploaded_images/googler_dmv-737844.gif" border=0>



Google (谷歌)工具栏的“小特点”与“大目标” 之二 精巧功能






http://googlechinablog.com/uploaded_images/Toolbar-797845.JPG" border=0>

搜索是 Google 的看家本领,在前一篇简单介绍了我们近期新发布的 http://toolbar.google.com/T4/intl/zh-CN/" target=_blank>Google(谷歌)工具栏 的搜索功能,本篇中,想与大家分享一些出现在这个版本中有用的“小功能”,希望每个功能都能给用户带来一份惊喜。

用中文包打天下

如果说 Google(谷歌)使命是整合全球信息,让人人都能方便的获取和使用,对于 Google(谷歌)中国来说,可能还要加上一条,那就是让全世界的信息都能以中国人最熟悉的语言展现出来——用“中文包打天下”。通过工具条上的翻译功能,用户只要将鼠标停留在网页中的英文字词上,就可以实现对网页上该词的翻译。

http://googlechinablog.com/uploaded_images/translation-792347.JPG" border=0>

另外, "拼写检查"功能也颇为实用,它能帮助您立即找出任何网页上的拼写错误。然后点击一下"自动修正"选项就会为您改正所有拼写错误。

http://googlechinablog.com/uploaded_images/translation1-792948.JPG" border=0>

更强的是,使用工具条上的一键翻译按钮,人们就可以把正在浏览的整个页面翻译成中文。例如下图中展示了您如何通过一键翻译浏览斯坦福大学的网站。

http://googlechinablog.com/uploaded_images/Stanford-794555.JPG" border=0>

虽然机器自动翻译的准确度今天还有待提高, 但这还是为E文不好的同志们打开了一扇通向世界的大门。基于目前的产品,英文原文作者的行文风格与语法的标准程度会对翻译质量结果影响很大——有时候准确度惊人, 有时候有些让人摸不着头脑,一般标准新闻等的翻译质量还是相当不错的。

按钮个性“一点”

现在大家都在谈个性化,我们的工具栏也给大家准备了丰富多彩的个性化按钮配置,方便大家以一键点击的方式使用自己最常用的搜索, 目前在英文中已经拥有了超过http://www.google.com/tools/toolbar/buttons/gallery?hl=zh-CN" target=_blank>600个个性化按钮。

个性化搜索:按照你的需要和习惯,无论是新闻、科技还是游戏、娱乐、购物,多种应用,你都可以方便地设置。目前虽然中文的个性化按钮还不多,但我们已经开放了这一产品的http://toolbar.google.com/buttons/intl/zh-CN/apis/index.html" target=_blank>API协议,我们希望更多的网站能积极提供自己网站的按钮到Google的按钮库,以供用户下载,也是帮助网站推广自己哦!

自定义搜索——任何搜索引擎都可以为你的工具栏所用! Google(谷歌)完全尊重每个人的搜索习惯和倾向。 在你喜欢的搜索引擎页面上,只需在其搜索框中点击右键,就会看到来自 Google(谷歌)的“生成自定义搜索”选项,无需改变任何搜索习惯,轻轻一点,Google(谷歌)就可以帮你把这个搜索引擎的快捷按钮添加到 Google(谷歌)工具栏上。今后你在 Google(谷歌)工具栏搜索框中输入关键词,点击定制按钮,就可以直接得到来自这个搜索引擎的结果了!

http://googlechinablog.com/uploaded_images/Qihoo-769484.JPG" border=0>

收藏夹随身携带

是不是现在已经习惯了点击一下收藏中的页面而不会再去记复杂而拗口的URL(域名)了? 但会不会有这样的状况,一旦换了电脑,原来自己在收藏夹中精心整理的页面也就随之消失。而 Google(谷歌)工具栏的书签功能则不会让这种情况出现,你只需要按照习惯的方式把喜欢的页面放在“Google(谷歌)书签”中,使用时,只要登录您的 Google账户,就可以在任何装有 Google(谷歌)工具栏的电脑上随时访问你喜爱的网站, 并把更多网站随时加入这个移动书签。

http://googlechinablog.com/uploaded_images/Shuqian-705481.JPG" border=0>

无论是让搜索变得更快捷、覆盖更广泛,还是更智能、更个性,我们的目标就是让用户更满意,而所有小功能还仅仅是迈出了太微小的又一步,所以为了这个“大目标”,我们还要继续努力、前进。



Google (谷歌)工具栏的“小特点”与“大目标” 之一 搜索篇






http://googlechinablog.com/uploaded_images/Toolbar-797845.JPG" border=0>

在我的理解中,Google(谷歌)所做的很多事情都是围绕着“能不能让用户更方便,更快捷地获得信息”这个目标展开。从最近刚刚推出的http://www.google.com/tools/firefox/toolbar/FT2/intl/zh-CN/index.html" target=_blank>Google(谷歌)工具栏新版来看,最早 2000 年的 1.0 到今天 4.0 版本的发展历程,正是为了不断提升用户体验,让用户更方便、更快捷地获取信息。

增强型搜索:

“一站式”“一揽子”,这些词无非都是表达了用户希望简单、方便解决问题的需求,我们常常听到用户这样的抱怨“不知道 Google 最近又发布了什么产品” “要找到 Google 更多里的产品真麻烦”
……,针对这样的问题,在这个版本的 Google(谷歌)工具条中,用户只需要单击搜索框中的“G”图标,就可 使用其它 Google(谷歌)搜索产品和那些您自己定义的搜索站点。

http://googlechinablog.com/uploaded_images/enhanced%20search%20box-734453.JPG" border=0>

http://googlechinablog.com/uploaded_images/enhanced%20search%20box2-710504.JPG" border=0>

Google(谷歌)的重中之重永远都是搜索,在这一个版本的 Google(谷歌)工具栏中,Google(谷歌)即有的搜索基础上,“增强型搜索框”为用户带来了一些方便的新功能,在您键入关键词时,它可以即时提示、更正拼写错误或并且帮助您列出以往相关的搜索历史纪录。

http://googlechinablog.com/uploaded_images/enhanced%20search%20box1-760146.JPG" border=0>

在下一篇中,我们还将为您介绍一些 Google(谷歌)工具栏为您提供的其它有用的小工具。



大厨查理






谈到 Google 的企业文化,不能不说说http://www.chefcharlieayers.com/" target=_blank>大厨查理。

1999 年 dot-com 的高峰期,当时还不起眼的 Google 上了新闻:公司不仅聘用了一位专职大厨,并且还给与这位大厨期权。这在当时是闻所未闻的事情。也许有人认为这是在 dot-com 高峰期时的一种吸引公众眼球的做法, 不过后来的事实证明这是一个很明智的抉择。

查理在公司工作了近六年。离开的时候,公司专门给查理举办了告别会。首席执行官 Eric 和公司的两位创始人 Larry 和 Sergey 都到场了。

Eric 先在致词中提到:“Google 的企业文化主要受三个人的影响:Larry, Sergey 和查理。”

轮到 Sergey 时,他说: “查理是咱们公司有史以来聘用的最棒的一位员工。”

刚说完这句话,Sergey 仿佛是意识到了什么,颇不好意思地看了 Eric 一眼,(原来,首席执行官 Eric也是两位创始人聘用来的。)连忙补充道:“当然,我的意思是……” Eric 和蔼地拍了拍 Sergey 的肩膀,微笑着说:“我明白你的意思。。。”

告别会结束时,大厅里的全体员工集体起立,掌声经久不息。不仅是查理,有些老员工的眼圈中也泛着泪光。那依依惜别的场景令人十分感动。

据说早期,查理能够叫出每一位员工的姓名。他像一个家长一样,亲手准备每一顿中饭和晚饭,照顾大家的饮食。我第一次见到这位大名鼎鼎的查理大厨时,查理已带领着一个数十人的厨师团队。虽然他已不可能记住每个员工的名字,大家依然能常在餐厅见到查理忙碌的身影.

查理对员工很和气,同时也很严厉。如果谁犯了错,不管他多么资深,学历、职位多么高,在查理面前人人平等,他该批评谁就批评谁。你若是不遵守秩序,或是用餐后不把碗碟放回规定地点,都会受到查理严厉的批评。因此,很多员工对查理都有些敬畏。我就认识这样一位工程师,他非常喜爱查理提供的甜点。有一次他已经拿了一块甜点,刚把手伸向第二块,就啪地一下被查理打了回去。为了保证每人一块,只有在有剩余时,才可以再拿。这以后好几天,这位工程师都有些怕见查理。查理在 Google 创立了专门给“快食族”的美食”(fine food for the fast crowd)。工程师和产品经理们每天在琢磨着怎么创造用户喜爱的新产品,查理和他的团队也每天变着花样给大家做各种各样可口的饭菜。可以说,Google 的“食堂”伙食,绝不亚于周围许多中高级饭店,一个月内饭菜的种类也不会重样。

查理选料上乘,总是尽量采用价格稍高,但无污染、无公害的绿色食品,让大家吃得健康、精致;同时也支持有益于环境的绿色农业。Google 总部周边的许多中小型绿色食品种植商也是依赖 Google 的大量采购,才得以在市场上盈利生存。 

遇到特殊节日,比如说,中国农历新年、Mardi Gras 狂欢节,查理和他的厨师们都会专门准备一顿有节日特色的盛宴。整个餐厅也被装饰成节日的样子,或是挂着中国的大红灯笼,或是摆放着狂欢节中特有的彩珠、面具,让大家享受节日的气氛。

查理曾经在一个摇滚乐队里任职,所以认识许多文艺圈里的人物。他还会时常请一些乐队来餐厅表演,大家可以一边就餐,一边欣赏现场音乐,其乐融融。

就这样,同事们每天聚在“查理餐厅”一起就餐,就像一个大家庭一样。查理不仅给大家带来了一日三餐的方便,更重要的是,这大大增进了员工们之间的平等交流。大厨查理也永远地给 Google 的企业文化留下了深深的烙印。

http://googlechinablog.com/uploaded_images/photo8b-701732.jpg" border=0>

http://googlechinablog.com/uploaded_images/Chef%20Charlie-776118.JPG" border=0>



数学之美 系列十五 繁与简 自然语言处理的几位精英






我在数学之美系列中一直强调的一个好方法就是简单。但是,事实上,自然语言处理中也有一些特例,比如有些学者将一个问题研究到极致,执著追求完善甚至可以说完美的程度。他们的工作对同行有很大的参考价值,因此我们在科研中很需要这样的学者。在自然语言处理方面新一代的顶级人物麦克尔 · 柯林斯 (http://www.google.cn/search?hl=zh-CN&newwindow=1&q=Michael+Collins&btnG=%E6%90%9C%E7%B4%A2&meta=" target=_blank>Michael Collins) 就是这样的人。


柯林斯:追求完美


柯林斯从师于自然语言处理大师马库斯 (Mitch Marcus)(我们以后还会多次提到马库斯),从宾夕法利亚大学获得博士学位,现任麻省理工学院 (MIT) 副教授(别看他是副教授,他的水平在当今自然语言处理领域是数一数二的),在作博士期间,柯林斯写了一个后来以他名字命名的自然语言文法分析器 (sentence parser),可以将书面语的每一句话准确地进行文法分析。文法分析是很多自然语言应用的基础。虽然柯林斯的师兄布莱尔 (Eric Brill) 和 Ratnaparkhi 以及师弟 Eisnar 都完成了相当不错的语言文法分析器,但是柯林斯却将它做到了极致,使它在相当长一段时间内成为世界上最好的文法分析器。柯林斯成功的关键在于将文法分析的每一个细节都研究得很仔细。柯林斯用的数学模型也很漂亮,整个工作可以用完美来形容。我曾因为研究的需要,找柯林斯要过他文法分析器的源程序,他很爽快地给了我。我试图将他的程序修改一下来满足我特定应用的要求,但后来发现,他的程序细节太多以至于很难进一步优化。http://scholar.google.com/scholar?q=Michael+Collins&ie=UTF-8&oe=UTF-8&hl=en&btnG=Search" target=_blank>柯林斯的博士论文堪称是自然语言处理领域的范文。它像一本优秀的小说,把所有事情的来龙去脉介绍的清清楚楚,对于任何有一点计算机和自然语言处理知识的人,都可以轻而易举地读懂他复杂的方法。

柯林斯毕业后,在 AT&T 实验室度过了三年快乐的时光。在那里柯林斯完成了许多世界一流的研究工作诸如隐含马尔科夫模型的区别性训练方法,卷积核在自然语言处理中的应用等等。三年后,AT&T 停止了自然语言处理方面的研究,柯林斯幸运地在 MIT 找到了教职。在 MIT 的短短几年间,柯林斯多次在国际会议上获得最佳论文奖。相比其他同行,这种成就是独一无二的。柯林斯的特点就是把事情做到极致。如果说有人喜欢“繁琐哲学”,柯林斯就是一个。


布莱尔:简单才美


在研究方法上,站在柯林斯对立面的典型是他的师兄艾里克 · 布莱尔 (http://www.cs.jhu.edu/%7Ebrill/" target=_blank>Eric Brill) 和雅让斯基,后者我们已经介绍过了,这里就不再重复。与柯林斯从工业界到学术界相反,布莱尔职业路径是从学术界走到工业界。与柯里斯的研究方法相反,布莱尔总是试图寻找简单得不能再简单的方法。布莱尔的成名作是基于变换规则的机器学习方法 (transformation rule based machine learning)。这个方法名称虽然很复杂,其实非常简单。我们以拼音转换字为例来说明它:

第一步,我们把每个拼音对应的汉字中最常见的找出来作为第一遍变换的结果,当然结果有不少错误。比如,“常识”可能被转换成“长识”;

第二步,可以说是“去伪存真”,我们用计算机根据上下文,列举所有的同音字替换的规则,比如,如果 chang 被标识成“长”,但是后面的汉字是“识”,则将“长”改成“常”;

第三步,应该就是“去粗取精”,将所有的规则用到事先标识好的语料中,挑出有用的,删掉无用的。然后重复二三步,直到找不到有用的为止。

布莱尔就靠这么简单的方法,在很多自然语言研究领域,得到了几乎最好的结果。由于他的方法再简单不过了,许许多多的人都跟着学。布莱尔可以算是我在美国的第一个业师,我们俩就用这么简单的方法作词性标注 (part of speech tagging),也就是把句子中的词标成名词动词,很多年内无人能超越。(最后超越我们的是后来加入 Google 的一名荷兰工程师,用的是同样的方法,但是做得细致很多)布莱尔离开学术界后去了微软研究院。在那里的第一年,他一人一年完成的工作比组里其他所有人许多年做的工作的总和还多。后来,布莱尔又加入了一个新的组,依然是高产科学家。据说,他的工作真正被微软重视要感谢 Google,因为有了 Google,微软才对他从人力物力上给于了巨大的支持,使得布莱尔成为微软搜索研究的领军人物之一。在研究方面,布莱尔有时不一定能马上找到应该怎么做,但是能马上否定掉一种不可能的方案。这和他追求简单的研究方法有关,他能在短时间内大致摸清每种方法的好坏。

由于布莱尔总是找简单有效的方法,而又从不隐瞒自己的方法,所以他总是很容易被包括作者我自己在内的很多人赶上和超过。好在布莱尔很喜欢别人追赶他,因为,当人们在一个研究方向超过他时,他已经调转船头驶向它方了。一次,艾里克对我说,有一件事我永远追不上他,那就是他比我先有了第二个孩子 :)

在接下来了系列里,我们还会介绍一个繁与简结合的例子。



没有最高的山峰 — Google 全球编程挑战赛报名开始






http://www.google.com/codejam2006" target=_blank>http://googlechinablog.com/uploaded_images/codejamlogo-759643.GIF" border=0>

第四届 Google(谷歌)全球编程挑战赛(Google Code Jam)已于 8 月 15 日正式开锣,与年初在国内举行的 Google(谷歌)中国区编程挑战赛不同,此次比赛面向全球开放、全球所有感兴趣程序员均可报名参加。

《没有最高峰》(Ain’t No Mountain High Enough),一首我们 Googler 很喜爱的歌,每当音乐响起,都有一种要奔跑、想跳跃的激动。我们希望,Google(谷歌)编程挑战赛也能为所有参与者带去同样充满热情、兴味盎然、孜孜 以求的激动。

现在,报名已经开始,北京时间 9 月 6 日,注册通道就会关闭。与此同时,第一回合资格赛将拉开帷幕,10 月 28 日全球进入前 100 名的选手会在 Google(谷歌)的全程赞助下聚集纽约分部展开终极PK。

此次 Google(谷歌)全球编程挑战赛的奖品非常丰厚,除全程赞助 100 名选手参加决赛外,冠军将获得 10,000 美元奖金,而所有进入决赛的选手最少也会获得 750 美元奖金。

Google(谷歌)全球编程挑战赛 2003 年首次举办,四年来,全球平台和独特的互动式 PK 赛制使它迅速成为全球编程员最热衷参与的世界级编程大赛之一,几年来,参赛选手数量成倍增长。

http://googlechinablog.com/uploaded_images/firm1-711009.JPG" border=0>










近年来,中国选手在这一国际赛事中的技术水平和比赛成绩也不断提高。

http://googlechinablog.com/uploaded_images/firm2-706774.JPG" border=0>









想与世界上最优秀的程序员一决高下吗?登录 http://www.google.com/codejam2006" target=_blank>www.google.com/codejam2006

看看今年年初 Google(谷歌)中国区编程挑战赛的花絮:

http://googlechinablog.com/uploaded_images/200601200265-769283.jpg" target=_blank>http://googlechinablog.com/uploaded_images/200601200265-767009.jpg" border=0> http://googlechinablog.com/uploaded_images/200601200034-720600.jpg" target=_blank>http://googlechinablog.com/uploaded_images/200601200034-716448.jpg" border=0> http://googlechinablog.com/uploaded_images/PH200601210070-725270.jpg" target=_blank>http://googlechinablog.com/uploaded_images/PH200601210070-723569.jpg" border=0> http://googlechinablog.com/uploaded_images/PH200601210008-796314.jpg" target=_blank>http://googlechinablog.com/uploaded_images/PH200601210008-795190.jpg" border=0>







Copyright 2006 Google Inc. All rights reserved.
Privacy">http://www.google.com/privacy.html">Privacy Policy - Terms">http://www.google.com/terms_of_service.html">Terms of Service
 

 


 






[ 打印 ]
[ 编辑 ]
[ 删除 ]
阅读 ()评论 (0)
评论
目前还没有任何评论
登录后才可评论.