正文

日進斗金秘訣在哪?(5)

Google真相 作者:熊江


Google有多可怕呢?有人因Google丟掉工作,有人丟掉女朋友,有的丟掉業(yè)務。25歲外表美麗的李小姐,在一家房產(chǎn)中介工作,卻莫名其妙被公司炒掉了。原來公司有人用Google搜了下她過去的工作經(jīng)歷。她曾經(jīng)被懷疑勾結(jié)房蟲炒房,給前公司聲譽造成巨大的損失。還有人突然與女友突然提出分手,因為她的新男友Google她,發(fā)現(xiàn)了一張疑似她本人的不雅照片。還有的公司莫名其妙地丟掉了業(yè)務,原來有人在一些BBS大肆說這家公司的壞話,說這家公司產(chǎn)品質(zhì)量低劣,售后服務太差。用Google搜這家公司,到處都是這些負面的信息。

有人覺得奇怪,Google是怎么得到這些信息的?Google具有強大抓取網(wǎng)頁的能力。抓取網(wǎng)頁的軟件叫爬蟲(Crawler),Google的爬蟲叫Googlebot,威力極其可怕。這個爬蟲非常勤奮,會定期訪問各種網(wǎng)站,不分晝夜地把網(wǎng)站網(wǎng)頁下載到自己的服務器里。

假如下載一個網(wǎng)頁需要一秒鐘,下載這 100 億個網(wǎng)頁則需要 317 年,1萬億個就要31700年。Google能做完這個事情,全是依靠功能強大的數(shù)據(jù)中心。

Google最初的數(shù)據(jù)中心在佩恩的宿舍與蓋茨360樓。Google的第一個正式數(shù)據(jù)中心坐落在這個56平方米(7米X8米)的房間里?,F(xiàn)在Google擁有世界最大的數(shù)據(jù)中心,Google已經(jīng)成功地構(gòu)建起全球最大的網(wǎng)絡計算機Googleplex。在全球范圍,Google擁有40個數(shù)據(jù)中心。每個數(shù)據(jù)中心有150個服務器集群,這意味著Google擁有的服務器數(shù)量超過數(shù)十萬萬臺,而且每天都在增長。Google服務器 集群的規(guī)模有多大?僅在一臺坐落在美國哥倫比亞河畔的服務器總共擁有8180個機架,而每個機架擁有40塊Intel雙核處理器。8180*80=654400!擁有超過130萬顆核的計算能力。

Google目前的全球數(shù)據(jù)中心,19個在美國,12個在歐洲,3個在亞洲(北京、香港、東京),另外3個分布于俄羅斯和南美,在臺灣、馬來西亞、立陶宛等地也有數(shù)據(jù)中心。

亞洲數(shù)據(jù)中心分布圖(圖略)

在亞洲,北京、香港及日本東京有Google數(shù)據(jù)中心,位于北京的數(shù)據(jù)中心(即圖中的36號)主要為Google中國()提供服務。

數(shù)據(jù)中心最密集的是北美。

Google的數(shù)據(jù)中心主要使用自己的技術(shù)。 Google的服務器是Google自己設計的,在同樣大的空間內(nèi),Google的服務器比其他服務器廠商能容納更多的CPU;如果按照服務器的年產(chǎn)量來計算,Google在服務器市場應該排得比較靠前。Google服務器使用的是Linux操作系統(tǒng)。Google的工程師按照平行計算的要求對Linux進行了優(yōu)化。Google開發(fā)自有核心軟件,開發(fā)語言是Java和C :Google文件系統(tǒng)(GFS);Google大表(Bigtable:是Google一種對于半結(jié)構(gòu)化數(shù)據(jù)進行分布存儲與訪問的接口或服務);Mapreduce算法(它是Google開發(fā)的C 編程工具,用于大于1TB數(shù)據(jù)的大規(guī)模數(shù)據(jù)集并行運算)。構(gòu)成了Google系統(tǒng)的核心。


上一章目錄下一章

Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號