閱讀373 返回首頁    go 阿裏雲 go 技術社區[雲棲]


【雲和恩墨大講堂電子期刊】挑戰者:Google成功的背後

致親愛的讀者:

在商業競爭中,進攻常常也是最好的防守。Google從小到大一直貫徹這個原則。Google在規模很小的時候,受到很多比自己大的公司的圍攻,死守是沒有出路的。因此它把自己放在一個挑戰者的位置,不斷挑戰對手,也挑戰自己。在商業競爭中,Google常常是兩眼盯著前方向前衝,而不左顧右盼它的對手。

這段話摘自《浪潮之巔》,也是我認為對於Google成功的背後最好的闡釋。Google公司從一開始就以挑戰者的身份出現在人們的視野中,它不僅在技術和商業上挑戰比自己更大更強的公司,而且在理念上挑戰傳統。它的成功在於

它並不應對競爭,而是在引領行業的發展。


最近我們分享了很多關於Google的案例,通過這些案例我們看到一個成功的企業自信從容的姿態,也看到了作為挑戰者的它強大的靈魂。


我相信很多人看到也感知著Google的成功。成功的因素有很多,也許有英雄逢時的緣故,有浪潮的推動,但我一直相信,沒有任何人和企業的成功是偶然的,如果有不確定的因素會存在,我想那便是越努力越幸運。


Google所擁有的成功,在表麵上是各種英明的商業決策和智慧的l領導者的綜合因素,事實上,遠遠不隻是這樣。接下來我們將結合Google運維的核心思想剖析Google背後成功的原因。


一、安全意識與防範

一切都有可能而且將會發生故障。Google在這一點上,絕對不是說說而已。

願望不是一個策略”,這是Google  SRE 的口號,很好地總結了他們對災難預案與演習的態度。SRE 的文化是永遠保持警惕,不停地提出疑問:什麼可能出現故障?在故障導致服務停止或者數據丟失之前我們如何避免?


這樣的安全意識在行動上最主要的表現是:

1、細節的設計與關注:

Jeff Stevenson回憶起在美國海軍的任職經曆,所有人對某些小任務執行過程中出現的粗心情況可能會導致大型潛艇事故的情況非常了解(例如,潤滑油的及時補充)。

非常小的一個錯誤都可能產生極為嚴重的後果。


係統相互連接緊密,所以一個區域的事故可能會導致多個相關係統出現故障。核動力海軍對日常常規維護非常重視,以確保小問題不 會發展成大事故。


在我們多年的運維經驗上,我們也意識到很多重大的問題或是故障往往來源於細節的設計不合理或是對看似無關緊要的小問題的疏忽。在eygle寫的防範攻擊 加強管控 - 數據庫安全的16條軍規一文中提出了很多在運維中藥時刻謹記的事項,事實上這些問題可能是眾所周知的,但常常得不到DBA們的重視。


2、災難的預案與演習

Google 的災難恢複團隊在模擬與線上災難演習方麵與其他行業的關注點非常類似。

利用某種災難情景可能導致的故障的嚴重程度來決定是使用模擬方式,還是線上方式進行演習。

這些情景會製造得非常逼真,救生員一般無法區分真實和虛構的緊急事故。


我們經常強調,備份重於一切。而在今年年初發生了很多事故,除了少數的沒有備份之外,大部分都是有做備份的,大家可能還記得GitLab五重備份無一有效的事件,這聽起來不大真實,但我這樣的事情並不是絕無僅有,事實上很多企業認為隻要做了備份,似乎就萬無一失了,很少有人做有下行校驗,更談不上針對可能會發生的故障做預案演習。參考:講真,你該做備份有效性的校驗了


二、自動化運維及工作負載的管理

Google SRE本質上還是軟件工程師,他們對重複性的、被動性的工作十分反感。在他們的文化中強調避免反複執行一項重複性的工作。


事實上自動化和智能化運維是當下不可避免的趨勢。隻有將DBA和係統運維者從繁冗重複的工作中解救出來,才能在更有價值的事情上發揮價值。


在過去幾十年的運維發展的曆程中,有很多有經驗的老運維,他們就像是運維工作中的數據庫,熟悉大部分的故障場景和處理方案,但新運維仍要不斷重複地去摸索,這就是資源的浪費。通過自動化運維工具的實現,能夠將前人的經驗凝聚起來,不僅有利於工作更好的完成,對於新人來說,他們則能夠站在前人的肩膀上做更創新和向前的事情。


雲和恩墨推出的白求恩智能診斷平台、Z3SQL審核工具、ZONE數據庫性能監控及分析工具,都是通過將專家的智慧和經驗凝聚成產品,讓運維工作更輕鬆。


三、事後總結與優化

大家可能還記得Google在一次誤操作中刪除了1.5PB的數據的事件,影響到幾乎2.1萬的用戶。當故障發生以後,外界都在揣測,這個鍋將由誰來背。而Google Music團隊則是重新設計了該流水線任務,徹底消除了這種數據競爭問題出現的可能性。


對待故障對事不對人,解決方案比問責更重要。這也是Google不斷前進的重要原因之一。


Google的嚴謹、睿智、英明和果斷,體現在每一個方麵。如果成功可以複製,你做到這些了嗎?


引領而非應對競爭,這才是麵對競爭最好的姿態。


文章轉自數據和雲公眾號,原文鏈接

最後更新:2017-07-18 20:36:05

  上一篇:go  智慧醫療設備將是緩解心理健康的一大幫手
  下一篇:go  深入剖析 ORA-04031 的前世今生