麵試技巧,如何通過索引說數據庫優化能力
索引是數據庫優化所必需的工具,在麵試的時候一般不會問概念性的問題,會問什麼問題又如何回答呢?請看下文。
如果我們需要招個Java方麵的高級程序員,一方麵看年限(本科3年),具體到數據庫方麵的技能要求,包括如下三個方麵:
第一,是否會基本的增刪改查,存儲過程等技能,是否會用些groupby,having,distinct,exist,in,with等高級點的語句。這點一般都沒問題,甚至一個剛畢業的大學生或工作經驗2年之內的初級程序員也沒問題,也就是說,這個是高級程序員必備的,你會了是應該,不會甚至不及畢業生。
第二,有沒有設計表的經驗,這方麵的麵試技能也已經在數據庫方麵的麵試技巧,如何從建表方麵展示自己能力裏說了,關鍵一點,你得結合實際需求來說。
第三也是關鍵一點,在數據庫優化方麵,你是否有相關經驗。
這是個開放性的問題,大神們知道,可以從分區,根據執行計劃優化等很多方麵來考慮,對高級程序員,我的期望是你至少能說點索引相關的。但根據我的麵試經驗,很少有候選人(特別是高級程序員候選人)能比較深入地敘述。
開場白說了不少,下麵進入正文。
索引是數據庫優化所必需的工具,在麵試的時候一般不會問概念性的問題,因為大家都能從教科書上找到答案,所以一般會問以下兩方麵的問題:
①索引有什麼代價?哪些場景下你需要建索引?或者有時候反過來問,哪些場景下不推薦建索引。
②建好索引之後,怎麼才能最高效地利用索引?或者反過來問,請說出一個無法有效利用已建索引的案例。
從結構上來看,索引好比是一棵B樹(也叫B*或者B+),假設學生表裏隻有學生ID和姓名兩列,該學生表裏有1000個學生,學號分別從1到1000,如果針對ID建立索引,大致的結構如下圖所示。
當然,在實際的數據庫係統中,索引要比這個複雜得多,但從這個圖裏,我們能大致看出索引的工作原理。
索引建好後,如果我們要查找ID為111的學生,則數據庫係統就會走索引,從圖2.1中我們可以看到,根據根節點的指引,會找到第二層從左往右第二個數據塊,以此類推,會在第四層裏得到ID為111的物理地址,然後直接從硬盤裏找數據。
反過來,如果沒有建索引,數據庫係統可能就要從一個大的範圍裏逐一定位查找,效率就沒這麼高了。
索引的好處大家已經看到了,那麼為了得到這個“查詢效率高”的好處,我們要付出了什麼樣的代價呢?
1索引需要占硬盤空間,這是空間方麵的代價。
2一旦插入新的數據,就需要重新建索引,這是時間上的代價。
關於索引性能問題,我會細問,你建索引的表規模多少?不少人直接告訴我表就幾千條,我或者問,索引有什麼代價?不少回答是索引是隻有好處沒壞處的,也就是說,可以隨便建。
對此我們來詳細分析下(也就是大家在麵試時需要說的):
場景一,數據表規模不大,就幾千行,即使不建索引,查詢語句的返回時間也不長,這時建索引的意義就不大。當然,若就幾千行,索引所占的空間也不多,所以這種情況下,頂多屬於“性價比”不高。
場景二,某個商品表裏有幾百萬條商品信息,同時每天會在一個時間點,往其中更新大概十萬條左右的商品信息,現在用where語句查詢特定商品時(比如wherename=‘XXX’)速度很慢。為了提升查詢效率可以建索引,但當每天更新數據時,又會重建索引,這是要耗費時間的。這時就需要綜合考慮,甚至可以在更新前刪除索引,更新後再重建。
場景三,從上圖中可以看到,因為在數據表裏ID值都不相同,所以索引能發揮出比較大的作用。相反,如果某個字段重複率很高,如性別字段,或者某個字段大多數值是空(null),那麼不建議對該字段建索引。
請大家記住,一定是有業務需求了才會建索引。比如在一個商品表裏,我們經常要根據name做查詢,如果沒有索引,查詢速度會很慢,這時就需要建索引。但在項目開發中,如果不經常根據商品編號查詢,那麼就沒必要對編號建索引。
最後再強調一次,建索引是要付出代價的,沒事別亂建著玩,同時在一個表上也不能建太多的索引。
下麵說下索引建好了該怎麼用?畢竟大家花了不少時間和空間代價建了索引,至少得回本吧?
如果出現一些不好的SQL語句,那麼索引就白建了。下麵通過一些具體的例子來看索引的正確用法。
①語句一:selectnamefrom商品表。不會用到索引,因為沒有where語句。
②語句二:select*from商品表wherename=‘Java書’,會用到索引,如果項目裏經常用到name來查詢,且商品表的數據量很大,而name值的重複率又不高,那麼建議建索引。
③語句三:select*from商品表wherenamelike‘Java%’這是個模煳查詢,會用到索引,請大家記住,用like進行模煳查詢時,如果第一個就是模煳的匹配符,比如wherenamelike‘%java’,那麼在查詢時不會走索引。在其他情況下,不論用了多少個%,也不論%的位置,隻要不出現在第一個位置,那麼都能用到索引。
學生成績表裏有兩個字段:姓名和成績。現在對成績這個整數類型的字段建索引。
①第一種情況,當數字型字段遇到非等值操作符時,無法用到索引。比如:
selectnamefrom學生成績表where成績>95,一旦出現大於符號,就不能用到索引,為了用到索引,我們應該改一下SQL語句裏的where從句:where成績in(96,97,98,99,100)
②第二種情況,如果對索引字段進行了某種左值操作,那麼無法用到索引。
能用到索引的寫法:selectnamefrom學生成績表where成績=60
不能用到索引的寫法:selectnamefrom學生成績表where成績+40=100
③第三種情況,如果對索引字段進行了函數操作,那麼無法用到索引。
比如SQL語句:select*from商品表wheresubstr(name)=‘J’,我們希望查詢商品名首字母是J的記錄,可一旦針對name使用函數,即使name字段上有索引,也無法用到。
關於索引,當然還有位圖索引和複合索引等,如果大家要應聘更高級的崗位(比如有5年經驗了),那麼就不能止步於此了,但根據我的麵試經驗,上述關於索引的說辭對工作經驗3年以下的候選人是有幫助的。
其實我知道,不少程序員平時用過索引,但不知道怎麼說,這很吃虧。對於高級程序員而言,如果你這都說不好,那麼你的能力比初級的要高多少?對於初級程序員而言,如果你掌握了,而且能在麵試中很好地說,那麼你和同等能力的人相比,就很占優勢。
本文選自《Java Web輕量級開發麵試教程》,點此鏈接可在博文視點官網查看此書。
想及時獲得更多精彩文章,可在微信中搜索“博文視點”或者掃描下方二維碼並關注。
最後更新:2017-09-22 11:33:09