閱讀746 返回首頁    go 支付寶


百度數據挖掘工程師實習生筆試麵試題

筆試題:
一、簡答題30分
1. extern”C”{}的作用好應用場景;
2.寫出兩者你熟悉的設計模式,及應用場景,可以給出偽代碼;
3.TCP中time_wait是表示那種狀態,及應用場景,以及起好處和壞處;

二、算法題40分
1. 有一個任務執行機,任務數N<1000,該機器每次隻能執行一個任務,而任務之間存在依賴關係,
但是任務之間沒有循環依賴,請給出適當的任務執行順序。算法、偽代碼,並分析其時間複雜度和
空間複雜度。

2. 編寫函數,統計在某段英文文本中完整句子的數目,文本中隻包括大小寫字母,空格,點好(.),逗號(,)。
完整的句子必須包含至少一個字母並以點號,結束。
要求:完整的代碼,達到目標;高效;簡潔;

三、係統架構30分
有一個監控係統,有大量的數據記錄包括{url,用戶訪問ip,時間},要對這個監控係統進行維護,並提供查詢。
設計一個能存儲和維護1000億條記錄,實時監控,並支持一下兩種查詢:
1. 指定任意一個時間段(精確到分鍾)和某個url,查處這個時間段內的所有url的訪問總量。
2. 指定任意一個時間段(精確到分鍾)和某個ip,查詢這個時間段內的ip訪問總量。

麵試一
1.自我介紹;結合自己的簡曆簡單地介紹一下。
2.項目介紹;結合自己做主要的項目,以及帶的項目介紹資料,互動式地講解;麵試官關係的是機器學習相關的問題。
3.算法題;二叉樹的非遞歸實現前序遍曆;
4. 算法設計題;如何去掉重複頁麵;

麵試二
1. 自我介紹;(同上)
2. 項目介紹;(同上)
3. 算法題;(略)問到了一個TTest;
4. 算法設計題;如何對Query進行分類;

麵試三
1. 自我介紹;
2. 項目介紹;
3. 算法題兩道;
1>一串首尾相連的珠子(m個),有N種顏色(N《=10),設計一個算法,取出其中一段,要求包含所有N中顏色,並使長度最短。並分析時間複雜度與空間複雜度。
2>從1到1億,所有出現的數字的和(125=1+2+5),手工計算機出來;

我的感受:
1. 是對這次實習招聘,並無準備,筆試能通過已經很意外了;
2. 自己的算法題的解答能力有待提高,麵試的時候遇到的題目其實都很常見,估計在網上多看看就都能答得很好了;
3. 百度筆試+三麵的流程,大致和網上講的差不多,前二次麵試是類似的,三麵可能是補充,並且往往會問道一些你職業規劃上的一些問題;



最後更新:2017-04-03 12:54:03

  上一篇:go android軟件開發之webView.addJavascriptInterface循環漸進【一】
  下一篇:go hadoop MapReduce示例