(一)
以下這些百度筆試題目由YJBYS整理介紹
1.英文題目的連線題,N個排成方隊的圈,圈里有數字,外面有突起,請你按數字要求連線,要求:將這些圈連成整體,每個圈可外接線的數目要與圈里數字一致,且線不能相交
2.如果你盯著一張紅色的海報,然后再看白色的墻,那么你看到的墻的外圍是神馬顏色的~(那時,我多么希望這教室里剛好掛著一面國旗~)
選項有:綠色,紅色,紫色,藍色
3.圖形題~
4.有四個箱子,里面分別是 金,銀,銅,鐵,有100個人來猜,這四個箱子里分別是什么,有23個人猜對了0個,58個人猜對了1個,14個人猜對了2個,
求!有幾個人猜對了3個,幾個人猜對了4個(誰會做。∥揖蚈rz)
5.人照鏡子的時候,會覺得左右是相反的,但上下不是相反的,你動左手,就覺得鏡子里是右手在動,你動上牙齒,還是看見上牙齒在動,這是什么原因?寫出你的理解
6.有一種質地不均勻的繩子,燒完整根剛好是一個小時,假設有無數根這樣的繩子,那么怎樣可以用燒繩子的方法計算出正好1個小時15分鐘~(出考場后,經一中科院的牛人點撥,才大徹大悟!只可惜,俺當時沒想出來啊~先不告你,你自己看,一會兒再上答案)
7.三個看不見里面的箱子,一個上面寫著“蘋果”一個寫著“橘子”,一個寫著“蘋果&橘子”,已知這三個標簽都錯誤,現在請你挑一個箱子拿出一個水果,你能說出這三個箱子里分別是什么么?寫出步驟~
(二)以下是參加考試的人的經驗之談
1 編程:
用C語言實現一個revert函數,它的功能是將輸入的字符串在原串上倒序后返回。
2 編程:
用C語言實現函數void * memmove(void *dest,const void *src,size_t n)。memmove函數的功能是拷貝src所指的內存內容前n個字節到dest所指的地址上。
3 英文拼寫糾錯:
在用戶輸入英文單詞時,經常發生錯誤,我們需要對其進行糾錯。假設已經有一個包含了正確英文單詞的詞典,請你設計一個拼寫糾錯的程序。
(1)請描述你解決這個問題的思路;
(2)請給出主要的處理流程,算法,以及算法的復雜度;
(3)請描述可能的改進(改進的方向如效果,性能等等,這是一個開放問題)。
4 尋找熱門查詢:
搜索引擎會通過日志文件把用戶每次檢索使用的所有檢索串都記錄下來,每個查詢串的長度為1-255字節。假設目前有一千萬個記錄,這些查詢串的重復度比較高,雖然總數是1千萬,但如果除去重復后,不超過3百萬個。一個查詢串的重復度越高,說明查詢它的用戶越多,也就是越熱門。請你統計最熱門的10個查詢串,要求使用的內存不能超過1G。
(1)請描述你解決這個問題的思路;
(2)請給出主要的處理流程,算法,以及算法的復雜度。
5 集合合并:
給定一個字符串的集合,格式如: {aaa bbb ccc}, {bbb ddd},{eee fff},{ggg},{ddd hhh} 要求將其中交集不為空的集合合并,要求合并完成后的集合之間無交集,例如上例應輸出 {aaa bbb ccc ddd hhh},{eee fff}, {ggg}
(1)請描述你解決這個問題的思路;
(2)請給出主要的處理流程,算法,以及算法的復雜度
(3)請描述可能的改進(改進的方向如效果,性能等等,這是一個開放問題)。
////////////////////////////////
1 題
char *revert(char * str)
{
int n=strlen(str);
int i=0;
char c;
for(i=0;i {
c=str;
str=str[n-i];
str[n-i]=c;
}
return str;
}
///////////////////////////////////
2 題
void * memmove(void *dest,const void *src,size_t n)
{
assert((dest!=0)&&(src!=0));
char * temp=(char * )dest;
char * ss=(char * )src;
int i=0;
for(;i {
*temp =*ss ;
}
return temp;
}
/////////////////////////////////////////////////
3 題
(1)思路: 字典以字母鍵樹組織,在用戶輸入同時匹配
(2) 流程:
每輸入一個字母:
沿字典樹向下一層,
a)若可以順利下行,則繼續至結束,給出結果;
b)若該處不能匹配,糾錯處理,給出拼寫建議,繼續至a);
算法:
1.在字典中查找單詞
字典采用27叉樹組織,每個節點對應一個字母,查找就是一個字母
一個字母匹配.算法時間就是單詞的長度k.
2.糾錯算法
情況:當輸入的最后一個字母不能匹配時就提示出錯,簡化出錯處理,動態提示可能 處理方法:
(a)當前字母前缺少了一個字母:搜索樹上兩層到當前的匹配作為建議;
(b)當前字母拼寫錯誤:當前字母的鍵盤相鄰作為提示;(只是簡單的描述,可 以有更多的)
根據分析字典特征和用戶單詞已輸入部分選擇(a),(b)處理
復雜性分析:影響算法的效率主要是字典的實現與糾錯處理
(a)字典的實現已有成熟的算法,改進不大,也不會成為瓶頸;
(b)糾錯策略要簡單有效 ,如前述情況,是線性復雜度;
(3)改進
策略選擇最是重要,可以采用統計學習的方法改進。
//////////////////////////////////////////////
4 題
(1)思路:用哈希做
(2) 首先逐次讀入查詢串,算哈希值,保存在內存數組中,同時統計頻度(注意值與日志項對應關系) my.chinahrlab.com 選出前十的頻度,取出對應的日志串,簡單不過了。哈希的設計是關鍵。
//////////////////////////////////////////////////
5 題
(1)思路:先將集合按照大小排列后,優先考慮小的集合是否與大的集合有交集。有就合并,如果小集合與所有其他集合都沒有交集,則獨立。獨立的集合在下一輪的比較中不用考慮。這樣就可以盡量減少字符串的比較次數。當所有集合都獨立的時候,就終止。
(2)處理流程:
1.將集合按照大小排序,組成集合合并待處理列表
2.選擇最小的集合,找出與之有交集的集合,如果有,合并之;如果無,則與其它集合是獨立集合,從待處理列表 中刪除。
3.重復直到待處理列表為空
算法: 1。將集合按照大小從小到大排序,組成待處理的集合列表。 2。取出待處理集合列表中最小的集合,對于集合的每個元素,依次在其他集合中搜索是否有此元素存在:
1>若存在,則將此小集合與大集合合并,并根據大小插入對應的位置 。轉3。
2>若不存在,則在該集合中取下一個元素。如果無下一個元素,即所有元素都不存在于其他集合。則表明此集合獨立,從待處理集合列表中刪除。并加入結果集合列表。轉3。
3。如果待處理集合列表不為空,轉2。
如果待處理集合列表為空,成功退出,則結果集合列表就是最終的輸出。
算法復雜度分析:
假設集合的個數為n,最大的集合元素為m 排序的時間復雜度可以達到n*log(n) 然后對于元素在其他集合中查找,最壞情況下為(n-1)*m 查找一個集合是否與其他集合有交集的最壞情況是m*m*(n-1) 合并的時間復雜度不會超過查找集合有交集的最壞情況。所以最終最壞時間復雜度為O(m*m*n*n)
需要說明的是:此算法的平均時間復雜度會很低,因為無論是查找還是合并,都是處于最壞情況的概率很小,而且排序后優先用最小集合作為判斷是否獨立的對象,優先與最大的集合進行比較,這些都最大的回避了最壞情況。
(3)可能的改進:
首先可以實現將每個集合里面的字符串按照字典序進行排列,這樣就可以將查找以及合并的效率增高。另外,可能采取恰當的數據結構也可以將查找以及合并等操作的效率得到提高。
、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、
1)此題10分
對任意輸入的正整數N,編寫C程序求N!的尾部連續0的個數,并指出計算復雜度。如:18!=6402373705728000,尾部連續0的個數是3。 。ú挥每紤]數值超出計算機整數界限的問題)
2)此題10分 編寫一個C語言函數,要求輸入一個url,輸出該url是首頁、目錄頁或者其他url
如下形式叫做首頁:
militia.info/
www.apcnc.com.cn/
https://www.cyjzs.comwww.greena888.com/
www.800cool.net/
https://hgh-products.my-age.net/
如下形式叫做目錄頁:
thursdaythree.net/greenhouses--gas-global-green-house-warming/
https://www.mw.net.tw/user/tgk5ar1r/profile/
https://www.szeasy.com/food/yszt/chunjie/
www.fuckingjapanese.com/Reality/
請注意:
a) url有可能帶http頭也有可能不帶
b)動態url(即含有"?"的url)的一律不算目錄頁,如:
www.buddhismcity.net/utility/mailit.php?l=/activity/details/3135/
www.buddhismcity.net/utility/mailit.php?l=/activity/details/2449/
另:如果你會linux,請用linux下的grep命令實現第2題的功能(附加5分)。
3)此題40分
如果必須從網頁中區分出一部分"重要網頁"(例如在10億中選8億),比其他網頁更值得展現給用戶,請提出一種方案。
4)此題40分
假設有10億網頁已經被我們存下來,并提供如下信息:網頁全文(即網頁的源碼)、全文長度、網頁正文(即網頁中提取的主體文字)、正文長度,以及其他網頁提取物等,現在希望去掉其中的重復網頁,請提出可行的方案,計算出每個網頁對應的重復度,你可以自己對網頁重復下定義,也可以提出需要哪些更多的網頁提取物來實現更好的去重復方案。
、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、
好久沒來了。
發生了一些事情,其間的心情已不是幾行文字所能表述的了。
終于明白有些事情,并不是自己努力就一定能圓滿的;有些事情,是我控制不了的。
唉,不提也罷!
說說今天去百度筆試的經歷吧
部門:百度搜索應用技術部。
地點:海淀南路銀科大廈(海淀圖書城西臨)18層。
時間:2005/6/15 10:00-11:20 am
九點從實驗室出發,725到知春路,轉735,到海淀橋下車,9:50到達百度。在725的車上碰到一男士索要手機號,說自己認識信息產業部的部長楊澤民先生,以居高臨下的姿態把手機號給了他-__-!
在百度前臺見到了一直幫我安排筆試的楊韞敏jj,不是想象中的HR形象,而是一副干練的女IT的樣子跳躍的靈魂很快,給我找了一間小會議室,只有一張桌子,兩把椅子,還幫我開了燈,關門,走人,我開始看題。冷汗也開始流。翻了一下三頁紙的筆試題,只有很少的傳說中的Linux題目,其他的全是C、數據結構、算法編程的題。第一反應:走人!但又覺得對不起陳jj,關鍵的是我已經在筆試題上寫了姓名和學校了,sign,總的為自己的名字和學校負責吧,他們是無辜的。如此斗爭良久,決定堅持下來。
題目大致是這樣的:
第一部分選擇題:有幾道網絡相關的題目,巨簡單,比如第一題是TCP、RIP、IP、FTP中哪個協議是傳輸層的......。有一道linux的chown使用題目。其他的全是數據結構的題目!什么鏈,表,碼的,不知所云跳躍的靈魂唉,我可以沒有學過數據結構的人吶!真殘忍!這一部分迅速猜完!
第二部分簡答題:
1、在linux中如何編譯C程序,使之成為可執行文件?如何調試?
答案:
1)檢查程序中.h文件所在的目錄,將其加入系統PATH中;
2)執行C編譯:#gcc [源文件名] -o [目標文件名]
執行C++編譯:#g++ [源文件名] -o [目標文件名]
3)改變目標文件為可執行文件:#chmod +x [目標文件名]
4)如需將多個可執行文件連續執行,可生成批處理文件:
#vi [批處理文件名]
可執行文件1
可執行文件2
.........
最后將該批處理文件屬性該位可執行。
調試:在編譯時使用-g參數,就可以使用gdb進行調試。
2、寫出內存分配和釋放的函數,并指出區別。
答案:
C語言的標準內存分配函數:malloc,calloc,realloc,free等。
malloc與calloc的區別為1塊與n塊的區別:
malloc調用形式為(類型*)malloc(size):在內存的動態存儲區中分配一塊長度為“size”字節的連續區域,返回該區域的首地址。
calloc調用形式為(類型*)calloc(n,size):在內存的動態存儲區中分配n塊長度為“size”字節的連續區域,返回首地址。
realloc調用形式為(類型*)realloc(*ptr,size):將ptr內存大小增大到size。
free的調用形式為free(void*ptr):釋放ptr所指向的一塊內存空間。
C++中為new/delete函數。
3、寫出socket函數,并指出其功能。
socket():建立socket通信描述符;
bind():將套接字和機器上的一定的端口關聯;
connect():連接到遠程主機;
listen():使套接字做好連接的準備,規定等待服務請求隊列的長度;
accept():接受連接,一旦有客戶端發出連接,accept返回客戶地址信息和一個新的sock;
有了這個新的sock,雙方就可以開始收發數據:
send()和recv():用于流式套接字或者數據套接字的通訊;
sendto()和recvfrom():用于無連接的數據報套接字;
close():關閉套接字;
shutdown():選擇性的關閉套接字,可以只允許某一方向的通訊關閉;
getpeername():返回流式套接字時對端peer信息;
gethostname():返回程序所運行的機器的主機名字;
gethostbyname():返回本機IP;
第三部分編程題:
1、從文件中讀取字符串數據,反序顯示并大小寫轉換。
2、給定26字母表以及對應的密碼表,編程實現加密及解密功能。
第四部分思考題(正是傳說中的字典糾錯題):
用戶在輸入英文單詞時經常出錯,現對其進行就錯。給定一個正確的英文詞典,考慮糾錯實現。1)指出思路。2)流程、算法難易程度及可能的改進策略。
不過陳jj沒有給我答題紙,只好拿試題的背面做了答題紙兼草稿紙-___-!說實話有些題目是很基礎的,就是沒背過。不知怎么搞得,巨潦草。實驗室參加過筆試的通同學都是憋著勁做了兩個多小時才答完,而我只一個小時就完了,唉,正好說明肚子里只有別人一半的東西~~看著潦草而不著邊際的答題,決定在最后給陳jj寫段話,大意就是感謝她幫我挽回了一次筆試的機會,但我的表現很遺憾等等......然后交卷走人~~
沒想到交了試卷沒讓我走,等了大約30分鐘的樣子,有個很深沉的gg來看我的卷子跳躍的靈魂-___-!我顫顫的跟他說我很長時間沒有接觸C了,當時脖子都紅了,真覺得丟人。gg看了一下,沒有很鄙視的樣子,問我有沒有帶簡歷。當然木有啦~~答應回來給他發個電子版的,然后趕緊跑人了!
題目大致是這樣的:
第一部分選擇題:
有幾道網絡相關的題目,巨簡單,比如第一題是TCP、RIP、IP、FTP中哪個協議是傳輸層的......。有一道linux的chown使用題目。其他的全是數據結構的題目!什么鏈,表,碼的,不知所云.唉,我可以沒有學過數據結構的人吶!真殘忍!這一部分迅速猜完!
第二部分簡答題:
1、在linux中如何編譯C程序,使之成為可執行文件?如何調試?
答案: 1)檢查程序中.h文件所在的目錄,將其加入系統PATH中;
2)執行C編譯:#gcc [源文件名] -o [目標文件名]
執行C++編譯:#g++ [源文件名] -o [目標文件名]
3)改變目標文件為可執行文件:#chmod +x [目標文件名]
4)如需將多個可執行文件連續執行,可生成批處理文件:
#vi [批處理文件名]
可執行文件1
可執行文件2
.........
最后將該批處理文件屬性該位可執行。
調試:在編譯時使用-g參數,就可以使用gdb進行調試。
2、寫出內存分配和釋放的函數,并指出區別。
答案:
C語言的標準內存分配函數:malloc,calloc,realloc,free等。
malloc與calloc的區別為1塊與n塊的區別:
malloc調用形式為(類型*)malloc(size):在內存的動態存儲區中分配一塊長度為“size”字節的連續區域,返回該區域的首地址。
calloc調用形式為(類型*)calloc(n,size):在內存的動態存儲區中分配n塊長度為“size”字節的連續區域,返回首地址。
realloc調用形式為(類型*)realloc(*ptr,size):將ptr內存大小增大到size。
free的調用形式為free(void*ptr):釋放ptr所指向的一塊內存空間。
C++中為new/delete函數。
3、寫出socket函數,并指出其功能。
socket():建立socket通信描述符;
bind():將套接字和機器上的一定的端口關聯;
connect():連接到遠程主機;
listen():使套接字做好連接的準備,規定等待服務請求隊列的長度;
accept():接受連接,一旦有客戶端發出連接,accept返回客戶地址信息和一個新的sock;
有了這個新的sock,雙方就可以開始收發數據:
send()和recv():用于流式套接字或者數據套接字的通訊;
sendto()和recvfrom():用于無連接的數據報套接字;
close():關閉套接字;
shutdown():選擇性的關閉套接字,可以只允許某一方向的通訊關閉;
getpeername():返回流式套接字時對端peer信息;
gethostname():返回程序所運行的機器的主機名字;
gethostbyname():返回本機IP;
第三部分編程題:
1、從文件中讀取字符串數據,反序顯示并大小寫轉換。
2、給定26字母表以及對應的密碼表,編程實現加密及解密功能。
第四部分思考題(正是傳說中的字典糾錯題):
用戶在輸入英文單詞時經常出錯,現對其進行就錯。給定一個正確的英文詞典,考慮糾錯實現。1)指出思路。2)流程、算法難易程度及可能的改進策略。
一道算法題目答案
int Replace(Stringtype &S,Stringtype T,Stringtype V);//將串S中所有子串T替換為V,并返回置換次數
{
for(n=0,i=1;i〈=Strlen(S)-Strlen(T)+1;i++) //注意i的取值范圍
if(!StrCompare(SubString(S,i,Strlen(T)),T)) //找到了與T匹配的子串
{ //分別把T的前面和后面部分保存為head和tail
StrAssign(head,SubString(S,1,i-1));
StrAssign(tail,SubString(S,i+Strlen(T),Strlen(S)-i-Strlen(T)+1));
StrAssign(S,Concat(head,V));
StrAssign(S,Concat(S,tail)); //把head,V,tail連接為新串
i+=Strlen(V); //當前指針跳到插入串以后
n++;
}//if
return n;
}//Replace
分析:i+=Strlen(V);這一句是必需的,也是容易忽略的.如省掉這一句,則在某些情況下,會引起不希望的后果,雖然在大多數情況下沒有影響.請思考:設S='place', T='ace', V='face',則省掉i+=Strlen(V);運行時會出現什么結果? (無限遞歸face)
百度2005年的筆試題
1.實現 void delete_char(char * str, char ch);
把str中所有的ch刪掉
2.把字符串S中所有A子串換成B,這個沒給函數原型
3.搜索引擎的日志要記錄所有查詢串,有一千萬條查詢,不重復的不超過三百萬
要統計最熱門的10條查詢串. 內存<1G. 字符串長 0-255
(1) 主要解決思路 //具體用詞和原題不大一樣
(2) 算法及其復雜度分析
4.有字典,設計一個英文拼寫糾正算法 (1) 思想 (2) 算法及復雜度 (3) 改進
5. { aaa, bb, ccc, dd }, { bbb, ff }, { gg } 等一些字符串的集合
要求把交集不為空的集合并起來,如上例會得到 { aaa, bb, ccc, dd, ff }, {gg}
(1) 思想 (2) 算法及復雜度 (3) 改進
、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、
一、選擇題:15分 共10題
1.一個含有n個頂點和e條邊的簡單無向圖,在其鄰接矩陣存儲結構中共有____個零元素。
A.e B.2e C.n2-e D.n2-2e
2.____是面向對象程序設計語言中的一種機制。這種機制實現了方法的定義與具體的對象無關,而對方法的調用則可以關聯于具體的對象。
A.繼承(Inhertance) B.模板(Template)
C.對象的自身引用(Self-Reference) D.動態綁定(Dynamic Binding)
3.應用層DNS協議主要用于實現 網絡服務功能.
A. IP地址到網絡設備名字的映射 B. IP地址到網絡硬件地址的映射
C. 網絡設備名字到IP地址的映射 D. 網絡硬件地址到IP地址的映射
4.linux默認情況下,一個進程最多能打開多少文件?
A.64 B. 128 C. 512 D. 1024
5.下面結構體
struct s1 {
char ch, *ptr;
union {
short a, b;
unsigned int c:2, d:1;
}
struct s1 *next;
};
的大小是_____:
A. 12字節 B.16字節 C.20字節 D. 24字節
6.任何一個基于"比較"的內部排序的算法,若對6個元素進行排序,則在最壞情況下所需的比較次數至少為____。
A.10 B.11 C.21 D.36
7.以下不是進程間通訊的是___
A 共享內存 B 信號量 C線程局部存儲 D 消息隊列
8.下面程序,求count的值
int func(x)
{
int count= 0;
x=9999;
while(x)
{
Count ++;
x = x&(x-1);
}
return count;
}
A 8; B 10; C 5; D 11
9.使用malloc系統調用分配的內存是在____ 上分配的?
A 棧; B bss; C 物理內存; D 堆
10.最壞情況下,合并兩個大小為n的已排序數組所需要的比較次數_____
A.2n B.2n-1 C.2n+1 D.2n-2
二、簡答題:20分,共3題
1.(5分)下面這段代碼是把中英文混合字符串(漢字用兩個字節表示,特點是第一個字節的最高位為1)中的大寫字母轉化為小寫字母,請找出其中的bug,注意各種異常情況。
for (char *piterator = szWord; *piterator != 0; piterator++)
{
if (*piterator & 0x80 != 0)
{
piterator++;
}
else if (*piterator >= 'A' && *piterator <= 'Z')
piterator += 32;
}
2.(5分)對給定的上億條無序的url,請按照domain、site以及path分別排序,并請指出排序過程中可能會遇到的哪些問題?如何提高效率?
例如:https://www.baidu.com/path/about.html,domain、site以及path的定義分別如下:
Domain:baidu.com
Site:www.baidu.com
Path: www.baidu.com/path
3.(10分)某型CPU的一級數據緩存大小為16K字節,cache塊大小為64字節;二級緩存大小為256K字節,cache塊大小為4K字節,采用二路組相聯。經測試,下面兩段代碼運行時效率差別很大,請分析哪段代碼更好,以及可能的原因。
為了進一步提高效率,你還可以采取什么辦法?
A段代碼
int matrix[1023][15];
const char *str = "this is a str";
int i, j, tmp, sum = 0;
tmp = strlen(str);
for(i = 0; i < 1023; i++) {
for(j = 0; j < 15; j++) {
sum += matrix[i][j] + tmp;
}
}
B段代碼
int matrix[1025][17];
const char *str = "this is a str";
int i, j, sum = 0;
for(i = 0; i < 17; i++) {
for(j = 0; j < 1025; j++) {
sum += matrix[j][i] + strlen(str);
}
}
三、編程題:30分 共1題
注意:要求盡可能提供完整代碼,如果可以編譯運行酌情加分。
1.內存中有一個長數組,條目數為10萬,數組單元為結構體struct array,sizeof(struct array)為512字節。結構有一int型成員變量weight,F需要取得按weight值從大到小排序的前500個數組單元,請實現算法,要求效率盡可能高。
四、設計題:35分 共1題
注意:請盡可能詳細描述你的數據結構、系統架構、設計思路等,建議多寫一些偽代碼或者流程說明。
1.請設計一個字典。以字符串為索引,存儲用戶定義的定長結構。要求有增、刪、查、改的功能。已經給定一個函數,可以由字符串映射到一個簽名,每個簽名由兩個unsigned int類型組成。假設每一個字符串能夠對應唯一的一個簽名,完全沒有重復(或者重復的概率可以忽略),并且簽名分布足夠均勻。
請描述你的數據結構?內存如何申請?增、刪、查、改的功能如何實現?如果操作很頻繁,該如何優化?
、、、、、、、、、、、、、、、、、、、、、、、、、、
經過在線筆試、兩輪電話面試,今天上午收到了百度的拒信,我的百度求職算是告一段落了……
從百度校園招聘開始,我就投了一份簡歷。在別人都有在線筆試機會的時候,我卻沒有任何消息。
聽說師兄可以給推薦,我就又通過內部推薦的方式投遞了一次,這次很快就有消息了——拒信。
那時基本上就放棄了百度?墒谴蟾20多天以后,我投遞的第一份簡歷有消息了——通知我在線筆試。經過精心準備,筆試題答得還湊合。過了幾天給我來了封郵件告知我筆試通過,會找時間安排電話面試。又過了好幾天,我正在剃頭的時候接到百度電話,約了第二天下午三點電話面試。心情異常興奮,回到寢室拼命復習數據結構并收集百度面試題型……臨陣磨槍 呵呵。
百度的面試氛圍很是輕松,讓你很快就覺得是在聊天而不是面試。第一輪主要是在針對我的在線筆試的題目進行提問和分析,主要講的是做題的思路和改進的方法。面試時間大概有半個小時,覺得應該有下一輪。
果然上個星期五晚上接到了百度技術經理的電話,自稱姓劉。在前一天我同學也是這個時候接到百度第二面電話,看來是同一個人,后來的面試內容證實了是同一個人。面試過程大概如下:
1、介紹一下項目。
2、提了一個問題:上千萬條記錄,統計出重復記錄最多的前N條。
3、一個概率題:54張撲克牌,除去兩張大小王剩下52張撲克牌。問紅桃A和黑桃A同時被一個人拿到的概率是多少?
4、多個線程訪問共享內存時因該怎么辦?
5、在寫程序遇到問題的時候,通常采用什么調試方法?
6、一個client/server的協議問題
7、剩下就是隨便聊聊,比如有缺點、期望工作的性質、職業規劃等
總結一下教訓:
1、介紹項目的時候不能一味的按照事前想好的模板說,應該根據所申請的工作的性質,多說一些和自己申請的工作內內容相近的東西說。我在介紹我的項目的時候,說了很多硬件的東西,而相關的Linux下的C編程卻沒有提到多少,一大失敗之處。
2、對于他提的第二個問題,當時因為緊張沒有想出來,掛了電話以后才有了思路。
3、這個概率題以前碰到過,而且和同學們討論過,答案很早就知道了。但是遇到面試的時候,不能馬上就說出答案,因為這樣擺明了高訴人家你以前就見過這道題,這樣就失去了作為考題的意義。所以,如果事前知道答案也不要馬上說出來,裝作考慮中,然后慢慢說出答案。我就是很快就說出了答案,失敗!
4、在問項目的時候,他問我代碼行大概有多少?我說大概有5.6K行左右。在回答第四個問題的時候,我幾乎是將書上所講過的東西背了一遍給他,雖然答案是正確的,但是我估計他一聽就聽出來是在背書了,所以這也會減分不少。,而且百度強調創新,其實就算你不知道答案也可以按照自己的思路說一下的,只要邏輯清晰、合理都會比我背書強……
5、我的回答是有時候用gdb,有時候用輸出日志的形式。以我之前給他講的項目經驗是不大可能會涉及這么多的知識的,所以估計他又聽出我是在背書了……繼續減分
6、后來我發現這個問題其實他不是在考我問題的答案,是考我解決問題的能力和考慮問題的思路。這點是我比較差的地方,沒辦法……減分
我前面表現那么失敗,基本上已經沒有什么希望了,后面的談話已經沒有意義了,只不過是禮貌性的結束這次面試了。
上面的總結是我收到拒信以后才總結出來的,還以為能被錄取呢……
面試官太和藹了,而且氣氛及其融洽,根本沒有任何不好的征兆,面試官好厲害!
至此,我的百度求職過程到此告一段落……生活還在繼續,工作還得繼續努力去找,加油!
百度電話面試題目:
1.談談你對數據庫中索引的理解
2.現在普通關系數據庫用得數據結構是什么類型的數據結構
3.索引的優點和缺點
4.session和cache的區別是什么
5.如果有幾千個session,怎么提高效率