- 相關(guān)推薦
HCNP-Big Data-Developer V1.0試題及答案
1.(判斷題) HDFS采用的是“一次寫入、多次讀取”的文件訪問模型。所以推薦一個(gè)文件經(jīng)過創(chuàng)建、寫入和關(guān)閉之后,就不要再去修改。
A. True B. False
2.(多選題) HDFS的應(yīng)用開發(fā)中,下列哪些是HDFS服務(wù)支持的接口?
A. BufferedOutputStream.write
B. BufferedOutputStream.flush
C. FileSystem.create
D. FileSystem.append
3. (多選題) 關(guān)于kinit操作命令,如下哪些說法是錯(cuò)誤的?
A. 只能使用人機(jī)賬號(hào)。
B. 只能使用機(jī)機(jī)賬號(hào)。
C. 一個(gè)客戶端不支持多個(gè)賬號(hào)同時(shí)使用。
D. 執(zhí)行此命令得到的票據(jù)在24小時(shí)后會(huì)超時(shí),需再次執(zhí)行kinit命令去重新登錄。
4.(多選題)對(duì)于HBase Rowkey的設(shè)計(jì)原則,如下描述正確的是?
A. 訪問權(quán)重高的屬性值放在Rowkey前面。
B. 訪問權(quán)重高的屬性值放在Rowkey后半部分。
C. 離散度好的屬性值放在Rowkey前半部分。
D. 離散度好的屬性值放在Rowkey后半部分。
5.(單選題)HBase表的Rowkey設(shè)計(jì)是一個(gè)很重要的開發(fā)設(shè)計(jì)環(huán)節(jié)。假設(shè)存在如下場景,最頻繁的查詢場景是基于手機(jī)號(hào)查詢每個(gè)月、每半年的歷史通話記錄,以下哪個(gè)Rowkey設(shè)計(jì)是最優(yōu)的?
A. 姓名+手機(jī)號(hào) B. 日期+手機(jī)號(hào)
C. 手機(jī)號(hào)+日期 D. 手機(jī)號(hào)+姓名
6.(單選題) FusionInsight HD中,關(guān)于Hive的分區(qū)(partition)功能,如下描述錯(cuò)誤的是?
A. 分區(qū)字段要在創(chuàng)建表時(shí)定義。
B. 分區(qū)字段只能有一個(gè),不可以創(chuàng)建多級(jí)分區(qū)。
C. 使用分區(qū),可以減少某些查詢的數(shù)據(jù)掃描范圍,進(jìn)而提高查詢效率。
D. 分區(qū)字段可以作為where字句的條件。
7.(判斷題) FusionInsight HD系統(tǒng)的V100R002C60版本中,Hive僅支持基于MapReduce引擎的查詢服務(wù),不支持基于Spark引擎的查詢服務(wù)。
A. True
B. False
8.(單選題) FusionInsight HD中,對(duì)Solr各類資源的創(chuàng)建和讀寫權(quán)限使用,以下說法錯(cuò)誤的是?
A. Solr用戶組用戶可以創(chuàng)建配置集,并在創(chuàng)建Collection時(shí)指定該配置集。
B. Solr用戶組的用戶可以創(chuàng)建Collection。
C. Collection創(chuàng)建者、對(duì)該Collection具有讀寫權(quán)限的角色以及Solr admin角色可以對(duì)Collection進(jìn)行更新。
D. 只有Collection創(chuàng)建者和Solr admin角色可以刪除Collection。
9.(多選題) 在Solr的應(yīng)用查詢場景中,當(dāng)對(duì)查詢結(jié)果深度翻頁時(shí),需使用游標(biāo)進(jìn)行深度翻頁。下面對(duì)游標(biāo)說法正確的是?
A. 必須對(duì)查詢字段進(jìn)行排序。
B. 必須對(duì)uniqueKey字段進(jìn)行排序。
C. 第一次查詢請(qǐng)求時(shí),需指定查詢參數(shù),操作方法如下:
solrQuery.set(CursorMarkParams.CURSOR_MARK_PARAM, CursorMarkParams.CURSOR_MARK_START);
D. 查詢時(shí),請(qǐng)求中不能帶有start參數(shù)。
E. Solr的返回結(jié)果中會(huì)有nextCursorMark,在下次調(diào)用時(shí)使用這個(gè)值作為cursorMark。
10.(多選題)關(guān)于Kafka的Producer,如下說法正確的是?
A. Producer是消息生產(chǎn)者。
B. Producer生產(chǎn)數(shù)據(jù)需要指定Topic。
C. 可以同時(shí)起多個(gè)Producer進(jìn)程向同一個(gè)Topic進(jìn)行數(shù)據(jù)發(fā)送。
D. Producer生產(chǎn)數(shù)據(jù)時(shí)需要先連接ZooKeeper,而后才連接Broker。
11.(單選題) 在FusionInsight HD產(chǎn)品中,關(guān)于Kafka安全和非安全端口描述錯(cuò)誤的是?
(注:舊API是指舊Producer API和舊Consumer API。其中,舊Consumer API:是指kafka.consumer.ConsumerConnector中定義的接口;舊Producer API:是指kafka.producer.Producer中定義的接口。)
A. Kafka集群安全訪問端口默認(rèn)為21007,非安全訪問端口默認(rèn)為21005。
B. 舊API通過21005端口訪問某個(gè)Topic的前提是:服務(wù)端參數(shù)allow.everyone.if.no.acl.found設(shè)置為true,且此Topic未設(shè)置ACL屬性。
C. 舊API僅支持訪問21005端口;新API兼容訪問非安全端口21005和安全端口21007。
D. 對(duì)于設(shè)置了ACL的Topic,可以使用舊API連接21005端口進(jìn)行訪問。
12.(判斷題)在一個(gè)MapReduce應(yīng)用程序中,map函數(shù)的輸出經(jīng)由MapReduce框架處理后,發(fā)送到reduce函數(shù)。這個(gè)處理過程是基于鍵值對(duì)進(jìn)行排序和分組的。
A. True
B. False
13.(判斷題)在FusionInsight HD中,Spark默認(rèn)采用YARN作為集群資源管理系統(tǒng)。
A. True
B. False
14.(單選題)Spark應(yīng)用的計(jì)算邏輯會(huì)被解析成DAG,這個(gè)解析操作由以下哪個(gè)功能模塊完成?
A. Client
B. ApplicationMaster
C. Executor
D. Driver
15.(單選題)在Flume中,source功能模塊的主要作用是?
A. 獲取數(shù)據(jù),并將原始數(shù)據(jù)轉(zhuǎn)化成自己處理的數(shù)據(jù)對(duì)象。
B. 緩存數(shù)據(jù),根據(jù)不同的可靠性策略,將數(shù)據(jù)保存在內(nèi)存或文件上。
C. 輸出數(shù)據(jù)到目的地,支持多種輸出協(xié)議。
D. 拆分?jǐn)?shù)據(jù),根據(jù)數(shù)據(jù)的特性,將數(shù)據(jù)發(fā)送到不同的目的地。
16.(單選題) 關(guān)于Streaming的拓?fù)?Topology),下面描述錯(cuò)誤的是?
A. 一個(gè)Topology是由一組Spout組件和Bolt組件通過Stream Groupings進(jìn)行連接的有向無環(huán)圖(DAG)。
B. Topology會(huì)一直運(yùn)行,直到它被顯式kill。
C. 業(yè)務(wù)邏輯都被封裝進(jìn)Topology中。
D. 一個(gè)Topology只可以指定啟動(dòng)一個(gè)Worker進(jìn)程。
17.(單選題) 假設(shè)一個(gè)應(yīng)用有10個(gè)表,每個(gè)表記錄數(shù)為千萬級(jí)別,字段數(shù)約20個(gè),F(xiàn)使用Redis來緩存這10個(gè)表的數(shù)據(jù),對(duì)其數(shù)據(jù)結(jié)構(gòu)的設(shè)計(jì),以下哪一項(xiàng)是最佳設(shè)計(jì)?
A. 采用hash結(jié)構(gòu),且一個(gè)表使用一個(gè)hash KEY,表中一行記錄對(duì)于hash KEY的一個(gè)field。
B. 采用hash結(jié)構(gòu),每個(gè)表的每一行記錄使用一個(gè)hash KEY,hash KEY的field對(duì)應(yīng)表記錄的字段,且設(shè)計(jì)KEY時(shí)每個(gè)表添加不同的前綴進(jìn)行區(qū)分。
C. 采用string結(jié)構(gòu),每個(gè)表的每一行記錄的每個(gè)字段使用一個(gè)KEY。
D. 采用string結(jié)構(gòu),每個(gè)表的每一行記錄使用一個(gè)KEY,value為表中一行記錄的所有字段拼接后的值。
18.(多選題) FusionInsight HD中,在使用Streaming的ACK機(jī)制時(shí),下列哪些說法是正確的?
A. 啟用了Acker之后,Streaming會(huì)識(shí)別發(fā)送失敗的Tuple并自動(dòng)重發(fā),無需人為干預(yù)。
B. Acker會(huì)標(biāo)識(shí)處理超時(shí)或者處理失敗的消息為fail。
C. 從spout開始,形成的Tuple樹中任何一個(gè)環(huán)節(jié)失敗都會(huì)標(biāo)記整棵樹失敗。
D. 應(yīng)用需要在spout的fail()接口方法中實(shí)現(xiàn)消息重發(fā)邏輯。
19.(多選題)在Spark中,關(guān)于廣播變量以下說法正確的是?
A. 廣播變量在每個(gè)Task中保存一份 。
B. 廣播變量在每個(gè)Executor中保存一份。
C. 廣播變量是只讀的。
D. 廣播變量通過SparkContext.broadcast()方法生成。
20.(單選題)在Spark中,假設(shè)lines是一個(gè)DStream對(duì)象,filter語句可以過濾掉80%的數(shù)據(jù),針對(duì)以下兩個(gè)語句說法正確的是:
X: lines.filter(...).groupByKey(...)
Y: lines.groupByKey(...).filter(...)
A. X比Y的性能更高
B. X比Y的性能更低
C. X和Y和性能一樣
D. 無法確性X和Y的性能差異
【參考答案】
1. A 2.ABCD 3. ABC 4.AC 5.C 6.B 7.A 8.A 9. BCDE 10. ABC 11.D 12.A 13.A 14.D 15.A 16.D 17.B 18. BCD 19. BCD 20.A
【HCNP-Big Data-Developer V1.0試題及答案】相關(guān)文章:
HCNA-Big Data V1.0認(rèn)證模擬試題及答案10-23
《論語》試題及答案04-19
Indesign認(rèn)證試題及答案03-17
excel操作試題及答案03-19
photoshop試題附答案07-15
IBM認(rèn)證試題及答案07-21
物流員試題及答案10-22
Linux操作試題及答案08-01
最新photoshop試題及答案05-20