A.Hive可以实现在大规模数据集上实现低延迟快速的查询
B.Hive查询操作过程严格遵循HadoopMapReduce的作用执行模型,Hive将用户的HiveQL语句通过解释器转换为MapReduceHadoop集群上
C.Hive最佳使用场景是大数据集的批处理作业
D.Hive构建在基于静态批量处理的Hadoop之上,Hadoop通常有较高的延迟并且在作业提交和调度的时候需要大量的开销
A.Kafka作为高并发实时接入缓存,解决接入量的问题
B.Flink作为实时计算引擎实时消费Kafka数据写入HBase
C.HBase数据库为海量实时接入数据提供存储与实时查询能力
D.Hive为海量历史数据提供实时分析能力
A.exportJAVA_HOME=java-install-dir
B.exportHIVE_HOME=hive-install-dir
C.exportHADOOP_HOME=hadoop-install-dir
D.exportHDFS_HOME=hdfs-install-dir
A.Hadoop
B.Impala
C.Spark
D.BigTable
A.为海量的数据提供了存储
B.有高容错性的特点,并且设计用来部署在低廉的硬件上
C.它提供高吞吐量来访问应用程序的数据,适合那些有着超大数据集的应用程序
D.为海量的数据提供了计算
E.放宽了POSIX的要求,可以以流的形式访问件系统中的数据
B.core-site.xml
C.mapred-site.xml
D.core-default.xml
A.数据处理框架(MapReduce),集群管理(YARN),分布管理控制(ZooKeeper)
B.Spark高效数据处理架构
C.安全管理组件
D.Hadoop的客户端