A.Hive最终将数据存储在HDFS中
B.Hive是Hadoop平台的数据仓库工具
C.HQL可以通过MapReduce执行任务
D.Hive对HBase有强依赖
A.所有HQL都会转化为MapReduce任务执行
B.DDL语句不提交任务到MapReduce,而是直接操作元数据
C.对于selectcount(*)fromtable操作,一定会启动reduce任务
D.对于selece*fromtable语句不会启MapReduce
A.Kafka作为高并发实时接入缓存,解决接入量的问题
B.Flink作为实时计算引擎实时消费Kafka数据写入HBase
C.HBase数据库为海量实时接入数据提供存储与实时查询能力
D.Hive为海量历史数据提供实时分析能力
A.Hive元数据存储独立于数据存储之外,从而解耦合元数据和数据,灵活性高,二传统数据仓库数据应用单一,灵活性低
B.Hive基于HDFS存储,理论上存储可以无限扩容,而传统数据仓库存储量有上限
C.由于Hive的数据存储在HDFS上,所以可以保证数据的高容错,高可靠
D.由于Hive基于大数据平台,所以查询效率比传统数据仓库快
A.可以指定实例进行日志收集
B.可以指定节点IP进行收集
C.可以指定用户进行日志收集
D.可以指定时间段进行日志收集
A.内部表数据由Hive自身管理,外部表数据由HDFS管理
B.外部表数据的存储位置由自己制定
C.删除内部表会直接删除元数据(metadata)及存储数据
D.删除外部表,HDFS上的文件也会被删除