A.Hadoop是一个能够对大量数据进行分布式处理的软件框架
B.作为并行分布式计算平台,Hadoop采用分布式存储和分布式处理两大核心技术,能够高效地处理PB级数据
C.Hadoop只支持Java编程语言
D.Hadoop可以高效稳定地运行在廉价的计算机集群上,可以扩展到数以千计的计算机节点上
A.Hadoop
B.Impala
C.Spark
D.BigTable
A.CPU与串行处理能力
B.CPU与高时间频率倾向的计算
C.GPU与图形绘画与渲染的计算
D.GPU与并行同类型高效处理的计算
A.它运行在通用硬件上
B.它是Apache软件基金会(ASF)下的项目
C.它是最好的实时流式数据处理框架
D.Hadoop对数据的处理是有延迟的
A.Hive最终将数据存储在HDFS中
B.Hive是Hadoop平台的数据仓库工具
C.HQL可以通过MapReduce执行任务
D.Hive对HBase有强依赖
A.当主节点程序确定后,从节点上传感器可以配置任意类型
B.当主节点程序确定后,可以有任意多从节点
C.主节点发送的功能码决定读写哪种寄存器数据
D.RS-485总线具备CSMA/CD功能
A.TumblingEventTimeWindows
B.assignTimestampsAndWatermarks
C.window
D.keyBy
A.大数据=“海量数据”+“复杂类型的数据”
B.大数据是指在一定时间对内容抓取、管理和处理的数据集合
C.大数据可以及时有效的分析海量的数据
D.数据包括结构化数据、半结构化数据、结构化数据