1.Hadoop 系统的两大特点是什么?
2.Hadoop 系统中有哪些子系统,每个子系统的具体应用是什么?
3.Hadoop 系统运行时有哪些进程? 各个进程的作用是什么?
4.Hadoop (包括hdfs)常用的操作。
5.MapReduce 包含哪两大核心函数?它们的作用是什么?在倒排索引中的运用。
6.HBase 的特点是什么? 数据有哪些访问方式?掌握常用的操作语句(create ‘table_name’, ‘col_name )。
7.Hive 是什么? 该系统可以使用哪些类型的表?掌握一些常用的操作(create table …,load data inpath ….)。