20180514早课记录09-MySQL&Hadoop

1.排序语法，默认是降序吗

不是默认是升序

2.限制多少行语法

limit 100

3.分组函数有哪些

group by

4.分组语法是什么

group by column

5.分组语法的注意点是什么

查询列要放到group by里面，函数除外

6.join有哪几种

left join,right join,inner join

7.left join是哪个表数据全

左表

8.union 和union all 区别是什么

union去重，union all不去重

9.谈谈你们觉得什么是子表

复杂查询中，部分查询结果可作为字表，相当于临时表

10.模糊查询名称name的有s字符的名称有哪些?

select name from tb_name where name like ‘%s%‘;

11.like查询语法，比如是第三个字符是s，那么前面是不是要用两个占位符?

是的

12.谈谈你们对hadoop的理解

Hadoop是一个由Apache基金会所开发的分布式系统基础架构
广义来说是 hadoop生态圈狭义来说仅仅指hadoop本身

13.hadoop包含哪三大组件，分别是做什么的

HDFS 存储
MapResource 计算
YARN 资源和作业调度

14.hadoop官网地址是什么

http://hadoop.apache.org/

15.maven编译是不是需要pom.xml

需要

16.maven的默认仓库文件夹在哪

家目录下的.m2

17.我们进行hadoop部署是什么模式?有进程吗

伪分布式有进程

18.hdfs的存储也是从根目录开始的吗

从hdfs系统的根目录存储的

19.伪分布式部署时要配置jdk和ssh，那么请问你们配置ssh无密码的访问，这个流程会吗

会

20.tar解压时，特别要留意一个东西

用户和用户组

原文地址：http://blog.51cto.com/10814168/2116108

时间： 2024-10-22 03:32:51

20180514早课记录09-MySQL&Hadoop的相关文章

20180523早课记录16-Linux&Hadoop

1.说说vi命令的怎样覆盖文件内容,从记事本复制过去呢?哪些命令命令行模式下gg + dG删除原内容,然后进入编辑默认粘贴进去新的内容 2.tar压缩和解压参数 tar -cvf 压缩tar -xzvf 解压 3.假如vi 在命令行模式,粘贴一段,你们有没有发现第一行会有丢失? 那么我们在粘贴前,应该让命令行模式进入什么模式? 粘贴前输入i 让命令行模式进入编辑模式 4.tar解压后我们要习惯的做一件事是什么? 更改用户和用户组 5.(拓展题)怎样配置Linux机器的yum源? 进入/etc

20180504早课记录03-Linux

1.谈谈学到现在,带r参数的命令有哪些? cp -rrm -rfls -r 2.同事说,打开那台电脑xxx服务的web界面,你们觉得哪几种途径可以尝试知道? ifconfig --找到ipps -ef|grep xxx --找到pidnetstat -nlp|grep pid --找到端口也可以ps查看xxx服务的路径地址,找到配置文件,查看配置文件 3.mv和cp谁快 mv快 4.个人环境变量文件在哪,一般什么文件,什么命令查看,怎样生效 ~/.bash_profile more ~/.bas

20180525早课记录18-Hadoop

1.昨晚若泽分享了一个开源组件叫什么? hystrix 2.jps如果看了信息不可用,我们该怎么做 ps一下进程进入相应用户下去看 3.hadoop pid默认在哪?哪个变量和参数文件修改默认在 /tmp 目录下在hadoop-env.sh参数文件修改HADOOP_PID_DIR变量 4.hdfs日志显示是在safe mode,那么哪个命令可以尝试让hdfs离开安全模式 hdfs dfsadmin -safemode leave 5.hdfs执行操作命令时,发现有权限不可访问或者写入,请

20180531早课记录22-Hive

1.hive是什么? 基于Hadoop的一个数据仓库工具 2.hive的默认使用什么数据库?生产上我们一般用什么? 默认使用derby生产使用MySQL 3.hive的元数据存储在哪? 数据存储在哪? MySQL HDFS 4.hive的SQL语法和什么类似和MySQL语法类似 5.hive底层执行计算引擎是什么 MapReduce/tez/spark 6.hive使用mysql做元数据存储,那么部署过程中,注意什么注意mysql的高可用 7.接上题,配置文件里要哪些参数 url,usern

20180601早课记录23-Hadoop

1.hdfs是属于什么架构高可用的分布式架构 2.hdfs部署后进程哪些?按启动顺序说 NameNode,DataNode,SecondaryNameNode 3.一个文件180M,请问实际存储多少,多少块?多少map task?(副本为3) 540M, 6块, 假如文件支持分割,那么就2个map task.假如文件是压缩的,那么正好压缩不支持分割,那么就一个map task 4.副本放置策略,来说说看就近分配 5.snn职责是什么是合并NameNode的edit logs到fsimage

20180611早课记录28-Sqoop

1.sqoop是什么? 主要用于在Hadoop与RDBMS间进行数据的传递 2.sqoop分为哪两个分支,各最新版本是什么? sqoop1:1.4.7 sqoop2:1.99.7 3.在工作中我们用的最多的是sqoop1,那么导入和导出,谁给谁的导入是RDBMS到Hadoop导出是Hadoop到RDBMS 4.假如输入一个命令找不到not found,你们觉得该怎么办?(老生常谈) 先看打错了没有,再看PATH有没有,或者yum安装 5.sqoop命令参数-m是什么意思指定MapReduce

20180510早课记录07-MySQL

1.MySQL创建db,删除db命令 create database db;drop database db; 2.MySQL的字段类型整型:tinyint,smallint,mediumint,int,bigint 浮点型:float(m,d),double(m,d),decimal(m,d) 字符串类型:char(n),varchar(n),tinytext,text,mediumtext,longtext 日期和时间类型:date,time,datetime,timestamp,year

20180516早课记录11-Linux

1.MySQL二进制编译部署时,我们是创建一个用户mysqladmin,怎样将/usr/local/mysql目录设置为家目录 useradd -u 514 -g dba -G root -d /usr/local/mysql mysqladmin 2.哪几种方法让新的家目录有.bash_profile文件?(跳跃思维) cp /etc/skel/.* /usr/local/mysql或者vi cp 3.全局环境变量文件在哪?怎样生效 /etc/profile source /etc/prof

20180521早课记录14-Hadoop

1.hadoop是什么狭义: Hadoop软件(HDFS.MapReduce.Yarn)广义: 以hadoop为主的生态圈 2.hadoop三大组件是什么?分别做什么 HDFS: 分布式文件管理系统存储MapReduce: 执行引擎计算Yarn: 资源(memory cpu)和作业调度平台资源 3.hdfs在部署时,要配置信任关系,请问root和hadoop用户部署时,区别是什么注意authorized_keys权限要改为600 4.hdfs三个进程是什么 NameNode,Data