CDH使用-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

CDH使用

阅读量：7048 次

发布时间：2019-06-28

本文共 1128 字，大约阅读时间需要 3 分钟。

CDH使用文档

前言：CDH在安装完毕之后，通过CM给集群添加服务组件，就可以开始各个组件的使用了，本文针对集群和各服务组件的使用作说明。

一、创建用户目录

在集群上使用CDH时，建议使用普通用户提交任务。开始使用前，需要添加对应的HDFS组件，然后在HDFS上创建自己的用户目录。创建时，需要有sudo权限。命令如下，

创建用户目录：

sudo –u hdfs hadoop fs –mkdir /user/xxx (xxx代表用户名称)

给用户目录赋权限：

sudo –u hdfs hadoop fs –chown –R xxx: supergroup /user/xxx (xxx代表用户名称)

创建完毕之后使用查看用户和用户组：

hadoop fs –ls /user/ xxx (xxx代表用户名称)

二、服务组件的添加

对于需要使用的组件，通过CM管理界面进行添加

三、服务组件使用方法

CDH的服务创建时候，不需要在命令行进行启动停止服务操作，启动和停止操作可以在CM端进行。

以下列出各个组件进入shell命令方法（前提该组件在CM端已经添加）：

1、HDFS（需要先创建对应用户目录，参考第一步）

a) 列出当前用户目录下文件及文件夹

hadoop fs –ls

b) 上传数据到HDFS

hadoop fs –put xxx.txt

c) get数据到本地

hadoop fs –get xxx.txt

d) 提交任务(以hadoop自带的examples为例)

cd /opt/cloudera/parcels/CDH/lib/hadoop-mapreduce/

hadoop jar hadoop-mapreduce-examples.jar pi 10 10

2、Hive

命令行直接输入：

hive

3、HBase

命令行直接输入：

hbase shell

4、Spark

命令行直接输入：

spark-shell

四、日志查看

1、通过CM进行查看（mapreduce日志查看举例）

在CM端点击组件

进入状态页面

进入组件Web UI

找到自己提交的任务ID，点击history

进入任务详情页面：

点击map进入具体的task信息

查看日志

还可以直接找到job列表

查看更详细日志

2、服务器端查看

进入到/var/log/目录进入到对应组件目录查看相应日志（此种方式查看错误日志不是很方便，需要定位到对应job执行的机器查看日志输出）

此处为yarn的日志：

五、组件WebUI进入

主页点击相应的组件进入状态页面：

转载于:https://my.oschina.net/crxy/blog/464260

你可能感兴趣的文章

如何获得C4C里某个code字段对应的描述信息

elasticsearch -- 基础入门 -- 请求体查询 -- 最重要的查询

MCPlayerKit 易用的播放组件，通用播放器

报错xxxx of undefined

配置HTTPS，公钥证书有效期短怎么办？

重新学习web后端开发-004-了解http响应

js判断微信内核浏览器

原生JS发请求

数字签名信息安全

项目打包优化

力扣(LeetCode)417

199. Binary Tree Right Side View

PHP_SELF变量解析和重复路径解决

JS每日一题：什么情况下适合使合vuex？Vuex使用中有几个步骤？

原来实现GCP用客户端登录这么简单啊

JS每日一题: 请简述一下vuex实现原理

从 TodoList 中学父子组件通信

Spring MVC常用客户端参数接收方式

原生js实现Ajax，JSONP

用koa开发一套内容管理系统（CMS），支持javascript和typescript双语言

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2025-02-07 06:48:03 当前IP: 3.139.236.119 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我