大数据之Hue中运行Sqoop常见的问题分析

Hue提供执行Sqoop命令的功能。


使用方法
与在终端执行Sqoop命令不同,在Hue中执行Sqoop命令,应该直接使用Sqoop的一级子命令。Sqoop在终端和Hue执行的区别
在终端执行

sqoop import \
--connect jdbc:oracle:thin:@10.100.144.152:1521/ORACLE_DB \
--username mestest \
--password 123456 \
--table AUX_AUX_CSMS \
--hive-drop-import-delims \
--incremental lastmodified \
--check-column MODIFY_TIME \
--last-value '2023-10-10 13:00:00' \
--merge-key ID \
--target-dir /user/hive/warehouse/ods_ny_manufacture_mes.db/aux_aux_csms
在Hue中执行

sqoop   import  --connect   jdbc:oracle:thin:@XXXX:1521:ORCL    --username  WMSUSER    --password  BFwms@0508  --table  TB_WMS_CHECKBODY    --m 1   --hive-import   --hive-overwrite    --hive-database    ods_ny_supplychain_wms    --hive-table    TB_WMS_CHECKBODY   --hive-drop-import-delims  --delete-target-dir

修改sqoop命令
使用--password-file参数替换--password参数,新的sqoop命令如下:

sqoop-import \
  --connect jdbc:mysql://mysql_server:3306/test \
  --username username \
  --password /user/bigdata/.password \
  -m 6 \
  --table user \
  --columns id,name \
  --delete-target-dir \
  --target-dir /user/bigdata/sqoop_import_test/mysql/user
在Hue中执行Sqoop注意事项
1、直接使用一级子命令。例如:sqoop import => import,首位的sqoop要去掉,也不要使用sqoop-import。

2、不可换行。

3、参数以及参数值以空格分隔,测试发现多个空格不会影响解析。

问题与解决方法
无法找到JDBC驱动
错误信息


分析
错误信息很明显,无法加载oracle驱动。解决方法一般是在相应的lib下添加oracle的jdbc驱动包即可。

  • user/oozie/share/lib/lib_20240329094109/sqoop (路径)
  • 重启oozie

其他情报:

1、在终端执行Sqoop命令,只需要在 $SQOOP_HOME/lib 目录下增加jdbc驱动包,Sqoop在执行时就可以找到驱动。

2、在Hue中执行Sqoop是使用Oozie启动器执行的。判断依据如下:


YARN应用程序监控页面显示:


可以发现在Hue执行的Sqoop操作是Oozie启动器执行的,不止Sqoop,Spark也是通过Oozie启动器执行的,推测其他应用也是。

这样设计应该是便于Oozie工作流管理。

3、任务启动过程会加载一些lib。日志显示如下:
4、根据情报1,分别尝试了通过sqoop-import的 -files 和 -libjars 的参数指定了本地驱动包,问题没有得到解决。

综合以上信息,可以得出以下推测:(仅限于在Hue中执行Sqoop)

1、任务启动和Oozie有关。

2、任务启动会从HDFS中加载lib,并且不识别本地lib,至少Sqoop是如此。

3、仔细观察情报3,加载的lib和Oozie相关。

4、如果要添加驱动包,必然从HDFS中的lib入手。

至此,我突然想起了Oozie的共享库,再联系情报3,发现加载的lib就是Oozie共享库。

解决
1、登入Oozie服务所在的服务器,进入 /opt/cloudera/parcels/CDH/lib/oozie/oozie-sharelib-yarn/lib/sqoop 目录,将所需的jdbc驱动包放入。

2、更新Oozie共享库


3、再次尝试在Hue执行Sqoop,成功。

其他思考:

直接将jdbc驱动包放入HDFS上的Oozie共享库,不知是否可行。

执行成功之后的报错
Sqoop命令执行成功,但是日志输出错误:


这个错误在未解决jdbc驱动问题时就有,不过测试工作流之后,发现不会影响任务状态,暂且搁置。

命令在执行结束后无法自动停止
在Hue查询面板执行Sqoop命令成功后,启停按钮不会自动停止,现象如下:


确定任务确实执行成功,但是此处的按钮状态不会自动改变,原因未知,可手动点击关闭。目前没有发现坏的影响,暂且搁置。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/605496.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Web API之DOM

DOM 一.认识DOM二.获取元素三.事件基础四.操作元素(1).改变元素内容(2).修改元素属性(str、herf、id、alt、title)(3).修改表单属性(4).修改样式属性操作(5).小结 五.一些思想(1).排他思想(2).自定义属性的操作 六.节点操作1.认识2.节点层级关系3.创建和添加、删除、…

电子硬件设计-Xilinx FPGA/SoC前期功耗评估方法(1)

目录 1. 简介 2. 使用方法 2.1 设计输入 2.2 查看结果 3. 额外说明 4. 总结 1. 简介 XPE (Xilinx Power Estimator, 功耗估算器) 电子表格是一种功耗估算工具,用于项目的预设计和预实现阶段。 该工具可以帮助工程师进行架构评估、器件选择、合适的电源组件以…

SpringCloudAlibaba:4.3云原生网关higress的JWT 认证

概述 简介 JWT是一种用于双方之间传递安全信息的简洁的、URL安全的声明规范。 定义了一种简洁的,自包含的方法用于通信双方之间以Json对象的形式安全的传递信息,特别适用于分布式站点的单点登录(SSO)场景 session认证的缺点 1.安…

liunx命令行 带颜色

for i in {1..49}; do echo -e "\033[;${i}m 这是${i}的效果 oldboy\E[0M"; done

如何彻底将CAD或者Cadence卸载干净

最近因为升级软件需要先彻底删除这两个软件,发现无论如何都不能卸载干净,于是乎找到这样一个软件帮助卸载或查找剩余的软件残留: 官网:https://geekuninstaller.com 支持软件和 UWP 应用的卸载,查看软件注册表和安装目…

防爆地下水位自动监测设备

TH-DSW1随着科技的不断进步,地下水资源监测技术也在日新月异。防爆地下水位自动监测设备作为一种先进的水文监测工具,其应用不仅提高了水资源管理的效率,还为保障水资源安全提供了有力支撑。 一、防爆地下水位自动监测设备的优势 防爆地下水…

跨协议通讯无缝对接:Modbus-BACnet楼宇智能转换器深度解析

在现代化的建筑群里,智能楼宇管理系统如同神经系统,协调着各设备的运行。某大型商业综合体,集购物中心、办公区、酒店于一体,面对着来自不同供应商的设备,如何实现统一管理和高效通讯成了首要挑战。特别是其内部既有采…

UE5 FARFilter筛选器使用方法

UE5 查找资源时可以用FARFilter进行筛选,之前可以用ClassNames进行筛选,但是5.1之后就弃用这个属性改成ClassPaths属性 构造一个FTopLevelAssetPath对象需要两个FName参数,但是没找到应该传什么 查找官方文档,明显是错误的&#x…

基于SSM的“小型企业人事管理系统”的设计与实现(源码+数据库+文档+PPT)

基于SSM的“小型企业人事管理系统”的设计与实现(源码数据库文档PPT) 开发语言:Java 数据库:MySQL 技术:SSM 工具:IDEA/Ecilpse、Navicat、Maven 系统展示 系统功能结构图 登录界面 个人信息页面 用户打卡页面 扣…

Docker 入门篇(七)-- Docker 安装 nginx

引言 Docker 系列文章 Docker 入门篇(一)-- 简介与安装教程(Windows和Linux) Docker官方镜像 https://hub.docker.com/ 一、安装 nginx 1.安装环境 Linux 环境:centos 7docker 版本:26.1.0nginx版本&…

CTF-密码学基础

概述 密码学(Cryptolopy):是研究信息系统安全保密的科学 密码学研究的两个方向: 密码编码学(Cryptography):主要研究对信息进行编码,实现对信息的隐蔽密码分析学(Cryptanalytics):主要研究加密信息的破译或消息的伪造…

Baidu Comate——让软件研发更高效、更智能

个人名片: 😊作者简介:一名大二在校生 🤡 个人主页:坠入暮云间x 🐼座右铭:给自己一个梦想,给世界一个惊喜。 🎅**学习目标: 坚持每一次的学习打卡 文章目录 一、Baidu Co…

Spring 事务及事务传播机制(1)

目录 事务 回顾: 什么是事务 为什么需要事务 事务的操作 Spring事务的实现 Spring编程式事务(简单了解即可, 问就是基本不用) 观察事务提交 观察事务回滚 Spring声明式事务 Transactional Transactional作用 事务 回顾: 什么是事务 定义: 事务是指逻辑上的一组操作, 构…

最大数字——蓝桥杯十三届2022国赛大学B组真题

问题分析 这道题属于贪心加回溯。所有操作如果能使得高位的数字变大必定优先用在高位,因为对高位的影响永远大于对低位的影响。然后我们再来分析一下,如何使用这两种操作?对于加操作,如果能使这一位的数字加到9则变成9&#xff0…

^_^填坑备忘^_^C#自动化编程实现STK+Exata对卫星互联网星座进行网络仿真

C#实际选择 STK11版本 or STK12版本的问题备注。 【C#自动化客户端调用STK时,实际选择 STK11版本 or STK12版本 的调试运行备注】 以下代码“更新并重新打包备份为”〔testSTKQualNetInterface备份08.1_★避坑★【种子卫星:天线直接安装在卫星上&#…

电机控制系列模块解析(19)—— 反电势观测器

随着现代工业自动化技术的飞速发展,交流电机作为关键的动力装置,其控制精度与效率日益受到重视。其中,无位置传感器控制技术由于其成本低、可靠性高、系统简洁等优点,逐渐成为研究热点。本文将对交流电机反电势观测器这一关键技术…

三维空间刚体运动

三维空间刚体运动是指刚体在三维空间中的运动,这种运动由平移和旋转构成。平移是指物体在空间中沿某一方向移动一定的距离,而旋转则是指物体绕某一轴旋转一定的角度。这两种运动都不会改变物体的形状和大小,因此被称为刚体运动。 在描述三维…

Qt跨平台开发demo(适用萌新)

最近需要参与一款Qt跨平台的软件开发,在此之前,特把基础信息做学习和梳理,仅供参考。 所使用的技术和版本情况如下: 虚拟机:VMware 16.2.5操作系统:ubuntu-20.04.6-desktop-amd64:Mysql数据库…

大模型入坑记:搭建本地大模型微调环境

为了让大模型发挥更大用途,决定在本地搭建大模型微调环境,在原有的PC上加装Tesla V100,前前后后耗时一个多月,遇到若干技术问题,好在目前已基本得到解决,也打破了很多网上店家包括身边专家对GPU搭建上的一些…

正版软件 | Total Uninstall - Windows 全功能卸载程序 新手入门教程

『软件简介』 Total Uninstall 是一款先进的系统监控与卸载工具,它通过创建安装前后的系统快照,为用户提供了一种全新的程序管理方式。这款软件具备两个主要功能:一是能够独立于系统自带的卸载程序,彻底移除已安装的应用程序&…
最新文章