最近再学习spark streaming做实时计算这方面内容,过程中需要从后台数据库导出数据到hdfs中,经过调研发现需要使用sqoop进行操作,本次操作环境是Linux下。
首先确保环境安装了Hadoop和sqoop,安装只需要下载 ,解压 以及配置环境变量,这里不多说了,网上教程很多。
一、配置sqoop以及验证是否成功
切换到配置文件下:cd $SQOOP_HOME/conf
创建配置环境文件: cp sqoop-env-template.sh sqoop-env.sh
修改配置文件:conf/vi sqoop-env.sh:修改内容如下
配置完成后,执行命令sqoop-version ,检查是否成功,如图显示sqoop 1.4.7即成功。
二、添加postgresql驱动jar包
因为这里使用sqoop读取postgresql的数据,所以需要将数据库驱动包放到$SQOOP_HOME/lib 下即可 。
三、导入pg数据库中表到hdfs中
1、首先要启动Hadoop集群,不然会报错
执行语句 $HADOOP_HOME/sbin/./start-all.sh
2、执行sqoop语句进行数据导入到hdfs
sqoop import --connect jdbc:postgresql:localhost:5432/test(数据库的名称) --username postgres (填自己的数据库用户名) --password 888888 (填自己数据库的密码) --table company (自己创建表的名称) --m 1 (mapreduce的个数)
执行结果如图:
3、检查hdfs上是否成功存储到表数据
$HADOOP_HOME/bin hdfs dfs -cat /sqoop/part-m-00000(数据目录改成自己的)
结果如图所示:
显示使用sqoop 将 postgreql上的表格数据成功导入到hdfs中,这算今天也有点收获了!
补充:利用Sqoop从PostgreSQL导入数据时遇到的坑
sqoop import --connect "jdbc:postgresql://10.101.70.169:5432/db_name" --username "postgres" --password "123456" --table "test_user"--target-dir "/user/hive/warehouse/test.db/test_user" --fields-terminated-by '\t' --lines-terminated-by '\n' --hive-drop-import-delims --incremental lastmodified --merge-key id --check-column update_time --last-value "2019-03-25" --m 1 -- --schema "schema_name" --null-string '\\N' --null-non-string '\\N'
1、-- --schema
一定要放在后面,否则可能导致无运行日志或无法导入数据到指定目录且无法重新执行(报目录已存在)
2、PostgreSQL
须设置SET standard_conforming_strings = on;
,否则--null-string和--null-non-string
不起作用;
3、--null-string
和--null-non-string
放在-- --schema
后面,否则执行时报Can't parse input data: '\N'
以上为个人经验,希望能给大家一个参考,也希望大家多多支持。如有错误或未考虑完全的地方,望不吝赐教。
免责声明:本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除!
更新日志
- 黄乙玲1988-无稳定的爱心肝乱糟糟[日本东芝1M版][WAV+CUE]
- 群星《我们的歌第六季 第3期》[320K/MP3][70.68MB]
- 群星《我们的歌第六季 第3期》[FLAC/分轨][369.48MB]
- 群星《燃!沙排少女 影视原声带》[320K/MP3][175.61MB]
- 乱斗海盗瞎6胜卡组推荐一览 深暗领域乱斗海盗瞎卡组分享
- 炉石传说乱斗6胜卡组分享一览 深暗领域乱斗6胜卡组代码推荐
- 炉石传说乱斗本周卡组合集 乱斗模式卡组最新推荐
- 佟妍.2015-七窍玲珑心【万马旦】【WAV+CUE】
- 叶振棠陈晓慧.1986-龙的心·俘虏你(2006复黑限量版)【永恒】【WAV+CUE】
- 陈慧琳.1998-爱我不爱(国)【福茂】【WAV+CUE】
- 咪咕快游豪礼放送,百元京东卡、海量欢乐豆就在咪咕咪粉节!
- 双11百吋大屏焕新“热”,海信AI画质电视成最大赢家
- 海信电视E8N Ultra:真正的百吋,不止是大!
- 曾庆瑜1990-曾庆瑜历年精选[派森][WAV+CUE]
- 叶玉卿1999-深情之选[飞图][WAV+CUE]