1 / 14
文档名称:

自己总结的Kettle使用方法和成果.docx

格式:docx   大小:406KB   页数:14页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

自己总结的Kettle使用方法和成果.docx

上传人:niupai11 2022/6/20 文件大小:406 KB

下载得到文件列表

自己总结的Kettle使用方法和成果.docx

相关文档

文档介绍

文档介绍:KETTLE使用自己总结的Kettle使用方法和成果说明
简介
Kettle 是一款国外开源的 ETL 工具,纯 java 编写,可以在 Window、Linux、 Unix 上运行,绿色无需安装,数据抽取高效稳定。
Kettle 中ysqI - conne-ctar-java --bin,ji3『 2044/7/22 Exucut臼 bl亡 Jssr Fil= 947 KB |
注:在转换之前需要创建转换所需的表,原始表和转换的目标表。
点击“核心对象”标签页中的“输入”,选择“表输入”拖到“转换”区域。 双击“表输入”图标弹出表输入对话框,填入步骤名称,选择数据库连接, 点击“获取SQL查询语句”,或者直接写入SQL语句,填写附件信息,点击“预 览”按钮查看执行结果,没有错误,点击“确认”关闭对话框。
KD£ USER INFO
Wizard ..
SQL
SZLECT
STiRT_TIME
,IMSI
MA-ADK
,IMEI
.IMEI_T¥PE NA1IE F}?OM KDE USER ZNFO
链午简島转换□ 替姿SQL语句里为变量□
召 Help
鯉Q)
预删
恥肖⑹
点击“核心对象”一“输出”,选择Excel输出”拖入到转换区,双击Excel 输出图标,弹出对话框,选择文件名和其它附加参数,点击确认。
Excel 输!±1
文件 内客梧式宇段
ExcelSltzl
|G:\ ① 浏览⑹…
创建曼目录口 启动时不创逮文件□
扩恳空xls
眨舲里包醪鬃? □ 在文件名里包含日期? 口 在文件窖里包含时间7□
指走时间格式0 时同格式
点击输入表的图标,同时按下shift键,再点击输出文件,将两者连接起来。 然后双击 Excel 输出进行配置。
KD5_U5ERJNFQ
-B
Escel^j 出
最后一步就是执行 kettle 脚本,点击工具栏上的绿色箭头即可。
vflfefchH
置 4 ^S#S2. 我WS
t±s*=5 a
*■ |打口底蓉韦
P^rAnt Job Fih 匚心*皿 l
Parent Job FiIhob™
Parent Job Name
Parent Job 叱购£*呵 Direttar^
呼孚吕陌丈牛逸 皈刻0£器
-iaCif^ci:^ IniH-rnalJab hiam* Inl^
屢轴3战仔
C餾hE
起哥E!
fi^Snirym/MM/dd hhee;词
匚熬玮封试
I孑 Galhef perFuMn^nce metni:5
Clear the log beFore eweciition
点击“启动”开始转换,在转换过程中会出现转换的信息,如下图所示。
KDi_U^EPJMFO 3弱醸出
拇行结锂
笹 拥皿5更|0日古囱 凱《金\马tae田 WMwrifi Pmi«* data
腳话 >4 廿 &=——:
旦= 走追 惜谭肩 加 通険爆迅环7 叶如a
C 0 10329 IOB3C 0
WnEStd Q 1&209 15209 D 16209
a a o 在运■厅 馄皓1 Q/Uza
0 0 0 ffiErr 1.* 12Q42 12M
完成转换后,我们可以 Excel 输出目录中查看转换结果。
注:时间字段换到 Excel 为空,修改 SELECT 语句中使用 TO_CHAR 转换成字
符串,例如:
TO_CHAR(START_TIME,
'yyyy-mm-dd HH24:MM:SS') AS START_TIME
注:ExceI中的记录不能超过65535条,否则会自动关闭文件,导致转换失败。
■:
1214A
12139
D
1213D
D
D
a
ffi*
BS^

FWarvW 阳關0
上面是一个简单的数据迁徙脚本,从数据库导出数据到EXCEL文件中。
Kettle 处理 HBase
本教程使用的软件版本信息如下:
1)Hadoop()
2)Pantaho Data Integration()
3)HBase()。
Pentaho Shim (社区版)目前支持的Hadoop版本:
Apache
Versi