您好,欢迎来到华佗小知识。
搜索
您的当前位置:首页pentaho之kettle篇---kettle基本操作

pentaho之kettle篇---kettle基本操作

来源:华佗小知识
pentaho之kettle篇---kettle基本操作

今天先来做⼀个简单的kettle的例⼦。打开输⼊,选择CSV⽂件输⼊。

双击CSV⽂件输⼊图标,可以看见如下:

步骤名称:就是你这⼀步的名字,可以任意取,原则就是要明⽩,清楚这⼀步是做了什么操作。⽂件名:是你要选取的这个.CSV结尾的⽂件的名称。

列分隔符:每个CSV⽂件都是有⼀定的规则的,要么是分号是分隔符,要么是逗号是分隔符等等。

包含列头⾏:这个是针对你的这个CSV是否具有表头,如果有就勾上,否则他就把第⼀⾏的表头当成数据导⼊了。这样选择⼀个CSV格式的⽂件之后就可以了,接下来点击⼀下获取字段,得到如下图所⽰:点击⼀下预览,会提⽰要预览的⾏数没输⼊你要预览的⾏数就⾏了。以上就是预览的内容了。之后点击确定就OK了。之后再来说说输出的操作。

这次输出的操作我们选择的是MySQL数据库,⾸先需要⽂件---->新建------->数据库连接。

填写上基本的数据库信息就OK了,点击测试出现

说明你的连库信息是正确的,点击确定就可以了。这⼀步的连接数据库只是针对于这个装换的。对于其他转换我们需要重新制定数据库! 双击表输出:

数据库连接就是我们刚才创建的数据库连接,如果不是我们想要的,可以另外再创建⼀个连接。

⽬标数据库如果没有创建的话,我们可以先写⼀个名字,然后再点击SQL,就出现了⼀个执⾏创建的sql的界⾯:

⾥⾯有些字段的类型是可以改的,改成你需要的字段的类型。之后点击执⾏就⾏了。这⼀次我们再查看⼀下我们数据库⾥⾯的表,就有字段了。

下⾯我们点击Run,输出⽇志如下:步骤度量如下:

之前表⾥⾯有2823个数据,所以这⼀次执⾏成功了!但是

这⾥⾯有⼀个问题,我们可以再Run⼀下这个转换,发现⼜导⼊了2823条记录。再来看看数据库⾥⾯的数据:纳尼,怎么是56

怎么解决

这中间是需要⼀个过滤的操作的,基本的思想就是:ID⼀样的就是Update,ID不⼀样的就是插⼊就去就可以了。这就需要另外⼀个输出的功能了,就是插⼊/更新。在这⾥⾯设置需要过滤的条件就可以了。⾄此⼀个transformation就可以了。

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- huatuo0.cn 版权所有 湘ICP备2023017654号-2

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务