Comments (9)
数据迁移的中间可以做一些数据转化。
推荐你用开源的kettle,
- kettle 在转化中间写js脚本,可以转化字段名,过滤、映射字段,但没办法做reduce。
- kettle同时支持大部分数据源。
虽然kettle本身难用,考虑到用一次还是可以忍受的。
不建议用本项目,毕竟还不成熟,下一个版本就要把这个版本推倒重写。直到发布1.0版本,才可以被用到生产环境。
from dogetl.
@dogHere 您好,我想知道kettle如何加载到本地Eclipse啊。而且kettle逻辑太复杂了以至于我根本没有读懂他的代码。所以我想弄一个简单点的
from dogetl.
如果是用的话,没必要加载到Eclispse,要调试的话,可以试试mvn。我贴一下我的mvn配置给你:
<repositories>
<repository>
<id>pentaho-releases</id>
<url>http://repository.pentaho.org/artifactory/repo/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>pentaho-kettle</groupId>
<artifactId>kettle-core</artifactId>
<version>6.1.0.10-320</version>
</dependency>
<dependency>
<groupId>pentaho-kettle</groupId>
<artifactId>kettle-dbdialog</artifactId>
<version>6.1.0.10-320</version>
</dependency>
<dependency>
<groupId>pentaho-kettle</groupId>
<artifactId>kettle-engine</artifactId>
<version>6.1.0.10-320</version>
</dependency>
<dependency>
<groupId>pentaho-kettle</groupId>
<artifactId>kettle-ui-swt</artifactId>
<version>6.1.0.10-320</version>
</dependency>
</dependencies>
你还需要手动把下载的kettle解包,把其依赖的lib引入到Eclispse。
然后可以这样运行:
// org.pentaho.di.ui.spoon.Spoon.main(args); //带界面
org.pentaho.di.kitchen.Kitchen.main(args); //不带界面
要注意软件的版本哦,版本不对就运行不起来。
from dogetl.
kettle本身确实太复杂了。但是要用的话没必要去调试它的代码,实际上这样用就可以了:
kitchen.sh -rep=repo文件夹 -job=job名字
其中-rep
和 -job
可以用界面版自动生成,也可以手动配置,配置文件在~/.kettle/repositories.xml
.
from dogetl.
@dogHere okey我试试 我只需要按照你的mvn配置粘贴到我的pom.xml中就可以了么?那您的kettle版本是什么版本啊!
而且他是如何实现异构数据源数据类型统一的呢?
from dogetl.
如果利用kettle进行转换数据的话,你【不需要】调试kettle代码。只需了解下:
1.如何写一个kettle的job。这里有一个例子。
2.如何用kettle运行job,上面已经说过了。
至于kettle版本,请在这里选择6以上的任何一个。
题外话,不要试图得到一个直接的答案,慢慢来。
from dogetl.
@dogHere 受教了!非常感谢。我试试按照你的方法把kettle项目加载到我的项目上!!!
from dogetl.
@dogHere 除了数据转换还有一些其他的东西。我希望我的项目是一个整体。而直接用的话,就把项目分割开。觉得很别扭
from dogetl.
1.你可以写一些python脚本或者bash脚本,统一管理项目。
2.你可以调用kettle的api或者类库,集成到自己的项目去(前提很熟悉kettle)。
from dogetl.
Related Issues (1)
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from dogetl.