Tag: 大数据

大数据相关工具

wiflish | 开源, 技术 | 2014-06-05
Apache hadoop,分布式计算的基础平台; Apache Spark,轻量级,高性能的集群计算平台; data-integration(kettle),ETL工具; Apache Flume,收集、聚合、移动大量日志数据的服务器,提供分布式、可靠、高可用的日志服务; Apache Sqoop,hadoop与关系型数据库(Mysql,Oracle等)的数据相互转移的工具; Apache Storm,分布式实时计算系统; Apac... [阅读全文]

ETL工具 – Data Integration

wiflish | 开源, 技术, 软件 | 2014-06-05
ETL工具 – Data Integration
Kettle是一款国外开源的etl工具,已更名为:Data Integration,纯java编写,绿色无需安装,数据抽取高效稳定(数据迁移工具)。Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。 [阅读全文]
Ɣ回顶部