大数据相关工具

作者: wiflish 分类: 开源, 技术 发布时间: 2014-06-05 21:03 ė 6没有评论

  1. Apache hadoop,分布式计算的基础平台;
  2. Apache Spark,轻量级,高性能的集群计算平台;
  3. data-integration(kettle),ETL工具;
  4. Apache Flume,收集、聚合、移动大量日志数据的服务器,提供分布式、可靠、高可用的日志服务;
  5. Apache Sqoop,hadoop与关系型数据库(Mysql,Oracle等)的数据相互转移的工具;
  6. Apache Storm,分布式实时计算系统;
  7. Apache Zookeeper,分布式协调系统,提供的功能包括:配置维护、名字服务、分布式同步、组服务等
  8. Apache Kafka,分布式发布订阅消息系统;
  9. Apache Mahout,可伸缩的机器学习算法库;

 

本文出自 Wiflish's Blog,转载时请注明出处及相应链接。

本文永久链接: http://wiflish.fyard.com/archives/232

发表评论

电子邮件地址不会被公开。 必填项已用*标注

您可以使用这些HTML标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Ɣ回顶部