当前位置：Gxlcms > mysql > ChukWa入门1

ChukWa入门1

时间：2021-07-01 10:21:17 帮助过：106人阅读

Chukwa 是什么？在印度神话中Chukwa是一只最古老的龟。它支撑着世界。在它的背上还支撑着一种叫做Maha-Pudma的大象，在大象的背上顶着这个地球。呵呵，大象？Hadoop？不难理解为什么在Hadoop中的这个子项目叫做Chukwa了，或许Chukwa的其中一位开发者是印度

Chukwa 是什么？
在印度神话中Chukwa是一只最古老的龟。它支撑着世界。在它的背上还支撑着一种叫做Maha-Pudma的大象，在大象的背上顶着这个地球。呵呵，大象？Hadoop？不难理解为什么在Hadoop中的这个子项目叫做Chukwa了，或许Chukwa的其中一位开发者是印度人？呵呵，我瞎猜的，神话中的Chukwa的，貌似是这样的，如图所示：

Chukwa是由Yahoo贡献，基于Hadoop的大集群监控系统，可以用他来分析和收集系统中的数据(日志)。Chukwa运行HDFS中存储数据的收集器和MapReduce框架之上，并继承了Hadoop的可扩展性和鲁棒性， Chukwa使用MapReduce来生成报告，他还包括一个用于监测和分析结果显示的web-portal工具，通过web-portal工具使这个收集数据的更佳具有灵活性，这点有点像是类似 linux工具，例如：awk 。这几乎是一个日志处理/分析的full stack solution，国内用hadoop做日志分析的，或者将要做日志分析的可以关注下。

搭建、运行Chukwa要在Linux环境下，要安装MySQL数据库，在Chukwa/conf目录中有2个SQL脚本 aggregator.sql、database_create_tables.sq l 导入MySQL数据库，此外还要有Hadoo的HDSF运行环境，Chukwa的整个系统架构如图所示：

Chukwa 由哪几个组件组成的？
Chukwa是Yahoo开发的Hadoop之上的数据采集/分析框架，主要用于日志采集/分析。该框架提供了采集数据的Agent，由Agent采集数据通过HTTP发送数据给Cluster的Collector，collector把数据sink进Hadoop，然后通过定期运行Map reducer来分析数据，将结果呈现给用户。
Chukwa 有以下4个主要的组成部分:
Agent 收集各服务器的数据
Collectors 接收agent的数据;并写进存储
MapReduce jobs 归档数据
HICC 就是 Hadoop Infrastructure Care Center的四个英文单词的缩写，简单来说是个Web工程用于ChukWa的内容展示。

几个部件大致的处理流程如下：

在这个Blog中后续会对ChukWa有进一步的描述，再次感谢你的阅读。

–end–

原文地址：ChukWa入门1, 感谢原作者分享。

ChukWa入门1

人气教程排行