KAFKA中文官方文档提供十分全面的kafka详细知识,,kafka是用于构建实时数据管道和流应用程序。具有横向扩展,容错,wicked fast(变态快)等优点,并已在成千上万家公司运行。
目录
相关资料
入门
1 介绍
主题和日志
分布式
生产者
消费者
保证此处翻译偏差较大待重新翻译
2 使用案例
消息处理
网站活动跟踪
度量
日志收集
流处理
Event Sourcing
提交日志
3 快速开始
步骤1 下载代码
步骤2 启动服务
步骤3 创建一个主题
步骤4 发送消息
步骤5 启动消费者
步骤6 设置服务器集群
步骤7 使用kafka connect 导入导出数据
4 生态
5 版本升级
kafka 中文api内容
度量
kafka经常被用于处理监控数据。这涉及到从分布式应用收集统计数据,并且做为后续分析的一个统一的数据源。(即分布式统计数据查询入口或代理)
网站活动跟踪
kafka的原始用例(为此而生)是能重建一套可以实时发布,实时订阅消息,用于处理用户活动轨迹跟踪的管道。也就是说网站的活动(页面浏览、搜索、用户其它行为)可以按活动类型分别发布到各自的主题;这些订阅可以被用于后续各种用途:包括实时处理、实时监控、加载到Hadoop、离线数据仓库。
因为每个用户浏览页面都会产生活动消息,因此,活动跟踪数据量非常大。
∨ 展开