网站介绍:〇、用途流式结构获取磁盘日志,拦截器过滤后,传递指定数据,写入HDFS或kafka一、组成-Source、Channel、Sink事务(put/take)1、Source---taildir source:(1)特点:断点续传+多目录(维护offset)产生自哪个版本-Apache Flume1.7,CDH 1.6(2)没有断点续传功能时如何使用?自定义方式实现(3)tai..._flume怎么解决重复数据
- 链接地址:https://blog.csdn.net/USTSD/article/details/125518423
- 链接标题:【大数据面试】【框架】Flume:Source的断点续传、重复数据、Channel选择-CSDN博客
- 所属网站:blog.csdn.net
- 被收藏次数:411
- 网站标签:flume怎么解决重复数据