【大数据面试】【框架】Flume:Source的断点续传、重复数据、Channel选择-CSDN博客

网站介绍:〇、用途流式结构获取磁盘日志,拦截器过滤后,传递指定数据,写入HDFS或kafka一、组成-Source、Channel、Sink事务(put/take)1、Source---taildir source:(1)特点:断点续传+多目录(维护offset)产生自哪个版本-Apache Flume1.7,CDH 1.6(2)没有断点续传功能时如何使用?自定义方式实现(3)tai..._flume怎么解决重复数据