发布于：2020-03-02

文一明分布式 / 计算13 分钟读完 (大约 1905 个字)

Flink源码分析-Watermark

简介

窗口机制是Flink流处理的核心，它将无限的流元素分割成有限的窗口。当一个窗口不再增加新元素时，就可以对这个窗口中的所有元素执行计算逻辑。而判断窗口不会再增加新元素的方式有：时间（Watermark）、计数、自定义。其中Watermark代表事件发生时的时间戳或者Flink收到事件时的时间戳。

发布于：2019-12-23

文一明分布式2 分钟读完 (大约 373 个字)

Flink-异步operator

当某个operator执行需要很长时间的话，使用异步操作对吞吐量的提升非常有帮助。

发布于：2019-12-09

文一明分布式 / 计算3 分钟读完 (大约 465 个字)

Flink源码分析-任务部署

Flink Job有三种部署模式：

LAZY_FROM_SOURCES 仅当Task的上游都产生数据之后，才会真正的部署Task。
LAZY_FROM_SOURCES_WITH_BATCH_SLOT_REQUEST 与LAZY_FROM_SOURCES逻辑基本一致。不同的是在申请Slot的时候有超时时间限制。
EAGER ExecutionGraph在被调度时会将所有Task一次性到各个TaskManager。

发布于：2019-12-04

文一明分布式 / 计算9 分钟读完 (大约 1308 个字)

Flink源码分析-集群部署

分析Flink程序的启动过程，有助于理解和把握Flink是如何启动程序，集群和单机运行的区别，当出错时如何恢复重启，如何分配资源。

Demo

先看一个简单的stream demo

发布于：2019-12-03

文一明分布式 / 计算1 分钟读完 (大约 193 个字)

Flink源码分析- 高可用

心跳

ResourceManager，TaskManager，JobManager会通过心跳来监测相互之间的状态

高可用服务

Leader选举和提取。只有配置了Zookeeper才是真正的高可用

发布于：2019-12-02

文一明分布式 / 计算6 分钟读完 (大约 872 个字)

Flink源码分析-State

Flink中的容错，一致性语义都是靠State来实现的。

State需要结合Checkpoint，Snapshot才能发挥作用。

State 可以按照维度进行划分：

类型：

Keyed State
Operator

数据组织格式：

Managed (List Value Map)
Raw (用户自定义的格式)

发布于：2019-11-29

文一明分布式 / 计算1 分钟读完 (大约 211 个字)

Flink源码分析-Graph

Flink以DAG的方式来执行程序，它会根据用户的代码生成三个Graph，但我认为实际上还有一个Graph，就是用户的程序直接映射出来的。

Plan ProgramGraph
StreamGraph
JobGraph
ExecutionGraph

发布于：2019-11-27

文一明分布式 / 计算8 分钟读完 (大约 1228 个字)

Flink源码分析-Checkpoint

Keyword

Checkpoint
Snapshot
Barrier
State
Savepoint

CheckpointCoordinator定时checkpoint

CheckpointCoordinator会启动一个定时任务触发checkpoint

发布于：2019-11-26

文一明分布式 / 计算4 分钟读完 (大约 558 个字)

Flink源码分析-窗口

窗口机制是Flink流处理的核心，它将无限元素的流分割成有限元素的集合（窗口）。当一个窗口不再增加新元素时，就可以对这个窗口中的所有元素执行计算逻辑。

发布于：2019-11-21

文一明分布式 / 计算3 分钟读完 (大约 400 个字)

Flink源码分析-数据流转

将一条消息从被Flink job消费到最后被sink下来的整个过程划分成两部分，算子的逻辑处理、task之间的消息传递。其中算子的逻辑处理需要用户参与，task之间的消息传递一般是不需要用户参与的，但是了解其实现过程，对理解Flink的原理是非常有帮助的。