实时平台-Flink篇

Flink任务统一通过实时平台统一管理的好处不用多说,这里简单介绍下实时平台-Flink模块的功能以及实现。

主要分为两大块

一、任务管理

任务管理主要包括任务的提交、暂停、下线、重启、历史版本回滚、checkpoint/savepoint管理、监控信息以及任务自动拉起等功能。运行的每个任务信息(AppId,JobId等)都会被保存起来,所以,任务重启的时候可以很轻松的根据自己的业务需求选择从哪个任务的哪个CheckPoint开始启动。

二、任务保障

任务保障主要从三个方面入手

1.Flink应用程序日志

从事过Java应用开发的人员一定知道,应用中的日志对于任务运行状况、错误排查有着至关重要的作用,对于Flink分布式应用来说,如果能将日志和Java应用一样输出,那绝对可以减少很多排查问题的时间和缩短获取任务异常的时间,具体实现可以参考这篇文章

2.监控Kafka Group Lag和Status

大部分应用都是消费Kafka消息,对于消费组的堆积情况和运行状况预警是很有必要的,这里开发人员可以根据Topic的QPS和CheckPoint时间进行预估两次提交大概会有多大的Lag,然后进行设置Lag超过多大的阈值进行企微和邮件告警,必要的可以电话告警,主要分为信息的采集和平台告警两部分,具体实现可以参考这篇文章

3.Flink任务监控信息

主要是通过Flink自带的Metrics系统将信息写入到Influxdb,如何配置可以参考 这篇文章

原文地址:https://www.cnblogs.com/createweb/p/12218922.html

时间: 2024-08-11 16:37:34

实时平台-Flink篇的相关文章

从零开始打造 Mock 平台 - 核心篇

前言 最近一直在捣鼓毕设,准备做的是一个基于前后端开发的Mock平台,前期花了很多时间完成了功能模块的交互.现在进度推到如何设计核心功能,也就是Mock数据的解析. 根据之前的需求设定加上一些思考,用户可以像写json一般轻松完成数据的mock,也可以通过在mock数据模型之上进行构建出复杂的数据模型并在项目中引用. 这看似简单的需求其实需要处理几个不同的模块功能以及交互设计.该如何处理解析不同mock数据并进行构造?前端交互中模拟数据该如何处理?数据构造时如何加载用户设定的数据模型?错误捕捉与

百度地图云麻点之批量上传、实时显示数据篇

上篇博文你可能用到的百度地图效果(付源码)介绍了几个比较实用的百度地图特效,其中重点介绍了海量数据上传及响应的问题,前端展示可以通过LBS云麻点来展示,通过这个可以解决批量数据Marker响应特慢的性能问题.首先在百度云服务器上建完表之后,我们可以通过后台的管理平台直接把数据传上去,作为我们的初始数据.这部分数据有了之后,接下来要做的就是想办法手动同步数据,更智能一点就是实时同步数据,接下来就带你一步步实现这个过程. 这次在正文开始之前,我想先做一次吐槽君.最近压力有点儿大,先来发一下牢骚.三人

【VMCloud云平台进阶篇】Monitor监控(一)

终于到了这一篇,从数据层到应用层都是完全基于QCloud平台优化,完全将微软系应用架构搬到了国内云平台上,也算是国内第一例了. 牛皮吹完,说说正事儿,QCloud的监控虽然看起来非常"丰富": 而且似乎没有统一的监控界面: 但实际上能够支持Windows企业级应用(前几篇构建的应用架构已经属于典型的传统应用,重数据层.重应用层),比如iis上的.net缓冲池.错误连接等,所以能够深入以业务级别来监控还需要专业的监控,而目前来说Windows方面最最专业的肯定不是Zabbix(至少开发成

微信第三方平台开头篇--MVC代码(第三方获取ticket和公众号授权)

微信公众号授权给开放平台 公众号授权给第三方平台的技术实现流程比较简单 这个步骤遗漏了开头获取第三方平台自己的accessToken 先说下流程 如何注册开放平台的第三方信息看截图 其他不说了,此文只说代码部分. 先获取第三方10分一次的ticket. 1 using (var streamReader = new StreamReader(Request.InputStream)) 2 { 3 string stringInput = streamReader.ReadToEnd(); 4 s

开发平台介绍篇

一.前言   我们的网址:www.sdpsoft.com 在企业间的商业竞争越来越激烈的今天,如何快速实现客户需求,如何快速便捷的开发.修改.更新.维护软件项目系统功能,如何降低软件研发的成本,如何降低公司人员流动对软件开发项目造成的影响.如何提高团队开发效率.如何降低开发人员的技术水平要求.如何缩短开发周期.如何同时开发多个项目等等,在此目标基础上我公司研发了软件快速开发平台(Software Rapid Development Platform)工具,简称SDP.通过软件快速平台能快速便捷的

GIS+=地理信息+行业+大数据——基于云环境流处理平台下的实时交通创新型app

应用程序已经是近代的一个最重要的IT创新.应用程序是连接用户和数据之间的桥梁,提供即时訪问信息是最方便且呈现的方式也是easy理解的和令人惬意的. 然而,app开发人员.尤其是后端平台能力,一直在努力跟上用户的期望.记得第一次基于WAP技术的移动互联网的日子吗?过度炒作和预期不匹配的教训. 36大数据专稿,原文作者:Ronnie Beggs,  本文由36大数据翻译组-张小顺翻译向36大数据投稿,并授权36大数据独家公布.不论什么不表明来源于36大数据和译者的转载均为侵权. 在已经收录的app应

用好Lua+Unity,让万金6.0平台搭建性能飞起来——Lua与C#交互篇

前言万金6.0平台搭建论坛:haozbbs.com Q1446595067 在看了uwa之前发布的<Unity项目常见Lua解决方案性能比较>,决定动手写一篇关于lua+unity方案的性能优化文.整合lua是目前最强大的unity热更新方案,毕竟这是唯一可以支持ios热更新的办法.然而作为一个重度ulua用户,我们踩过了很多的坑才将ulua上升到一个可以在项目中大规模使用的状态.事实上即使到现在lua+unity的方案仍不能轻易的说可以肆意使用,要用好,你需要知道很多.因此,这篇文章是从一堆

可以穿梭时空的实时计算框架——Flink对时间的处理

Flink对于流处理架构的意义十分重要,Kafka让消息具有了持久化的能力,而处理数据,甚至穿越时间的能力都要靠Flink来完成. 在Streaming-大数据的未来一文中我们知道,对于流式处理最重要的两件事,正确性,时间推理工具.而Flink对两者都有非常好的支持. Flink对于正确性的保证 对于连续的事件流数据,由于我们处理时可能有事件暂未到达,可能导致数据的正确性受到影响,现在采取的普遍做法的通过高延迟的离线计算保证正确性,但是也牺牲了低延迟. Flink的正确性体现在计算窗口的定义符合

社区活动 | Apache Flink 1.9 版本即将发布,新版本有哪些新特性?

6 月 29 号,Apache Flink 社区 Meetup 北京站即将到来,此次 Meetup 一如既往地邀请了社区多位 Flink 技术专家现场分享.伴随着 Apache Flink 1.9 版本发布日期临近,大家对 Apache Flink 1.9 版本有哪些新特性都十分好奇,本次 Meetup 特邀 Apache Flink PMC 与阿里巴巴.快手的技术专家为你解读新特性.分享 Flink 的应用与实践. 活动流程 演讲主题及嘉宾介绍 < Apache Flink 1.9 特性解读>