简述分布式跟踪系统实现原理

问题来源

互联网项目通常都是大用户量，大并发，因此从技术架构上大多采用分布式架构构建成大型分布式系统，SOA或者是微服务，一个请求涉及到多个子系统，如果某个请求的处理不正常，怎么排查定位问题呢？如果没有合适的手段，排查问题无异大海捞针，为了提高解决问题的效率，迫切需要有一个技术手段能跟踪整个处理环节，并能够快速定位。一种可行的方案就是跟踪这个调用链，把每次请求的完整处理环节串联起来，这样就可以实现对调用路径的全程监控。

技术实现要点

采用日志埋点技术，在请求的处理入口处为该次请求分配一个TraceId(跟踪Id)，将此TraceId依次传递给下一个处理环节，在每一个处理环节记录日志，通过这个TraceId就可以查询到从起始到处理完毕整个处理路径中的日志信息。

埋点日志记录的内容

TraceId、RPCId、调用的开始时间，调用类型，协议类型，调用方ip和端口，请求的服务名等信息；

调用耗时，调用结果，异常信息，消息报文等；

预留可扩展字段，为将来的扩展做预留；

记录内容可以根据业务的需要详细设计，原则就是要方便将来排查定位问题。

收集查询的实现

把埋点日志数据收集起来，再搭建一个查询系统就可以方便定位问题了，简单的查询分析系统可以采用ELK(Elasticsearch + Logstash + Kibana)来搭建。

参考文献，谷歌的Dapper论文：https://bigbully.github.io/Dapper-translation

原文地址：https://www.cnblogs.com/aiandbigdata/p/10046983.html

时间： 2024-10-23 09:14:35

简述分布式跟踪系统实现原理的相关文章

基于SkyWalking的分布式跟踪系统 - 微服务监控

上一篇文章我们搭建了基于SkyWalking分布式跟踪环境,今天聊聊使用SkyWalking监控我们的微服务(DUBBO) 服务案例假设你有个订单微服务,包含以下组件 MySQL数据库分表分库(2台) 生产者(2台) dubbo-provider 消费者 dubbo-consumer 网络拓扑图如下生产者的关键代码 @Service public class OrderServiceImpl implements OrderService { @Autowired protected Ord

微服务之分布式跟踪系统（springboot+zipkin）

微服务之分布式跟踪系统(springboot+zipkin) 一.zipkin是什么 zipkin是一个开放源代码分布式的跟踪系统,由Twitter公司开源,它致力于收集服务的定时数据,以解决微服务架构中的延迟问题,包括数据的收集.存储.查找和展现.它的理论模型来自于Google Dapper 论文. 每个服务向zipkin报告计时数据,zipkin会根据调用关系通过Zipkin UI生成依赖关系图,显示了多少跟踪请求通过每个服务,该系统让开发者可通过一个 Web 前端轻松的收集和分析数据,例如

基于SkyWalking的分布式跟踪系统 - 异常告警

通过前面2篇文章我们搭建了SW的基础环境,监控了微服务,能了解所有服务的运行情况.但是当出现服务响应慢,接口耗时严重时我们需要立即定位到问题,这就需要我们今天的主角--监控告警,同时此篇也是SW系列的最后一篇. UI参数首先我们认识一下SW DashBoard上的几个关键参数,如下图所示告警配置告警流程 skywalking发送告警的基本原理是每隔一段时间轮询skywalking-collector收集到的链路追踪的数据,再根据所配置的告警规则(如服务响应时间.服务响应时间百分比)等,如果

设计和应用分布式调用跟踪系统

分布式追踪系统dapper 分布式调用跟踪系统的设计和应用 >>为什么需要分布式调用跟踪系统随着分布式服务架构的流行,特别是微服务等设计理念在系统中的应用,业务的调用链越来越复杂, 可以看到,随着服务的拆分,系统的模块变得越来越多,不同的模块可能由不同的团队维护, 一个请求可能会涉及到几十个服务的协同处理, 牵扯到多个团队的业务系统,那么如何快速准确的定位到线上故障?同时,缺乏一个自上而下全局的调用id,如何有效的进行相关的数据分析工作? 对于大型网站系统,如淘宝.京东等电商网站,这些问题尤

分布式服务跟踪系统

一个分布式服务跟踪系统主要由三部分构成: 数据收集数据存储数据展示根据系统大小不同,每一部分的结构又有一定变化.譬如,对于大规模分布式系统,数据存储可分为实时数据和全量数据两部分,实时数据用于故障排查(Trouble Shooting),全量数据用于系统优化:数据收集除了支持平台无关和开发语言无关系统的数据收集,还包括异步数据收集(需要跟踪队列中的消息,保证调用的连贯性),以及确保更小的侵入性:数据展示又涉及到数据挖掘和分析.虽然每一部分都可能变得很复杂,但基本原理都类似. 服务追踪的追踪

Dapper，大规模分布式系统的跟踪系统--转

原文地址:http://bigbully.github.io/Dapper-translation/ 概述当代的互联网的服务,通常都是用复杂的.大规模分布式集群来实现的.互联网应用构建在不同的软件模块集上,这些软件模块,有可能是由不同的团队开发.可能使用不同的编程语言来实现.有可能布在了几千台服务器,横跨多个不同的数据中心.因此,就需要一些可以帮助理解系统行为.用于分析性能问题的工具. Dapper--Google生产环境下的分布式跟踪系统,应运而生.那么我们就来介绍一个大规模集群的跟踪系统,

分布式调用跟踪系统的设计和应用

分布式调用跟踪系统的设计和应用 https://www.cnblogs.com/binyue/p/5703812.html 淘宝的鹰眼 google的Drapper Twitter的zipkin 新浪的watchman 京东的hydra 原文地址:https://www.cnblogs.com/stono/p/9454912.html

【架构设计】分布式文件系统 FastDFS的原理和安装使用

本文地址分享提纲: 1.概述 2. 原理 3. 安装 4. 使用 5. 参考文档 1. 概述 1.1)[常见文件系统] Google了一下,流行的开源分布式文件系统有很多,介绍如下: -- mogileFS:Key-Value型元文件系统,不支持FUSE,应用程序访问它时需要API,主要用在web领域处理海量小图片,效率相比mooseFS高很多. -- fastDFS:国人余庆老师(GitHub)在mogileFS的基础上进行改进的key-value型文件系统,同样不支持FUSE,提供比mo

kafka--高性能的分布式消息系统

kafka是一个分布式的,高吞吐量的.信息分片存储,消息同步复制的开源消息服务,它提供了消息系统的功能,但是采用了独特的设计. kafka最初由LinkedIn设计开发,使用Scala语言编写,用作LinkedIn网站的活动流数据和运营数据处理工具,这其中活动流数据是指页面访问量.被查看内容方面的信息以及搜索情况等内容,运营数据是指服务器的性能数据(CPU.IO使用率.请求时间.服务日志等数据). 现在kafka已被多家不同类型的公司采用,作为其内部各种数据的处理工具或消息队列服务.如今kafk

猜你喜欢

mapreduce工作原理

转自:http://www.cnblogs.com/z1987/p/5055565.html MapReduce模型主要包含Mapper类和Reducer类两个抽象类.Mapper类主要负责对数据的分 ...

hzau 1206 MathematicalGame

1206: MathematicalGame Time Limit: 2 Sec Memory Limit: 1280 MBSubmit: 124 Solved: 15[Submit][Statu ...

作用域的理解--第一篇

浏览器: “JS解析器” 1)JS 的预解析 “找一些东西” :var function 参数 a = ... 所有的变量,在正式运行代码之前,都提前赋了一个值:未定义 fn1 = functio ...

C语言--getchar()的使用

问题: 编写一个程序,可以一直接收键盘字符, 如果是小写字符就输出对应的大写字符,如果接收的是大写字符,就输出对应的小写字符,如果是数字不输出 #include<stdio.h> int ...

操作系统页面置换算法(opt,lru,fifo,clock)实现

#include <iostream> #include<map> #include<set> #include <algorithm> #includ ...

Solr4.8.0源码分析(7)之Solr SPI

Solr4.8.0源码分析(7)之Solr SPI 查看Solr源码时候会发现,每一个package都会由对应的resources. 如下图所示: 一时对这玩意好奇了,看了文档以后才发现,这个serv ...

【Q2D】如何导出自定义C++类给框架使用

本文基于Quick cocos2d x这个游戏框架,为了行文流畅,后面都简称Q2D 导出自定义c++类给项目使用已经有了现成的例子了详见:http://quick.cocos.org/?p=235 ...

docker连接

Docker连接容器构建镜像模板 1) 创建一个sshd_dockerfile工作目录 [[email protected] ~]# mkdir sshd_dockerfile [[email pr ...

Python标准库：内置函数complex([real[, imag]])

本函数能够使用參数real + imag*j方式创建一个复数.也能够转换一个字符串的数字为复数:或者转换一个数字为复数.假设第一个參数是字符串,第二个參数不用填写.会解释这个字符串且返回复数.只是,第 ...

信息传递

原先t了很长时间,今天复习了下tarjan,打了一遍,自认为自己的tarjan模板简洁这道题只有基环树,所以tarjan就可以了 #include<iostream> #include& ...

自然语言处理3.4——使用正则表达式检测词组搭配

许多语言处理任务都涉及模式匹配.以前我们使用‘stsrtswith(str)’或者‘endswith(str)’来寻找特定的单词.但是下面引入正则表达式,正则表达式是一个强大的模块,他不属于哪一种特定 ...

超级密码(bfs)

超级密码 Time Limit : 20000/10000ms (Java/Other) Memory Limit : 65536/32768K (Java/Other) Total Submis ...

HDU5120 Intersection 【求圆的面积交】

Intersection Time Limit: 4000/4000 MS (Java/Others) Memory Limit: 512000/512000 K (Java/Others) T ...

Python Day14(HTML)

一.概述 1.简介 HTML是英文Hyper Text Mark-up Language(超文本标记语言)的缩写,他是一种制作万维网页面标准语言(标记).相当于定义统一的一套规则,大家都来遵守他,这样 ...

Chrome浏览器您的连接不是私密连接

对于谷歌浏览器,使用过一段时间,因为想每次打开时都是某个网站,所以对其进行了设置,如下图所示. 因为连接的校园网,每次上网的时候都需要进行账号登录.问题来了,每次用谷歌浏览器打开都会在提示网上搜了一 ...

[虚拟化嵌套一]ESXI中嵌套ESXI

虚拟化嵌套:顾名思义就是在虚拟化环境中在嵌套一层虚拟化. 需求:因为资源的限制,我们可能没有那么多ESXI主机给自己实验,如果一个人在做实验了.其他的人就不能共同实验了.但是单台的资源却是比较多!! ...

行验证方法失败

行 3 错误 - 对于 PoEvaRiskAM.CuxOperateRiskEvaDefineVO1 中关键字为 oracle.jbo.Key[31 ] 的行,行验证方法失败. 此错误是由于在行验证中 ...

unity3d android开发笔记之空气墙的实现

通过做unity3d的demo,我发现了一些小问题,并且解决了不少,遇到的问题我没有及时记录下来,以后我会通过随笔的方式记录下我的成长经历,在这里先缅怀下我逝去的时光.T.T.. However,从今 ...

泰國副總理爆料中國船員被屠殺案驚人內幕

9月5日,一年一度的中国企业500强的评选结果在浙江杭州出炉,中石化以1.46万亿元的营业收入连续第五年位列榜首.今年中国企业500强的营业收入总额达到26.0万亿元,入围门槛从上年的93.1亿上升为 ...

Android APP应用开发视频教程

课程概述:零基础3G Android移动开发就业班.共包括10多个精品Android实战项目,课程囊括Andriod所以技术点,是目前国内讲解最全面的android课程,通过该课程的学习,学员可在最短 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.020 s.