顶级Apache Kafka术语和概念

1.卡夫卡术语

基本上,Kafka架构  包含很少的关键术语,如主题,制作人,消费者, 经纪人等等。要详细了解Apache Kafka,我们必须首先理解这些关键术语。因此,在本文“Kafka术语”中,我们将学习所有这些Kafka术语,这将有助于我们建立Kafka知识的坚实基础。
那么,让我们从Apache Kafka术语开始。

Apache Kafka术语和概念

2.卡夫卡术语清单

在这篇Apache Kafka教程中,下面列出了最突出的Kafka术语,这些术语可以帮助我们建立Kafka知识的坚实基础。

一世。卡夫卡经纪人

Apache Kafka集群中有一个或多个服务器,基本上,这些服务器(每个)都是我们称之为代理的服务器

II。卡夫卡话题

基本上,Kafka维护类别中的消息提要。并且,消息存储以及发布在我们称之为主题的类别/提要名称中。此外,所有Kafka消息通常都被组织成Kafka主题。
阅读Apache Kafka用例| 卡夫卡应用程序

III。卡夫卡分区

在Kafka的每个代理中,都有一些分区。Kafka中的这些Kafka分区既可以是主题的领导者,也可以是主题的副本。因此,在定义领导者时,它负责对主题的所有写入和读取,而如果领导者以某种方式失败,则副本将接管新的领导者。

IV。卡夫卡制片人

简单来说,向Kafka发布消息的过程就是我们所说的Producers。此外,它还发布有关其选择主题的数据。

v。卡夫卡消费者

订阅主题和流程以及阅读已发布消息的订阅源的流程就是我们所说的消费者

六。卡夫卡的抵消

消费者在日志中的位置以及按消费者保留的位置就是我们所说的Offset。而且,我们可以说它是每个消费者保留的唯一元数据。

七。卡夫卡消费者集团

基本上,Kafka提供的消费者抽象概括了排队和发布订阅的传统消息模型,我们称之为消费者群体。但是,使用消费者群体名称,消费者可以标记自己。
让我们修改Apache Kafka Workflow | Kafka Pub-Sub Messaging

八。Kafka Log Anatomy

日志与查看分区的另一种方式完全不同。基本上,数据源将消息写入日志。此外,一个或多个消费者在他们想要的任何时间从日志中读取该数据。让我们用图表来理解它,这里消费者A和B正在读取一个数据源,该数据源写入日志并从日志中写入不同的偏移量。

卡夫卡的日志解剖

九。Kafka消息订购和客户致谢

在Kafka中,从某个分区传递的消息的顺序和分区接收的消息是相同的。

X。卡夫卡节点

在Apache Kafka集群中,节点是一台计算机。

十一。卡夫卡集群

为实现共同目的而共同行动的一组计算机就是我们所说的集群。在Kafka中,它具有相同的含义,即一组计算机,每个计算机都有一个Kafka经纪人实例。
探索卡夫卡的优势与劣势

十二。 卡夫卡复制品

这里,单词副本指的是备份。这意味着分区的副本是分区的“备份”。基本上,我们使用副本以防止数据丢失,他们从不读取或写入数据。

十三。卡夫卡消息

在一行中,Kafka中的消息是通过Apache Kafka从生产者传递给消费者的信息。

十四。卡夫卡领袖

负责给定分区的所有读写的节点就是我们所说的Kafka Leader。因此,每个分区都包含一个服务器,它充当领导者。

十五。卡夫卡的追随者

简单地说,遵循领导者指令的节点就是我们所说的追随者。追随者的基本用法是,如果任何领导者失败,这些追随者中的任何一个将自动成为新的领导者。但是,它作为普通消费者播放,它会提取消息并更新自己的数据存储。
让我们用命令学习Apache Kafka Operations

十六。卡夫卡数据日志

消息通过Kafka保存,特别是在相当长的时间内。这意味着消费者可以根据自己的方便阅读。由于Kafka被配置为将消息保持24小时,但消费者在某种程度上停留的时间超过24小时,在这种情况下,消费者将丢失消息。尽管如此,只有当部分消费者的停机时间仅为60分钟时,才能从上次已知的偏移中读取该消息。

十七。 Kafka Connector API

允许构建以及运行可重用消费者或生产者的API,将现有应用程序或数据系统连接到Kafka主题,我们使用Connector API。 
所以,这完全是关于Apache Kafka术语。希望你喜欢我们的解释。
让我们修改Kafka Performance Tuning - Kafka Optimization的方法

3.结论

因此,这个Apache Kafka教程总结了大多数重要的Apache Kafka术语。此外,本文还介绍了这些术语如何在Apache Kafka计算中发挥重要作用。此外,帮助我们更深入地了解卡夫卡。因此,这个博客将帮助我们更有效地学习Apache Kafka的概念。此外,如果您在Kafka术语中有任何疑问,请随时通过评论部分询问。
另请参阅 -  Apache Kafka + Spark Streaming Integration
供参考

原文地址:https://www.cnblogs.com/a00ium/p/10849881.html

时间: 2024-10-14 18:49:19

顶级Apache Kafka术语和概念的相关文章

Apache Kafka工作流程| Kafka Pub-Sub Messaging

1.目标 在我们上一篇Kafka教程中,我们讨论了Kafka Docker.今天,我们将讨论Kafka Workflow.此外,我们将详细介绍Pub-Sub Messaging的工作流程以及Queue Messaging / Consumer Group的工作流程.此外,我们将看到ZooKeeper在Apache Kafka中的作用.那么,让我们从Kafka Workflow开始吧. Apache Kafka工作流程| Kafka Pub-Sub Messaging 2.什么是Kafka Wor

Apache Kafka安全| Kafka的需求和组成部分

1.目标 - 卡夫卡安全 今天,在这个Kafka教程中,我们将看到Apache Kafka Security 的概念  .Kafka Security教程包括我们需要安全性的原因,详细介绍加密.有了这个,我们将讨论Kafka Security可以轻松解决的问题列表.此外,我们将看到Kafka身份验证和授权.此外,我们将看看ZooKeeper身份验证.那么,让我们开始Apache Kafka Security. Apache Kafka安全| Kafka的需求和组成部分 2.什么是Apache K

Apache kafka 工作原理介绍

消息队列 消息队列技术是分布式应用间交换信息的一种技术.消息队列可驻留在内存或磁盘上, 队列存储消息直到它们被应用程序读走.通过消息队列,应用程序可独立地执行--它们不需要知道彼此的位置.或在继续执行前不需要等待接收程序接收此消息.在分布式计算环境中,为了集成分布式应用,开发者需要对异构网络环境下的分布式应用提供有效的通信手段.为了管理需要共享的信息,对应用提供公共的信息交换机制是重要的.常用的消息队列技术是 Message Queue. Message Queue 的通讯模式 点对点通讯:点对

Apache kafka 工作原理介绍(作者原创文章已发表在IBM开发者论坛)

插个广告:本人的<大话Java性能优化>一书99万字,已经在亚马逊.当当.京东.天猫,感谢对技术推广梦想者的支持,谢谢! 消息队列 消息队列技术是分布式应用间交换信息的一种技术.消息队列可驻留在内存或磁盘上, 队列存储消息直到它们被应用程序读走.通过消息队列,应用程序可独立地执行--它们不需要知道彼此的位置.或在继续执行前不需要等待接收程序接收此消息.在分布式计算环境中,为了集成分布式应用,开发者需要对异构网络环境下的分布式应用提供有效的通信手段.为了管理需要共享的信息,对应用提供公共的信息交

Apache Kafka之设计

转自: http://blog.csdn.net/kevin_hx001/article/details/9413565        http://kafka.apache.org/design.html 我们为什么要构建这个系统 Kafka是一个分布式.分区的.多副本的.多订阅者的"提交"日志系统. 我们构建这个系统是因为我们认为,一个实现完好的操作日志系统是一个最基本的基础设施,它可以替代一些系统来作诸如:消息处理,ETL(Extraction-Transformation-Lo

Apache Kafka 在大型应用中的 20 项最佳实践

原标题:Kafka如何做到1秒处理1500万条消息? Apache Kafka 是一款流行的分布式数据流平台,它已经广泛地被诸如 New Relic(数据智能平台).Uber.Square(移动支付公司)等大型公司用来构建可扩展的.高吞吐量的.且高可靠的实时数据流系统. 例如,在 New Relic 的生产环境中,Kafka 群集每秒能够处理超过 1500 万条消息,而且其数据聚合率接近 1Tbps. 可见,Kafka 大幅简化了对于数据流的处理,因此它也获得了众多应用开发人员和数据管理专家的青

Apache Kafka教程

1.卡夫卡教程 今天,我们正在使用Apache Kafka Tutorial开始我们的新旅程.在这个Kafka教程中,我们将看到什么是Kafka,Apache Kafka历史以及Kafka的原因.此外,我们将学习Kafka Architecture,Kafka和Kafka Partition的组件.此外,我们将讨论Kafka和Kafka用例中的各种比较.除此之外,我们将在这个Kafka教程中看到各种术语,如Kafka Broker,Kafka Cluster,Kafka Consumer,Kaf

Apache Kafka系列(三) Java API使用

Apache Kafka系列(一) 起步 Apache Kafka系列(二) 命令行工具(CLI) Apache Kafka系列(三) Java API使用 摘要: Apache Kafka Java Client API 一.基本概念 Kafka集成了Producer/Consumer连接Broker的客户端工具,但是在消息处理方面,这两者主要用于服务端(Broker)的简单操作,如: 1.创建Topic 2.罗列出已存在的Topic 3.对已有Topic的Produce/Consume测试

Apache Kafka

简介 Apache Kafka是分布式发布-订阅消息系统.它最初由LinkedIn公司开发,之后成为Apache项目的一部分.Kafka是一种快速.可扩展的.设计内在就是分布式的,分区的和可复制的提交日志服务. Apache Kafka与传统消息系统相比,有以下不同: 它被设计为一个分布式系统,易于向外扩展: 它同时为发布和订阅提供高吞吐量: 它支持多订阅者,当失败时能自动平衡消费者: 它将消息持久化到磁盘,因此可用于批量消费,例如ETL,以及实时应用程序. 本文我将重点介绍Apache Kaf