【node】记录项目的开始与完成——pipeline_kafka流式数据库管理项目

前言:

  我始终坚信的一点是,学习的效果80%来自总结,甚至全部都是。总结的好处就是让你能翻出你的过往,指出其中的不足,看到未来的改进方法,好的总结更能让知识产生飞跃,所以在工作之余,部署项目之际,总结一番。

架构处理:

  一、背景

    公司数据量庞大,万花筒一样的领导随即用上了pipeline_kafka这样的流式数据架构。其实在接手项目之前,作为一个应用开发、我是不太清楚kafka是什么鬼的,还有stream、transform、等等一系列名词,听起来很高大上,但是很懵比=-=。

    领导的目标是做一个数据流管理系统,目的是关联postgresql+kafka+流;通过平台的方式管理kafka的关联、流的数据规则、转换数据的操作,简单的来说就是集成一下数据工程师平时的sql操作,用可视化平台的方式提高工作效率。

  二、前端结构

   前端框架,选用了React.js,浅略的使用一下便感受到了react作为一个视图库的魅力,它将前端变得更优雅。因为React.js只能处理视图层,而具体的controller我只是使用了jQuery作为补充,项目的体量不大,变动较多,使用jquery是最好的选择。

列出使用到的技术:

    ① React.js

    ② jQuery

    ③ react-tools 打包jsx

    ④ sass对css模块化处理

  看前端效果点击》》》

  由于项目足够简单,React也是浅略的使用了一下,并没有用到es6,也没有用到webpack打包,算是一边做项目,一边入了门,构思简单,实用为上,且看代码结构:

  以首页为例子:

  首先一个公共的index.html文件 引入需要的文件资源:

  

  css的处理,使用sass的@import进行模块化加载:

  

这么做的好处是可以按需加载,并且一个index.scss就可以解决所有的依赖关系,在引入时也可以减少请求数量。

再看react:

  component.js 将所有组件打包,页面公用

  

 index.js承载了页面主要组件,交互处理。

跑完所有页面之后,部署到node中 开启react-tool,移除browser.js进行应用开发。

  个人觉得这种前端结构的亮点在于,前端结构清晰,组织逻辑比较易懂,适合用作从传统开发转入自动化开发的过度结构,也适合开发环境特殊,使用npm苦难的群众,比如我的公司,工作电脑是完全隔绝互联网的,使用webpack打包极为不便。另外一个项目如果不确定将来会落到哪位程序员的手里维护,使用webpack打包有可能造成困扰,毕竟维护代码的人,他可能是个java开发......

参考资料:

  

React JSX编译为JavaScript

React 入门实例教程

 三、server端结构

  经典的express框架mvc结构,将前端代码拿到node中,入口文件看起来是这样的:

pageName变量由router的render决定,这样做引出的优化点是,页面由react托管,独立的js文件可修改性能更强,也加强了逻辑性。

经典的express入口文件

router路由控制:

参考资料

  Express 开发与部署最佳实践

  Nodejs进阶:如何玩转子进程(child_process)

  Node.js最新技术栈之Promise篇

nodejs:

  项目需要跨域,通过token做登陆验证

  项目需要跨域请求,因此如何远程登录成了问题,谷歌很久采用了token机制,生成token这一步并没有使用第三方包,而是耍了下花枪,且看代码实现:

 

将token挂在global上,setTimeout延时删除,获取时再根据name获取token对比,跨域时设置credentials获取cookie,或者通过headers获取token,安全性能良好,后期我将它挂在了另一个进程中,获取和设置使用另一个进程进行管理。

更多我将另开文章慢慢的说。〓

数据:

  一、kafka

  nodejs连接kafka我使用的node-rdkafka组件,这个组件只能在linux环境下编译使用,node-rdkafka  git地址

使用它的原因,是它支持sasl认证,这个组件找了很久才找到,具体的连接代码在工作环境拿不出来,这里也就不演示介绍,github上有详细的说明。

  二、postgresql

  用pg组件连接postgresql,封装出增删改查方法:

  

三、其他

  更多的细节,因为篇幅太大,放到其他文章中讲述,这里略略的总结一下项目主要结构。

总结:

  总的来说,项目不大,能玩的花样不多,其中的技术要点,点透也就得心应手了,博主从接到任务到部署,花了十天的时间才开发完成,感觉各个地方还是有很多的不足之处。总结写在博客上和大家探讨。

  有什么建议,欢迎留言。

  需要了解其中更详细的知识点,可以联系我。

时间: 2024-10-08 02:30:03

【node】记录项目的开始与完成——pipeline_kafka流式数据库管理项目的相关文章

生产环境部署node记录(二):pm2和nginx

安装完node和npm ,接下来安装pm2 首先简单介绍下pm2,官网的介绍是: pm2 是一个带有负载均衡功能的Node应用的进程管理器.当你要把你的独立代码利用全部的服务器上的所有CPU,并保证进程永远都活着,0秒的重载, PM2是完美的.它非常适合IaaS结构,但不要把它用于PaaS方案(随后将开发Paas的解决方案). 备注:SaaS.PaaS和IaaS是云服务模式.        SaaS 软件即服务,例如Google的 Gmail 邮箱服务.面向应用型用户.        PaaS

【SSH网上商城项目实战27】域名空间的申请和项目的部署及发布

前面陆陆续续的完成了网上商城的一些基本功能,虽然还有很多地方有待完善,但是不影响项目的部署和发布,我们可以先来玩一把,这一节主要介绍下域名空间的申请以及项目的部署和发布流程. 1. 域名空间的申请 作为一个伟大的屌丝,肯定没钱买域名空间,很自然的想到去申请个免费的,现在免费的域名空间也很多,我在福佳jsp技术网上申请了一个试用期是15天的,大家也可以去申请个玩玩,反正作为学习,这已经足够了,当然,如果要长期的肯定要付费的.注册过程我截几个图,如下: 然后下一步,最后开通如下: 建议把上面这些信息

项目经理怎么在两周内熟悉一个项目的业务?

项目经理空降到一个进行中的项目,怎么在两周内熟悉一个项目的业务? 四步帮你解决:明确项目业务目标,了解系统功能模块,弄清系统核心业务流程,多使用系统. 一.明确项目业务目标 明确项目业务目标,也就是了解客户为什么要建设这个项目,客户想通过这个项目解决哪些业务问题?从哪里了解这个信息?渠道很多:如果前任项目经理还在,可以直接问前任项目:如果项目资料齐全,可以查阅项目资料:如果商务清楚,可以问商务:如果前面的渠道不通,也可以直接请教客户:甚至可从公司竞争对手的竞品介绍里了解.此任务第一周完成. 二.

Storm流计算之项目篇(Storm+Kafka+HBase+Highcharts+JQuery,含3个完整实际项目)

1.1.课程的背景 Storm是什么? 为什么学习Storm? Storm是Twitter开源的分布式实时大数据处理框架,被业界称为实时版Hadoop. 随着越来越多的场景对Hadoop的MapReduce高延迟无法容忍,比如网站统计.推荐系统.预警系统.金融系统(高频交易.股票)等等, 大数据实时处理解决方案(流计算)的应用日趋广泛,目前已是分布式技术领域最新爆发点,而Storm更是流计算技术中的佼佼者和主流. 按照storm作者的说法,Storm对于实时计算的意义类似于Hadoop对于批处理

项目集管理研究中心专家翻译与审校《项目集管理标准》

(2014年7月4日 北京) 共创国际-项目管理者联盟下属项目集管理研究中心(Program Management Research center)专家杨侃教授与林勇副主任参与翻译并审校<项目集管理标准>(<The Standard for Progra management>). <项目集管理标准>的引进与推广必将提升中国大型项目与项目群管理的实践水平.欢迎对该标准有研究与学习兴趣的企业经理,业界专家参与标准的交流.学习与研讨,共同推广项目集管理在中国的应用与发展.

Maven项目搭建(三):Maven直接部署项目

    上一章给大家讲解了如何使用Maven搭建SSM框架项目.   这次给大家介绍一下怎么使用Maven直接部署项目.   Maven直接部署项目  1.新建系统变量CATALINA_HOME,值为:Tomcat路径  2.在系统变量 Path的最后面添加%CATALINA_HOME%\lib; %CATALINA_HOME%\lib\servlet-api.jar;%CATALINA_HOME%\lib\jsp-api.jar ,注意它们之间的分号,一定是英文的分号.   3. Tomcat

VS2013项目受源代码管理向源代码管理注册此项目时出错

在使用TFS的时候有时出现无法加载项目,后来删除项目添加也是不行 编译项目的时候提示如题的错误,用记事本打开出错的几个项目的.csproj文件,把下面几行内容删掉就行了. <SccProjectName>Svn</SccProjectName>    <SccLocalPath>Svn</SccLocalPath>    <SccAuxPath>Svn</SccAuxPath>    <SccProvider>Subver

SSH项目搭建(三)——Maven多模块搭建项目

多模块开发,大致的思想就是把一个项目按某种方式分成多个模块,再把模块们连接成一个整体,我们在开发的时候,可以很清晰的操作每一个模块,可以大大提高开发的效率. Java web项目,最常见的就是按代码的作用分层开发,这和SSH框架有相互契合的思想: po.vo层--模型层 dao层--数据库访问层(Hibernate)--其代码的作用一定是操作数据库,而Hibernate的作用就是方便我们操作数据库的 service层--业务逻辑层(Spring)--其代码的作用一定是对业务逻辑的处理,而Spri

从零开始搭建django前后端分离项目 系列五(实战之excel流式导出)

项目中有一处功能需求是:需要在历史数据查询页面进行查询字段的选择,然后由后台数据库动态生成对应的excel表格并下载到本地. 如果文件较小,解决办法是先将要传送的内容全生成在内存中,然后再一次性传入Response对象中: 如果文件较大时,我们可以考虑向HttpResponse传递一个迭代器,流式的向客户端传递数据. view.py视图 @csrf_exempt def exportData(request): format = request.GET.get('format') pk = re