今日架构工程师

1 0-对db单独写一个类,却对proxy不单独设类,不公平!
2 1-情景
3     python-scrapy-proxy+ADSL
4     grab-AMZglobalSite:reviews,ranking,.......
5     当前代码结构:dbTool.py metaSpider.py  reviewsSider.py,rankingSider.py,......
6         在metaSpider.py类中实现dbTool.py类(从db获取下一个grab-url),def proxy1(),def proxy2()(多个处理代理的方法),在“一线实现具体采集业务”的xyzSider.py中实现metaSpider.py类
7 2-tmpSolution
8     "是啊,我也想把proxy搞出去啊,可是目前写不出来啊"
 1 0-这个字段加不加?
 2 1-情景
 3     AMZglobalSite商品详情页-grab评分与当前总评分/4分比较得出差评,将采集软件切换到python,进入url是通过站点(uk,fr)+asin,php分析采集数据,给email至运营订阅者。
 4
 5     在用采集软件的同学处理是未发现一个现象“如phone case 商品页的商品主体区域的右上角,不同颜色的商品可能是不同的asin,此外有size属性的商品不同size的asin可能也是不同的,而评论区的reviews是这些商品reviews的集合,而不仅仅是page-url中的asin”
 6     上述现象进一步导致给运营订阅者的email中的“差评用户id-订单id-asin”三者不匹配
 7
 8     python同学将单个page-url中的每一条reviews的asin均存入数据库,新加‘new-asin’字段。
 9     因为‘new-asin’才是和每一条reviews准确对应的‘asin’,导致php同学将要修改grab-data的分析脚本和发送email相关的脚本。
10
11 2-tmpSolution
12
13     db不新加字段,php代码不修改:在python 写入数据库的入口过滤掉reviews-asin与pagre-url-asin不同的数据,不入库,以此来保证入库数据的准确性和避免oldClode的修改。
时间: 2024-10-21 21:17:44

今日架构工程师的相关文章

Java架构工程师知识图,你都知道么?

1.工程化专题 (团队大于3个人之后,你需要去考虑团队合作,科学管理)  2.源码分析专题 (好的程序员,一行代码一个设计就能看出来,源码分析带你品味代码,感受架构)  大家可以点击加入群:697579751[JAVA大牛学习交流] 里面有Java高级大牛直播讲解知识点走的就是高端路线 (如果你想跳槽换工作但是技术又不够或者工作上遇到了 瓶颈我这里有一个JAVA的免费直播课程讲的是高端的知识点 基础不好的误入哟只要你有1-5年的开发经验 3.高性能及分布式专题 (跟上技术节奏,扩宽技术视野,程序

微服务容器架构工程师

第一部分 Docker 与 Kubernetes 基础 第1章 Docker 容器 41.0 什么是 Docker? 41.2 Docker 发行版本 51.3 Docker基本实现原理 51.4 Docker 优势与局限性 81.5 容器与虚拟机区别 91.6 Dokcer 架构与术语 91.7 Docker 基本安装 101.8 Docker C/S 模式 131.9 Docker应用程序运行条件 15第2章 Docker镜像 162.0 容器运行基础 162.1 Docker 加载镜像流程

分布式技术追踪 2017年第十八期

分布式系统实践 1. 一文读懂大数据计算框架与平台 http://dwz.cn/5SgDC5 摘要: 这篇文章从批处理模型, 流式计算模型和交互式分析模型三个角度总结了开源大数据框架的特点, 对于大家了解大数据平台的全貌有一定的帮助. 2. 美团的大数据平台架构实践 http://dwz.cn/5TGZoW 摘要: 本文分享了美团构建大数据平台的方法,以及各种各样的技术应用,希望能给大家一些关于大数据方面的启迪. 微服务技术 1. 今日头条Go建千亿级微服务的实践 http://dwz.cn/5

国际舞台上大家如何谈Docker?DockerCon十大看点

[编者按]在去年的DockerCon 2014大会上,来自Google.IBM.RedHat.Rackspace等公司的核心人物均发表了主题演讲,在那次大会上,我们也看到了公布了很多的与Docker相关的开源项目,比如:Kubernetes .cAdvisor .Libcontainer 等,那么随着主流的云厂商以及Linux厂商都加入了支持Docker阵营,以及随着Rocket的出现,今年的DockerCon2015会有哪些精彩看点,下文为你揭晓. 以下为原文: 关注Docker的朋友一定知道

微店|口袋购物 广招八方好汉!!

坐标:北京 职位: 技术研发类:搜索研发工程师 支付风险控制/数据挖掘 广告研发工程师 图像处理工程师 技术研发类:自然语言处理工程师 数学建模工程师 机器学习/数据挖掘 PHP开发工程师 技术研发类:Hadoop数据研发工程师 检索/存储架构工程师 前端开发工程师 即时通讯(IM)(C++) 技术研发类:JAVA研发工程师 安全工程师 Hadoop运维工程师 DBA开发工程师 技术研发类:系统工程师 SEO搜索引擎优化工程师 技术研发类:服务器端测试开发工程师 iOS开发工程师 Android

Android开发者必备的42个链接

http://mobile.51cto.com/ahot-426035.htm 下面收集了42个帮助大家学习Android的内容链接,部分内容是面向初学者的,帮助大家从头开始学习Android开发,其他则面向较高级的开发者.希望推荐的这些内容对你有帮助. 官方网站 1.谷歌Android开发者页面 这里是主站点,在这您可以找到一切资源帮助您开始Android开发.此站包含了很多关于学习基础知识的资源,完整的API引用,以及你开始开发所需的各种工具.此站共分为五个部分: 作为初学者,你应该从工具开

[转]数据中心网络虚拟化 主流平台产品介绍

http://www.sdnlab.com/12076.html SDNLAB 为了对数据中心网络虚拟化有个初步的认识,本文将对当前比较主流的几款商业平台进行介绍,包括VMware公司的网络虚拟化技术,IBM公司的Dove及开源的OpenDove平台, NEC公司的virtual-network-platform和VTN平台,以及Cisco公司的Nexus虚拟化平台. 1.Vmware公司的网络虚拟化技术 VMware在虚拟化领域的领导地位使得我们必须首先介绍一下他们的网络虚拟化技术NSX.然而

linux服务器用户管理

用户管理 线上服务器不同的用户负责不同的部分,比如架构工程师需要web相关权限,DBA需要数据库相关的权限.协调好可用性以及安全性,如何管理? 我采用的是普通用户权限+sudoer+facl+group+应用账号 web维护人员: 系统普通账号+tomcat配置复杂密码后禁用远程登录,    (参考:http://blog.csdn.net/linghe301/article/details/8211305) 这里提到ssh配置文件的DenyUsers 很好用.可方便管理tomcat相关数据和服

PHP (超文本预处理器)

1.PHP(外文名:PHP: Hypertext Preprocessor,中文名:"超文本预处理器")是一种通用开源脚本语言.语法吸收了C语言.Java和Perl的特点,利于学习,使用广泛,主要适用于Web开发领域.PHP 独特的语法混合了C.Java.Perl以及PHP自创的语法.它可以比CGI或者Perl更快速地执行动态网页.用PHP做出的动态页面与其他的编程语言相比,PHP是将程序嵌入到HTML(标准通用标记语言下的一个应用)文档中去执行,执行效率比完全生成HTML标记的CGI