Python 通过网站search功能监控网站内容更新

更多信息访问个人博客: http://cloudbps.com

接到需求帮朋友监控一个信息网站,当该网站有相关的数据更新的时候发送信息到指定邮箱.
下面是相关的python脚本,用到了httplib, time , sys ,smtplib模块

#!/usr/bin/env python#coding=utf8import httplib, time
import sys
import smtplib
reload(sys)
sys.setdefaultencoding(‘utf8‘)
from email.mime.text import MIMEText
mailto_list=[‘[email protected]‘]
mail_host="smtp.sina.com"
mail_user="sendmailaccount"
mail_pass="sendmailpassword"
mail_postfix="sina.com"
sec=60
conn = httplib.HTTPConnection("网站地址")
conn.request("GET", "搜索后的网站地址|/caigou/kw-%E6%B1%A1%E6%B0%B4%E5%A4%84%E7%90%86%E6%8B%9B%E6%A0%87.html")
r1 = conn.getresponse()
a = r1.read()
defsend_mail(to_list,sub,content):
    me="网站信息已更新"+"<"+mail_user+"@"+mail_postfix+">"
    msg = MIMEText(content,_subtype=‘html‘,_charset=‘utf8‘)
    msg[‘Subject‘] = sub
    msg[‘From‘] = me
    msg[‘To‘] = ";".join(to_list)
    try:
        s = smtplib.SMTP()
        s.connect(mail_host)
        s.login(mail_user,mail_pass)
        s.sendmail(me, to_list, msg.as_string())
        s.close()
        returnTrueexcept Exception, e:
        print str(e)
        returnFalseprint"The program is starting"whileTrue:
	time.sleep( sec )
	b = r1.read()
	if a == b:
		print‘good running ,Now it is ‘ + time.strftime(‘%Y年%m月%d日,%H:%M:%S‘)+ ‘\n请稍后.....‘else:
		print"网站更新"if __name__ == ‘__main__‘:
			if send_mail(mailto_list, "网站信息已更新", "对应网站域名"):
        			print"发送成功"else:
        			print"发送失败"
		a = r1.read()

Python 通过网站search功能监控网站内容更新,布布扣,bubuko.com

时间: 2024-10-25 06:03:47

Python 通过网站search功能监控网站内容更新的相关文章

网站内容更新文章每天要多少才行?

很多SEO在做优化的时候,对文章更新到底要更新多少其实很茫然,大家看到很多SEO的文章都说什么网站必须更新频繁,最好是每天一更新之类的,其实笔者想在这里纠正大家的这个错误的观念,文章,的确需要更新,但是并不是所有的行业,所有的网站都得每天都更新大量的文章,那么到底应该如何确定这个文章更新的度呢?笔者建议      1.参考同行业排名前10的网站      参考直接竞争对手的更新频率,次数,看看竞争对手们, 每天更新多少,假设每天更新竞争对手平均每日更新10篇,那你也可以依据这个数值上下浮动.  

SEO内容更新和网站排名之间的关系

在SEO服务中有很多朋友认为包括我之前也这么认为,做SEO的时候网站更新越频繁,蜘蛛就会来的比较频繁,慢慢关键词排名也会提高.因此之前每天花大量的时间去更新东西,哪怕没有东西可写,也会杜撰一篇新闻什么的更新出来.慢慢发现,其实这样是错误的.那么关键词排名和网站更新到底是什么关系,是不是经常更新,排名就会稳定? 在做seo服务的时候网站的更新对网站排名是有一定的影响,网站内容更新了,蜘蛛就会过来抓取,蜘蛛来的频繁,搜索引擎会认为你的网站内容很丰富,慢慢自然权重也就高了,排名也会受到提升.但在实际做

企业网站建设网站SEO优化网站内容更新网站托管维护

优化之家专业网站建设运营团队主要服务有企业网站建设.网站SEO优化.企业网站托管代运营等具体服务详情如下: 1,企业网站建设:优化之家专注模板建站为大中小型企业及个人提供网站建设服务,将企业品牌形象在互联网上多维度.全方位.立体式展现出来,以方便企业市场营销策略与网站宣传的统一.我们免费为你提供丰富的模板样式供您选择,价格优惠服务周到,价格低至500元起. 2,网站SEO优化:网站优化主要从网站结构.关键词分析.内部及外部链接,内容建设,用户体验等多个方面进行的优化,使你的网站在搜索引擎中排在同

四种渠道打造网站高质量原创内容

SEO的难题在于内容来源,基业长青在于回归用户,我想作为站长,最头疼的莫过于网站的内容来源了.这句话也说出了seo发展的本质,一个网站没有源源不断的内容来源,即便网站有众多的外链,那也是不会有好的排名,更是对用户的不负责任,这样的网站又谈何发展呢?我们擅长的是外链的构建,而内容的原创又如何得来呢?笔者根据自身的经验给大家介绍一些网站内容来源的方法,绝对能够让搜索引擎收录. 一.相关书籍扫描资料的整理 互联网是个大宝库一点也不假,但是长期的互联网从业经验让我们对实体书籍慢慢丢失了兴趣,其实从实体书

python Pycurl 库 —— 实现对网站抓包分析

经常使用基调网络的同学,可能对基调网络对页面元素的性能展示感觉很好.它可以做到对一条URL做详细的检测,包括:阻塞时间.DNS解析时间.建立连接时间.SSL握手时间.发出请求时间.首包时间等. 其实,我们也可以做到.比如Python pycurl 库就可以做到对数据的收集,然后可以对收集的数据写入redis或者Mysql.最后前端使用echars通过图形的形式进行展示出来. echars是百度一个开源项目,功能很强大(项目URL:http://echarts.baidu.com)可以将数据通过各

说说大型高并发高负载网站的系统架构(更新)

转载请保留出处:俊麟 Michael’s blog (http://www.toplee.com/blog/?p=71)Trackback Url : http://www.toplee.com/blog/wp-trackback.php?p=71 鄙人先后在CERNET做过拨号接入,在Yahoo&3721搞过搜索前端,在猫扑处理过mop.com的架构升级,在6.cn视频网站从事开发工作,还在多年的工作中接触和开发过不少大中型网站的模块,因此在大型网站应对高负载和并发的解决方案上有一些积累和经验

随笔之——各大热门网站search 搜索框的写法,浅析!

随笔之——各大热门网站search 搜索框的写法,浅析! 关于搜索框,写法有很多种,搜索框这一块是一个比较细的活,要先计算好他的高.宽: 下面我就以京东搜索框为例,给大家浅析一下. 上面就是最终search框效果图. 先送出代码>>>>>> 1 <span style="color: #ff00ff; font-size: 18pt;"><strong>HTML 标签:</strong></span>

网站优化有价值的内容来自于你用心的积累和分析

网站优化,当下内容优化的重要性已经远远的大于了网站外链优化,而恰恰在内容优化的过程中很多seoer遭遇了非常头疼的问题,就是网站内容来源问题,尤其是当下互联网受众对于内容质量要求越来越高,很多站长用心去写软文用心的去做网站优化,而为了优化"用心"的内容真的是用户喜欢的吗?其实不尽然,在笔者看来用户关注的内容主要来自于自己用心的积累和细致的分析,主要包括以下几个方面. 第一,认真的分析你的受众群体.网站需要解决的第一个问题就是你的受众问题,作为站长我们分析网站受众主要来自于以下几个方面,

网站安全狗”响应内容保护“网页错误返回页面优化功能介绍

网站安全狗最新版本(主程序版本号:3.2.08157)在“资源保护”模块多了一个功能叫做:响应内容保护.如下图所示: <ignore_js_op> 该模块的主要功能是,当我们访问网站时,不合理的访问,或者网站自身的问题,会出现各种的错误返回页面.从安全的角度上讲,这就可以给攻击者提供判断的依据,为了防止这种情况,网站安全狗对网页错误的返回页面做了优化处理,并将此资源进行了回收利用,加入了百度推广的相关广告信息. <ignore_js_op> 该页面的推广信息为您搜索的相关类似信息.