Python使用正则表达式替换源码前序号

从博客园或其它地方拷贝代码,经常前面有代码序号,像下面这个样子:

1 wbContent.Navigate(vURL);
 2
 3     Result:=GetHtml(wbContent);
 4
 5     while not ContainsText(Result,‘共找到‘) do
 6     begin
 7       Sleep(100);
 8       Application.ProcessMessages;
 9       Result:=GetHtml(wbContent);
10     end;
11
12     Result:=GetHtml(wbContent);

可以使用Python的正则表达式来简单地去掉前面的序号:

import re,sys

def refile():
    
    #sf=‘e:\\temp\\t.txt‘
    #df=‘e:\\temp\\t_new.txt‘

#命令行输入
    argvc=len(sys.argv)
    if argvc==1:
        sf=input(‘请输入要转换的原文件名:‘)
        df=input(‘请输入要转换的目标文件名:‘)
    if argvc==2:
        sf=sys.argv[1]
        df=input(‘请输入要转换的目标文件名:‘)
    if argvc==3:
        sf=sys.argv[1]
        df=sys.argv[2]

fr=open(sf,‘r‘)
    fw=open(df,‘w‘)
    pat=re.compile(‘\A(\s\d)|(\d{1,3})‘)
    s=fr.readline()
    while s:
       m=pat.match(s)
       s=fr.readline()
       if m:
          ss=re.sub(pat, ‘‘, s)
       else:
          ss=s
       fw.write(ss+‘\n‘)
    fr.close()
    fw.close()

if __name__ == ‘__main__‘:
    refile()

上面只是简单示例,将拷贝出来的源码存为t.txt,然后运行程序,则会生成t_new.txt文件。

时间: 2024-10-12 12:38:23

Python使用正则表达式替换源码前序号的相关文章

【Spring源码分析】.properties文件读取及占位符${...}替换源码解析

前言 我们在开发中常遇到一种场景,Bean里面有一些参数是比较固定的,这种时候通常会采用配置的方式,将这些参数配置在.properties文件中,然后在Bean实例化的时候通过Spring将这些.properties文件中配置的参数使用占位符"${}"替换的方式读入并设置到Bean的相应参数中. 这种做法最典型的就是JDBC的配置,本文就来研究一下.properties文件读取及占位符"${}"替换的源码,首先从代码入手,定义一个DataSource,模拟一下JDB

利用python广西快乐十分源码出租爬取网易云歌手top50歌曲歌词

python广西快乐十分源码出租 dsluntan.com Q:3393756370 VX:17061863513近年来,发展迅速,成为了最炙手可热的语言. 那么如何来进行网易云歌手top50的歌曲歌词爬取呢 首先进行网易云并进行喜欢的歌手搜索如下: 在这里需要注意的是http://music.163.com/#/artist?id=1007170并不是真的我们需要的连接,真实的链接应该是http://music.163.com/artist?id=1007170 搞清楚了连接的问题之后,就要进

随手用python写一个下载源码爬虫试试

最近在研读jdk源码,网上找了下资源,发现都不完整. 后来新发现了一个有完整源码的地方,主要包括了java,c,c++的东西,装逼需要,就想拿来玩玩.但是,找了好多种下载打开的方式,发现都不对.于是,我随手写了python爬虫,把他搞定. 1. 思路分析 1.1. 目标地址:http://hg.openjdk.java.net/jdk8u/jdk8u/jdk/file/dddb1b026323/,打开后先自己看下,是否符合自己的需求: 1.2. 分析此结构下主要有两种形式,一是目录文件,二是最终

python语言磁力搜索引擎源码公开,基于DHT协议,十二分有技术含量的技术博客

之前我在写百度网盘爬虫,百度图片爬虫的时候答应网友说,抽时间要把ok搜搜的的源码公开,如今是时候兑现诺言了,下面就是爬虫的所有代码,完全,彻底的公开,你会不会写程序都可以使用,不过请先装个linux系统,具备公网条件,然后运行: python startCrawler.py 有必要提醒你,数据库字段代码中都有,请你自己建张表格,这个太简单了,就不多说了.同时我也提供一下下载地址,源码都在:下载地址1 下载地址2 代码如下: #!/usr/bin/env python # encoding: ut

python语言磁力搜索引擎源码公开,基于DHT协议

之前我在写百度网盘爬虫,百度图片爬虫的时候答应网友说,抽时间要把ok搜搜的的源码公开,如今是时候兑现诺言了,下面就是爬虫的所有代码,完全,彻底的公开,你会不会写程序都可以使用,不过请先装个linux系统,具备公网条件,然后运行: python startCrawler.py 有必要提醒你,数据库字段代码中都有,请你自己建张表格,这个太简单了,就不多说了.同时我也提供一下下载地址,源码都在:下载地址1 下载地址2 #!/usr/bin/env python # encoding: utf-8 "&

Python框架之Tornado (源码之褪去模板外衣)

上一篇介绍了客户端请求在tornado框架中的生命周期,其本质就是利用epoll和socket来获取并处理请求.在上一篇的内容中,我们只是给客户端返回了简单的字符串,如:“Hello World”,而在实际开发中,需要使用html文件的内容作为模板,然后将被处理后的数据(计算或数据库中的数据)嵌套在模板中,然后将嵌套了数据的html文件的内容返回给请求者客户端,本篇就来详细的剖析模板处理的整个过程. 概述 上图是返回给用户一个html文件的整个流程,较之前的Demo多了绿色流线的步骤,其实就是把

【Python笔记】如何源码编译依赖LAPACK和ATLAS库的NumPy包

上篇笔记介绍了不依赖lapack和atlas库的NumPy包源码编译/安装方法,但"纯净版"的NumPy会损失性能,故本篇笔记说明如何源码编译安装依赖lapack和atlas库的NumPy包. 1. GCC版本要求 使用较新版本的GCC工具集(尽量不低于v4.7)且集成有gfortran编译器. 备注1:这里大写的"GCC"是指GNU Compiler Collection,它除包含C语言编译器gcc外,还包含很多其它语言的编译器(如g++/gfortran等) 备

python之 centos6.7下 python 3.5.2 源码、Django-1.9 安装

在linux6.5中已经自带了python 2 .python 2.6 ,并且yum程序使用的就是自带的python,所以系统自带的python不要随意卸载否则可能导致yum用不了. 测试环境:centos6.7python:python 3.5.2:下载地址:https://www.python.org/ftp/python/3.5.2/先配置本地yum源, 配置方法,参考:http://blog.csdn.net/zhang123456456/article/details/56690945

第一个python程序带快三源码出售

使用文本编辑器快三源码出售(企 娥:217 1793 408) python交互式命令行的方式写程序:好处:一下子就能得到结果 缺点:没法保存 使用编辑器可以避免这一问题 推荐两款文本编辑器: 1)sublimetext 免费使用,但不付费会出现提示框 2)notepad 免费,中文 备注:不能用word或windows自带的记事本 原因:Word保存的不是纯文本文件,而记事本会自作聪明地在文件开始的地方加上几个特殊字符(UTF-8 BOM),结果会导致程序运行出现莫名其妙的错误. 编写程序: