Python使用正则表达式替换源码前序号

从博客园或其它地方拷贝代码，经常前面有代码序号，像下面这个样子：

1 wbContent.Navigate(vURL);
2
3     Result:=GetHtml(wbContent);
4
5     while not ContainsText(Result,‘共找到‘) do
6     begin
7       Sleep(100);
8       Application.ProcessMessages;
9       Result:=GetHtml(wbContent);
10     end;
11
12     Result:=GetHtml(wbContent);

可以使用Python的正则表达式来简单地去掉前面的序号：

import re,sys

def refile():

    #sf=‘e:\\temp\\t.txt‘
    #df=‘e:\\temp\\t_new.txt‘

#命令行输入
    argvc=len(sys.argv)
    if argvc==1:
        sf=input(‘请输入要转换的原文件名：‘)
        df=input(‘请输入要转换的目标文件名：‘)
    if argvc==2:
        sf=sys.argv[1]
        df=input(‘请输入要转换的目标文件名：‘)
    if argvc==3:
        sf=sys.argv[1]
        df=sys.argv[2]

fr=open(sf,‘r‘)
    fw=open(df,‘w‘)
    pat=re.compile(‘\A(\s\d)|(\d{1,3})‘)
    s=fr.readline()
    while s:
       m=pat.match(s)
       s=fr.readline()
       if m:
          ss=re.sub(pat, ‘‘, s)
       else:
          ss=s
       fw.write(ss+‘\n‘)
    fr.close()
    fw.close()

if __name__ == ‘__main__‘:
refile()

上面只是简单示例，将拷贝出来的源码存为t.txt，然后运行程序，则会生成t_new.txt文件。

时间： 2024-12-26 05:23:01

Python使用正则表达式替换源码前序号的相关文章

【Spring源码分析】.properties文件读取及占位符${...}替换源码解析

前言我们在开发中常遇到一种场景,Bean里面有一些参数是比较固定的,这种时候通常会采用配置的方式,将这些参数配置在.properties文件中,然后在Bean实例化的时候通过Spring将这些.properties文件中配置的参数使用占位符"${}"替换的方式读入并设置到Bean的相应参数中. 这种做法最典型的就是JDBC的配置,本文就来研究一下.properties文件读取及占位符"${}"替换的源码,首先从代码入手,定义一个DataSource,模拟一下JDB

利用python广西快乐十分源码出租爬取网易云歌手top50歌曲歌词

python广西快乐十分源码出租 dsluntan.com Q:3393756370 VX:17061863513近年来,发展迅速,成为了最炙手可热的语言. 那么如何来进行网易云歌手top50的歌曲歌词爬取呢首先进行网易云并进行喜欢的歌手搜索如下: 在这里需要注意的是http://music.163.com/#/artist?id=1007170并不是真的我们需要的连接,真实的链接应该是http://music.163.com/artist?id=1007170 搞清楚了连接的问题之后,就要进

随手用python写一个下载源码爬虫试试

最近在研读jdk源码,网上找了下资源,发现都不完整. 后来新发现了一个有完整源码的地方,主要包括了java,c,c++的东西,装逼需要,就想拿来玩玩.但是,找了好多种下载打开的方式,发现都不对.于是,我随手写了python爬虫,把他搞定. 1. 思路分析 1.1. 目标地址:http://hg.openjdk.java.net/jdk8u/jdk8u/jdk/file/dddb1b026323/,打开后先自己看下,是否符合自己的需求: 1.2. 分析此结构下主要有两种形式,一是目录文件,二是最终

python语言磁力搜索引擎源码公开，基于DHT协议，十二分有技术含量的技术博客

之前我在写百度网盘爬虫,百度图片爬虫的时候答应网友说,抽时间要把ok搜搜的的源码公开,如今是时候兑现诺言了,下面就是爬虫的所有代码,完全,彻底的公开,你会不会写程序都可以使用,不过请先装个linux系统,具备公网条件,然后运行: python startCrawler.py 有必要提醒你,数据库字段代码中都有,请你自己建张表格,这个太简单了,就不多说了.同时我也提供一下下载地址,源码都在:下载地址1 下载地址2 代码如下: #!/usr/bin/env python # encoding: ut

python语言磁力搜索引擎源码公开，基于DHT协议

之前我在写百度网盘爬虫,百度图片爬虫的时候答应网友说,抽时间要把ok搜搜的的源码公开,如今是时候兑现诺言了,下面就是爬虫的所有代码,完全,彻底的公开,你会不会写程序都可以使用,不过请先装个linux系统,具备公网条件,然后运行: python startCrawler.py 有必要提醒你,数据库字段代码中都有,请你自己建张表格,这个太简单了,就不多说了.同时我也提供一下下载地址,源码都在:下载地址1 下载地址2 #!/usr/bin/env python # encoding: utf-8 "&

Python框架之Tornado (源码之褪去模板外衣)

上一篇介绍了客户端请求在tornado框架中的生命周期,其本质就是利用epoll和socket来获取并处理请求.在上一篇的内容中,我们只是给客户端返回了简单的字符串,如:“Hello World”,而在实际开发中,需要使用html文件的内容作为模板,然后将被处理后的数据(计算或数据库中的数据)嵌套在模板中,然后将嵌套了数据的html文件的内容返回给请求者客户端,本篇就来详细的剖析模板处理的整个过程. 概述上图是返回给用户一个html文件的整个流程,较之前的Demo多了绿色流线的步骤,其实就是把

【Python笔记】如何源码编译依赖LAPACK和ATLAS库的NumPy包

上篇笔记介绍了不依赖lapack和atlas库的NumPy包源码编译/安装方法,但"纯净版"的NumPy会损失性能,故本篇笔记说明如何源码编译安装依赖lapack和atlas库的NumPy包. 1. GCC版本要求使用较新版本的GCC工具集(尽量不低于v4.7)且集成有gfortran编译器. 备注1:这里大写的"GCC"是指GNU Compiler Collection,它除包含C语言编译器gcc外,还包含很多其它语言的编译器(如g++/gfortran等) 备

python之 centos6.7下 python 3.5.2 源码、Django-1.9 安装

在linux6.5中已经自带了python 2 .python 2.6 ,并且yum程序使用的就是自带的python,所以系统自带的python不要随意卸载否则可能导致yum用不了. 测试环境:centos6.7python:python 3.5.2:下载地址:https://www.python.org/ftp/python/3.5.2/先配置本地yum源, 配置方法,参考:http://blog.csdn.net/zhang123456456/article/details/56690945

第一个python程序带快三源码出售

使用文本编辑器快三源码出售(企娥:217 1793 408) python交互式命令行的方式写程序:好处:一下子就能得到结果缺点:没法保存使用编辑器可以避免这一问题推荐两款文本编辑器: 1)sublimetext 免费使用,但不付费会出现提示框 2)notepad 免费,中文备注:不能用word或windows自带的记事本原因:Word保存的不是纯文本文件,而记事本会自作聪明地在文件开始的地方加上几个特殊字符(UTF-8 BOM),结果会导致程序运行出现莫名其妙的错误. 编写程序:

猜你喜欢

mybatis 代码生成器配置

eclipse安装插件,new,新建一个Mybatis Generator Configuration File 文件内容: <?xml version="1.0" enco ...

android onResultActivity不执行原因总结

插一个注意点.在用ArrayAdapter的时候数据那里的类型必须是List<String> 不能是ArrayList<String> 1.在A.Activity中调用star ...

贝莱德伦敦分部面试 - Java岗位

第一轮网上测试,一共三道题,每一问都跟上一问有关,限时90mins.主要是考面向对象编程,字符串,正则表达式和数据结构的一些基础,感觉不难.有些点需要注意比如Java里对字符串 "MSN| ...

css实现背景透明文字不透明

设置元素的透明度: -moz-opacity:0.8; /*在Firefox中设置元素透明度 filter: alpha(opacity=80); /*ie使用滤镜设置透明但是当我们对一个标签设置背 ...

阿里云不能连外网解决

#添加NAT 10.8.0.0/24是OPENVPN的地址 10.162.xxx.xxx是阿里ECS的外网地址(ifconfig eth0) iptables -t nat -A POSTROUTI ...

Quartz定时调度CronTrigger时间配置格式说明与实例

1. CronTrigger时间格式配置说明 CronTrigger配置格式: 格式: [秒] [分] [小时] [日] [月] [周] [年] 序号说明是否必填允许填写的值允许的通配符 ...

类之string类、Math类、DateTime类

String类 string a = "abcdef123456"; 注:字符串的长度是从0开始计数的如:0,1,2,3,4,5,6,7,8,9........ a.Length; ...

1 色相、饱和度、明度定义

色彩三要素(Elements of color)色彩可用的色调(色相).饱和度(纯度)和明度来描述.人眼看到的任一彩色光都是这三个特性的综合效果,这三个特性即是色彩的三要素,其中色调与光波的波长有直接 ...

交叉编译环境以及开发板上-/bin/sh: ./hello: not found（使用arm-linux-gcc -static -o 来进行静态编译）

目标板是S3C2440.至于交叉编译环境的搭建就不多说了,网上很多教程. 搭建好了交叉编译环境后,第一件事就是传说中的”Hello,World!”. 一. 主机编译环节我使用的系统是ubuntu10 ...

【转载】Boltzmann machine

Boltzmann machine Geoffrey E. Hinton (2007), Scholarpedia, 2(5):1668. doi:10.4249/scholarpedia.1668 ...

【转载】PHP本地文件包含和远程文件包含漏洞

远程文件包含(Remote File Inclusion),简称RFI,与其对应的是本地文件包含(Local File Inclusion,LFI),它们都是通过PHP的包含函数即:require() ...

微博授权分享

1.注册开发者账号进入新浪微博提供的开放平台注册新浪账号:http://open.weibo.com/ 在管理中心需要创建一个应用,得到Appkey,如果只是实现分享的功能也不需要提交审核. 2. ...

mybatis 之resultType="HashMap" parameterType="list"

<select id="loadGoodsStock" resultType="HashMap" para ...

SP 页面缓存以及清除缓存

JSP 页面缓存以及清除缓存一.概述缓存的思想可以应用在软件分层的各个层面.它是一种内部机制,对外界而言,是不可感知的. 数据库本身有缓存,持久层也可以缓存.(比如:hibernate,还分1级和 ...

留言系统项目总结

该系统功能是 1 .用户的注册与登录 2.用户留言的分页(hibernate实现分页) 3.管理员回复和删除留言功能模块1:前段页面 <%@ page language="java& ...

Cocos2d-x 常见宏

1)NS_CC_BEGIN cocos2d命名空间開始 2) NS_CC_END cocos2d命名空间结束 3)USING_NS_CC 声明cocos2d命名空间 4)CC_SYNTHESIZE_ ...

异常码汇总

搬家公司管理系统考试提醒1. 请仔细阅读规格文档,理解规格文档估计需要花费10~40分钟来理解,请务必看清楚要求再动手,试题包括规格描述和代码框架.2. 答题时建议经常保持能编译运行,确保可以获得已 ...

web三种跨域请求数据方法

web三种跨域请求数据方法以下测试代码使用php,浏览器测试使用IE9,chrome,firefox,safari <!DOCTYPE HTML> <html> <he ...

HEVC/H265 namespace 介绍

在 HEVC/H265 代码中,有三个使用的namespace: 1. df 2. df::program_options_lite 3. RasterAddress 对于第一个 df 的namesp ...

动态内存开辟函数

realloc()函数原型:extern void *realloc(void *mem_address, unsigned int newsize); 语法:指针名=(数据类型*)realloc( ...

专题

随机推荐

© 2025 憋错料 | info#biecuoliao.com | 10 q. 0.022 s.