前两篇转载别人的精彩文章,自己也总结一下python split的用法吧!

前言:前两篇转载别人的精彩文章,自己也总结一下吧!

最近又开始用起py,是为什么呢?

自己要做一个文本相似度匹配程序,大致思路就是两个文档,一个是试题,一个是材料,我将试题按每题分割出来,再将每题的内容与材料中进行文本相似度匹配。

所以先首先要做的是将试题把每道题作为一个字符串切割开来,存放到字典中。

程序入下:

# -*- coding:utf-8 -*-
import re #正则模块
f = open(‘test.txt‘,‘r‘)
s = f.read()
s1 = s.split(‘工作人员考试‘)#一级切割,把每套题分割开来
print len(s1)
r1 = re.split(‘(\d{1,3}\.)‘,s1[0])#用正则按比如"1.","11.","170."把每套题中的题亩切割开来
for i in r1:
    print i
f.close() #关闭文件

文本内容:

一、判断題(正确的选A,错误的选B,涂在答题卡的相应位置:每题1分,共20分)
1.    沟通仅仅是两个或两个以上的人之间的意思传送。()
2.    扁平型组织的控制跨度要小些。    ()
3.    企业人员素质普遍偏高,对领导的意图能很好地意会,则适合采取集权管理。()
4.    决策的关键是目标,没有目标就没有决策。    ()
5.    头脑风暴法是为了保证群体决策的创造性,提高决策质量,改善群体决策而发展起来。()
6.    优秀领导者不仅依靠合法的地位所赋予他的职权,而且能以个人的才能、魄力和威望来促使他人努力工作。    ()

输出结果:

Python 2.7.10 (default, May 23 2015, 09:40:32) [MSC v.1500 32 bit (Intel)] on win32
Type "copyright", "credits" or "license()" for more information.
>>> ================================ RESTART ================================
>>>
13
2016年4月16日重庆市綦江区事业单位公开招聘
一、判断題(正确的选A,错误的选B,涂在答题卡的相应位置:每题1分,共20分)

1.
    沟通仅仅是两个或两个以上的人之间的意思传送。()

2.
    扁平型组织的控制跨度要小些。    ()

3.
    企业人员素质普遍偏高,对领导的意图能很好地意会,则适合采取集权管理。()

4.
    决策的关键是目标,没有目标就没有决策。    ()

5.
    头脑风暴法是为了保证群体决策的创造性,提高决策质量,改善群体决策而发展起来。()

6.
    优秀领导者不仅依靠合法的地位所赋予他的职权,而且能以个人的才能、魄力和威望来促使他人努力工作。    ()

最后说明一下:
re.split(‘(\d{1,3}\.)‘,s1[0])#这里若去掉括号,则分割符号不会被保留

输出结果如下:

>>> ================================ RESTART ================================
>>>
13
2016年4月16日重庆市綦江区事业单位公开招聘
一、判断題(正确的选A,错误的选B,涂在答题卡的相应位置:每题1分,共20分)

    沟通仅仅是两个或两个以上的人之间的意思传送。()

    扁平型组织的控制跨度要小些。    ()

    企业人员素质普遍偏高,对领导的意图能很好地意会,则适合采取集权管理。()

    决策的关键是目标,没有目标就没有决策。    ()

    头脑风暴法是为了保证群体决策的创造性,提高决策质量,改善群体决策而发展起来。()

    优秀领导者不仅依靠合法的地位所赋予他的职权,而且能以个人的才能、魄力和威望来促使他人努力工作。    ()
时间: 2024-12-26 00:34:53

前两篇转载别人的精彩文章,自己也总结一下python split的用法吧!的相关文章

《你的灯亮着吗》读后感 (前两篇)

近期读了<你的灯亮着吗>的前两篇,对这本书有一些感想. <你的灯亮着吗>前两篇分别讲述了:雷龙塔客房没有住满,电梯就不够用的问题,以及比利对于政府投标的问题.通过这两个问题让我明白了如果作为问题解决者应该注意或知道点什么. 面对不同的问题,我们不应去匆忙的寻找解决办法,而是了解问题的人是谁?也就是这是谁的问题:给要解决的问题下定义:还要发掘问题的本质是什么.就像雷龙塔问题,如果电梯运动慢早一点通知工程队,早一点修好,就不会出现之后的踢碎镜子和在电梯里拥挤着涂鸦等一系列问题.注意幻想

张量漫谈(前两篇)

文档下载: 张量漫谈_第一篇 张量漫谈_第二篇 最初的目的是为了供大一高等代数复习之用,他们学习这部分使用的教材是<高等线性代数学>,关于张量的这部分书本上的错误和不自然的地方很多,由于缺乏资料,索性自己写一份讲义.预计三篇,这是前两篇,最后一篇预计讨论一般模的张量,同样,最后一篇短期内也不会更新. 附原文摘要:张量为什么要如此定义? 这或许是一个让人头疼的问题. 因为其复杂的而多样定义让人感到困惑. 简单的定义无法抓到本质, 复杂的定义缺乏解释. 更为关键的是, 似乎在目力所及的范围内也很难

推荐两篇Linux下的Socket文章

Linux Socket Linux下Socket编程 HTTP 协议的简介 HTTP 协议的简介 HTTP协议是一种超文本传输协议(Hypertext Transfer Protocol),工作于网络应用层,自1990年起广泛应用于WWW 的全球信息服务,HTTP协议的详细说明可以在网上查阅RFC2518.RFC2616等文档. HTTP 协议老的标准是HTTP/1.0,目前最通用的标准是HTTP/1.1.HTTP/1.1是在HTTP/1.0基础上的升级,增加了一些功能,全面兼容HTTP/1.

aspx页面调用发送邮件验证码(结合前两篇)

<%@ Page Language="C#" AutoEventWireup="true" CodeFile="Default3.aspx.cs" Inherits="Default3" %> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DT

wp-query调用前几篇文章的方法

---恢复内容开始--- 利用强大的wp-query函数调用指定分类下的前几篇文章,下面的代码表示调用的是分类ID4下的前两篇文章. <?php $cunt_wenzhen = array('cat' =>'4' , //调用的分类4,可以修改分类id 'posts_per_page' =>'2' ,//显示的前两篇文章,可以修改显示篇数 ); $the_query = new WP_Query( $cunt_wenzhen); // 开始循环 if ( $the_query->h

《转载-两篇很好的文章整合》Android中自定义控件

两篇很好的文章,有相互借鉴的地方,整合到一起收藏 分别转载自:http://blog.csdn.net/xu_fu/article/details/7829721 http://www.cnblogs.com/0616--ataozhijia/p/4003380.html Android系统的视图结构的设计也采用了组合模式,即View作为所有图形的基类,Viewgroup对View继承扩展为视图容器类,由此就得到了视图部分的基本结构--树形结构 View定义了绘图的基本操作 基本操作由三个函数完

(转载)两篇很牛的vim使用技巧

读本文之前请注意: 1. 本文的目标是提供一些vim的使用技巧,利用这些技巧可以提高vim的操作效率.部分技巧在vi上也可以使用,但是现在基本上都是用vim了. 2. 本文是整理和总结使用技巧,而非讲解vim入门,因此不会涉及最基本的使用,例如如何上移或下移光标,对此类操作请参阅任何一本vim或者vi教程. 3. 本文阅读对象是了解了vim的基本操作,而希望高效地利用vim进行工作的人.熟练使用vim的人自然不必细读,如果能留下您的宝贵意见,本人将感激不尽. 4. 本文由本人搜集整理,转载请注明

对张子扬显示的两篇委托和事件说得很透文章读后的思考

第一篇 C#中的委托和事件 http://www.tracefact.net/CSharp-Programming/Delegates-and-Events-in-CSharp.aspx 第二篇 C#中的委托和事件(续) http://www.tracefact.net/CSharp-Programming/Delegates-and-Events-Advanced.aspx 这是两篇目前为止,我读过的介绍委托和事件以及异步调用最简明清晰文章,作者通过非常有节奏的"标题"->&q

对张子阳先生对委托和事件的两篇文章的读后思考(说得很透,内附故事一篇)

第一篇 C#中的委托和事件 第二篇 C#中的委托和事件(续) 首先,张子阳先生的这是两篇关于委托和事件间关系的文章,是目前为止我读过的介绍委托和事件以及异步调用最简明清晰文章,作者通过非常有节奏的"标题"->"问题"->"思路"->"实现"->"讲解"的结构,分步骤一步一步地将委托和事件的实现.应用与原理阐述得非常清楚,并且在行文期间将自己有趣的思考过程通过生动的语言表达了出来,使人