百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程网 > 正文

高效文本处理之查找替换|各类工具+正则表达式或通配符使用

yuyutoo 2024-11-13 15:39 18 浏览 0 评论

各工具在查找替换时可使用的正则表达式或通配符各有不同,可考虑使用的工具及特点有:

1 word,有丰富的查找替换选项;

2 notepad,可打开多个文档操作;

2 dreamweaver,较好支持正则表达式及多行查找操作;

4 python,使用正则表达式做查找替换时,功能强大;

如相同功能存在的一些细微区别:

分组替换 python是\1\2\3,dreamweaver是$1$2$3

段落标记:word使用^p,dreamweaver是\n或直接在文本框中按:shift+enter

1 word

word查找替换存在丰富的可选项组合:

特殊格式不同的对话框:

2 notepad

notepad支持在文件夹选择多个文件时,右击,可同时打开,并有“替换所有打开文件”的操作:

3 dreamweaver

dreamweaver的查找替换对话框,对于正则表达式有较好的支持:

简单解释以上正则表达式:

<p>(\d*[.]{1}\d*)(\s.)(.*?)</p>

[.]{1} 是指匹配英文句点.。

.*? 是指匹配除任意换行符以外的任意多字符。

可以直接作用多行文本:

4 python

当然,较复杂或需要完成较多的较固定的查找替换时,可以写一个简单的小程序,编程语言对于字符串操作支持都是其最基本的功能,而较容易使用的编程语言就是python了。

import sys
import os
import re

rInit = open('init.txt','rU',encoding='UTF-8')
wTemp = open('temp.txt','w',encoding="UTF-8")

nfn = str(rInit.readline()) # 第一行用作标题
nfn =nfn.replace("<p>","")
nfn =nfn.replace("</p>","")

s = rInit.read()                    # 整个文本文件作为一个字符串返回
s = s.replace(' ','')              # 处理全角空格
s = s.replace("<<","<<")
s = s.replace("#include <","#include <")
s = s.replace("#include<","#include<")
#s = s.replace(">",">")
s = s.replace(',?' , ',”')
s = s.replace('.?' , '.”')
s = s.replace('\n\r' , '\n')
s = s.replace('\r\n' , '\n')
s = s.replace('       ' , '\n\n')
s = re.sub(r'</div><div class="\w\d*">', '<p></p>', s)

rejiu =re.compile(r'<\S{,8}九\S{,22}</\S{,5}>') 
s = rejiu.sub("", s)

wTemp.write(nfn)                        # 标题写回
wTemp.write("\n")

wTemp.write(s)
rInit.close()
wTemp.close()

-End-

相关推荐

java把多张图片导入到PDF文件中(java如果导入图片到项目)

packagecom.mlh.utils;importcom.itextpdf.text.*;importcom.itextpdf.text.Font;importcom.itextp...

聊聊langchain4j的AiServicesAutoConfig

序本文主要研究一下langchain4j-spring-boot-starter的AiServicesAutoConfig...

Spring 中三种 BeanName 生成器!(spring生成bean过程)

无论我们是通过XML文件,还是Java代码,亦或是包扫描的方式去注册Bean,都可以不设置BeanName,而Spring均会为之提供默认的beanName,今天我们就来看看Spr...

Zookeeper实现微服务统一配置中心

Zookeeper介绍本质它是一个分布式服务框架,是ApacheHadoop的一个子项目...

Spring cloud Gateway 动态路由(springboot gateway 动态路由)

一、分析过程...

从Nacos客户端视角来分析一下配置中心实现原理

目录...

Python 中容易被新手忽略的问题(python容易犯的错误)

设置全局变量有时候设置全局变量的需求并不是直接赋值,而是想从某个数据结构里引用生成,可以用下面这两种方法,推荐第二种,golbals()支持字典用法很方便。...

Springboot实现对配置文件中的明文密码加密

我们在SpringBoot项目当中,会把数据库的用户名密码等配置直接放在yaml或者properties文件中,这样维护数据库的密码等敏感信息显然是有一定风险的,如果相关的配置文件被有心之人拿到,必然...

是时候丢掉BeanUtils了(丢掉了时间)

前言为了更好的进行开发和维护,我们都会对程序进行分层设计,例如常见的三层,四层,每层各司其职,相互配合。也随着分层,出现了VO,BO,PO,DTO,每层都会处理自己的数据对象,然后向上传递,这就避免不...

EasyExcel自定义合并单元格多行合并根据自定义字段

第一种方式实现通过定义注解+实现RowWriteHandler接口中的afterRowDispose方法来动态合并行根据指定的key可以是单个字段也可以是多个字段也可以根据注解指定。注解方式使用参考原...

太香了!女朋友熬夜帮我整理的Spring Boot - Banner 笔记,分享给你

上一篇分享的是《Java避坑指南!IDEA查看.class文件源码下载失败问题汇总》,这篇给大家分享《SpringBoot-自定义Banner图案》。...

基于SpringCloud的enum枚举值国际化处理实践

背景选用SpringCloud框架搭建微服务做业务后台应用时,会涉及到大量的业务状态值定义,一般常规做法是:持久层(数据库)存储int类型的值后台系统里用阅读性好一点儿的常量将int类型的值做一层映射...

Lucene就是这么简单(好女婿你以后就是妈妈的老公了)

什么是Lucene??Lucene是apache软件基金会发布的一个开放源代码的全文检索引擎工具包,由资深全文检索专家DougCutting所撰写,它是一个全文检索引擎的架构,提供了完整的创建索引和...

注解@Autowired和@Resource的区别总结

零、前言@Autowired和@Resource注解都可以在Spring应用中进行声明式的依赖注入。以前都是看的网上关于两者的区别,但是实际和网上说的有出入,故从源码角度进行分析、验证。...

100个Java工具类之73:系统信息获取工具类SystemUtils

SystemUtils是一个功能强大的工具类。可以获取系统属性、检测java版本、处理跨平台文本文件,合理地使用此类,可以使代码更健壮,系统更安全。...

取消回复欢迎 发表评论: