高效文本处理之查找替换|各类工具+正则表达式或通配符使用
yuyutoo 2024-11-13 15:39 5 浏览 0 评论
各工具在查找替换时可使用的正则表达式或通配符各有不同,可考虑使用的工具及特点有:
1 word,有丰富的查找替换选项;
2 notepad,可打开多个文档操作;
2 dreamweaver,较好支持正则表达式及多行查找操作;
4 python,使用正则表达式做查找替换时,功能强大;
如相同功能存在的一些细微区别:
分组替换 python是\1\2\3,dreamweaver是$1$2$3
段落标记:word使用^p,dreamweaver是\n或直接在文本框中按:shift+enter
1 word
word查找替换存在丰富的可选项组合:
特殊格式不同的对话框:
2 notepad
notepad支持在文件夹选择多个文件时,右击,可同时打开,并有“替换所有打开文件”的操作:
3 dreamweaver
dreamweaver的查找替换对话框,对于正则表达式有较好的支持:
简单解释以上正则表达式:
<p>(\d*[.]{1}\d*)(\s.)(.*?)</p>
[.]{1} 是指匹配英文句点.。
.*? 是指匹配除任意换行符以外的任意多字符。
可以直接作用多行文本:
4 python
当然,较复杂或需要完成较多的较固定的查找替换时,可以写一个简单的小程序,编程语言对于字符串操作支持都是其最基本的功能,而较容易使用的编程语言就是python了。
import sys
import os
import re
rInit = open('init.txt','rU',encoding='UTF-8')
wTemp = open('temp.txt','w',encoding="UTF-8")
nfn = str(rInit.readline()) # 第一行用作标题
nfn =nfn.replace("<p>","")
nfn =nfn.replace("</p>","")
s = rInit.read() # 整个文本文件作为一个字符串返回
s = s.replace(' ','') # 处理全角空格
s = s.replace("<<","<<")
s = s.replace("#include <","#include <")
s = s.replace("#include<","#include<")
#s = s.replace(">",">")
s = s.replace(',?' , ',”')
s = s.replace('.?' , '.”')
s = s.replace('\n\r' , '\n')
s = s.replace('\r\n' , '\n')
s = s.replace(' ' , '\n\n')
s = re.sub(r'</div><div class="\w\d*">', '<p></p>', s)
rejiu =re.compile(r'<\S{,8}九\S{,22}</\S{,5}>')
s = rejiu.sub("", s)
wTemp.write(nfn) # 标题写回
wTemp.write("\n")
wTemp.write(s)
rInit.close()
wTemp.close()
-End-
- 上一篇:java学习中的13个核心技术
- 下一篇:正则表达式学习之替换分组练习 正则全部替换
相关推荐
- 如何在HTML中使用JavaScript:从基础到高级的全面指南!
-
“这里是云端源想IT,帮你...
- 推荐9个Github上热门的CSS开源框架
-
大家好,我是Echa。...
- 硬核!知网首篇被引过万的论文讲了啥?作者什么来头?
-
整理|袁小华近日,知网首篇被引量破万的中文论文及其作者备受关注。知网中心网站数据显示,截至2021年7月23日,由华南师范大学教授温忠麟等人发表在《心理学报》2004年05期上的学术论文“中介效应检验...
- 为什么我推荐使用JSX开发Vue3_为什么用vue不用jquery
-
在很长的一段时间中,Vue官方都以简单上手作为其推广的重点。这确实给Vue带来了非常大的用户量,尤其是最追求需求开发效率,往往不那么在意工程代码质量的国内中小企业中,Vue占据的份额极速增长...
-
- 【干货】一文详解html和css,前端开发需要哪些技术?
-
网站开发简介...
-
2025-02-20 18:34 yuyutoo
- 分享几个css实用技巧_cssli
-
本篇将介绍几个css小技巧,目录如下:自定义引用标签的符号重置所有标签样式...
- 如何在浏览器中运行 .NET_怎么用浏览器运行代码
-
概述:...
- 前端-干货分享:更牛逼的CSS管理方法-层(CSS Layers)
-
使用CSS最困难的部分之一是处理CSS的权重值,它可以决定到底哪条规则会最终被应用,尤其是如果你想在Bootstrap这样的框架中覆盖其已有样式,更加显得麻烦。不过随着CSS层的引入,这一...
-
- HTML 基础标签库_html标签基本结构
-
HTML标题HTML标题(Heading)是通过-...
-
2025-02-20 18:34 yuyutoo
- 前端css面试20道常见考题_高级前端css面试题
-
1.请解释一下CSS3的flexbox(弹性盒布局模型),以及适用场景?display:flex;在父元素设置,子元素受弹性盒影响,默认排成一行,如果超出一行,按比例压缩flex:1;子元素设置...
- vue引入外部js文件并使用_vue3 引入外部js
-
要在Vue中引入外部的JavaScript文件,可以使用以下几种方法:1.使用``标签引入外部的JavaScript文件。在Vue的HTML模板中,可以直接使用``标签来引入外部的JavaScrip...
- 网页设计得懂css的规范_html+css网页设计
-
在初级的前端工作人员,刚入职的时候,可能在学习前端技术,写代码不是否那么的规范,而在工作中,命名的规范的尤为重要,它直接与你的代码质量挂钩。网上也受很多,但比较杂乱,在加上每年的命名都会发生一变化。...
- Google在Chrome中引入HTML 5.1标记
-
虽然负责制定Web标准的WorldWideWebConsortium(W3C)尚未宣布HTML5正式推荐规格,而Google已经迁移到了HTML5.1。即将发布的Chrome38将引入H...
- HTML DOM 引用( ) 对象_html中如何引用js
-
引用对象引用对象定义了一个同内联元素的HTML引用。标签定义短的引用。元素经常在引用的内容周围添加引号。HTML文档中的每一个标签,都会创建一个引用对象。...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- mybatis plus (70)
- scheduledtask (71)
- css滚动条 (60)
- java学生成绩管理系统 (59)
- 结构体数组 (69)
- databasemetadata (64)
- javastatic (68)
- jsp实用教程 (53)
- fontawesome (57)
- widget开发 (57)
- vb net教程 (62)
- hibernate 教程 (63)
- case语句 (57)
- svn连接 (74)
- directoryindex (69)
- session timeout (58)
- textbox换行 (67)
- extension_dir (64)
- linearlayout (58)
- vba高级教程 (75)
- iframe用法 (58)
- sqlparameter (59)
- trim函数 (59)
- flex布局 (63)
- contextloaderlistener (56)