1、求小说章节匹配规则!正则表达式
[0-9]{3} (.*)
2、求 分割文章成句子的 正则表达式.
问题描述的太简单了,至少应陵洞说明以什么语言实现,文章是什么语言的,以什么标准判断是一个句子(比如引号中的句子是否也单独作为一句等)。
回答补充:
(^|(?![。?!…]))[“]?[^。?!…]+[。?!…][…]?[”]?
基本逻辑就是从一行开头或者上一个句子结束标点匹配到下一个句子结束标点(所以句子前的空格也会被匹配轿租进句子)。另外,对特殊的如双引号和省略号(两个…组成)做了处理。应该基本可以满足你的要求,但是遇到含有引号的句子时还有问题。
比如:
XX说:“啊?尺帆枯哦。你还是走吧!”
→ {'XX说:“啊?','哦。','你还是走吧!”'}(引号被划分到不同句子中)
“这究竟是怎么回事呢,同志们?”厂长严肃地说。
→ {'“这究竟是怎么回事呢,同志们?”','厂长严肃地说。'}(句子结构被破坏,下同)
“还愣着干吗?”妈妈大声地训斥我,“等会儿老师来了,看你怎么办……”
→ {'“还愣着干吗?”','妈妈大声地训斥我,“等会儿老师来了,看你怎么办……”'}
能力有限,等待高手出现……
3、如何用正则表达式查找替换? 例如 小说的目录,分为两种“001—002章”或“033章”
按照你的要求替换“001—002章”或“033章”为“第001—002章”“第033章”的正则表达式为([0-9][0-9][0-9]章|[0-9][0-9][0-9]—[0-9][0-9][0-9]章) 替换为 第$1
我给你一个Javascript语言的完整例子,你看看吧
<script type=text/javascript>另外,再给你一个Java语言的例子,以供参考
public class AA {4、用正则表达式来为小说的每一章的标题“第几章XXX”后面加加个空格变成"第几章 XXX"? 搜索什么?替换什么
?<=pattern)
零宽度正向回查,凳高不捕获匹配结果。
'2000 (?<=Office|Word|Excel)'枣茄尺
匹配 " Office2000" 中的 "2000"纳培
不匹配 "Windows2000" 中的 "2000"。
replace
5、php 正则表达式给小说如何分章
这样
第[^章]+章[sS]*?(?:(?=第[^章]+章)|$)6、求助:拆分章节的正则表达式问题
下面的正则表达式要用多行模式蔽缺搜,而且假设章节号前面没有空格,章节号中的点为英文 ^\d+\.(\d+)?.*?(?=(\s+^\d+\宏历.(\d+)?|\扮判Z))