java正则-取出指定字符串之间的内容

createh54个月前 (12-13)技术教程52

往往有很多需求,需要取出指定字符之间的字符串,取的方式有多种,关系到重复使用的问题,如abc123abc456abc,如果使用正则取出abc之间的内容,这里可能有两种结果,

结果1: 123 456

结果2: 123

为什么有两种结果呢

这里的一个区别就是,abc能否重复使用的问题,结果1就是abc重复使用了,而结果2中取法,abc不可重复使用


下面代码取出abc之间的内容

public static void main(String[] args) {
/Pattern p = Pattern.compile("\\@(.*?)\\:");//正则表达式,取=和|之间的字符串,不包括=和|
		  
		  String filetext = "abc张小名abc 25分abc李小花abc 43分abc王力abc 100分abc";
		  Pattern p = Pattern.compile("abc(.*?)abc");	  
		  
		  Matcher m = p.matcher(filetext);
		   while(m.find()) {
		          System.out.println(m.group());//m.group(1)不包括这两个字符
		 
		}

结果为:

张小名

李小花

王力


很明显,上面的正则取法是不可重复的匹配法,每次匹配后,abc不可下次使用

我们在改下代码


public static void main(String[] args) {
 
		  String filetext = "abc张小名abc 25分abc李小花abc 43分abc王力abc 100分abc";
		  //Pattern p = Pattern.compile("abc(.*?)abc");//正则表达式 会消耗字符串abc
		  Pattern p = Pattern.compile("(?<=abc)(.*?)(?=abc)");//不消耗字符串abc
		  
		  Matcher m = p.matcher(filetext);
		   while(m.find()) {
		          System.out.println(m.group(1));//m.group(1)不包括这两个字符
		 
		}
	}

运行结果:


这里我们可以看到,这种正则匹配是可以重复使用abc的,也就是指针没有下移,把abc之间的内容都娶到了

以上是两种正则的区别,需要根据实际场景来使用


关于正则表达式引擎,可以参考下图来学习


(?:pattern) 与 (?=pattern)也有一些区别,主要在于消耗字符、是否输出匹配结果方面,如下图已经说得很清楚了


相关文章

如何在JAVA中比较字符串(string)?

如何在JAVA中比较字符串(string)?我们有两个字符串a和b,如何比较它们呢?用==还是.equals()?==和.equals()有什么区别==比较的左右两侧的值。当左右两侧为基本类型的时候,...

java判断字符串中是否包含某个字符

1 使用String类的contains()方法contains()方法用于判断字符串中是否包含指定的字符或字符串。语法如下:public boolean contains(CharSequence...

我们必须要了解的Java位运算(不仅限于Java)

我们必须要了解的Java位运算(不仅限于Java) - 陈咬金 - 博客园基本概念1、当前常见的CPU位数是32位和64位,所谓32位处理器就是一次只能处理32位,也就是4个字节的数据,而64位处理器...

Java分割字符串(spilt())

String 类的 split() 方法可以按指定的分割符对目标字符串进行分割,分割后的内容存放在字符串数组中。该方法主要有如下两种重载形式:其中它们的含义如下:str 为需要分割的目标字符串。sig...