提取拆分字符串,用REGEXP函数解锁WPS表格的文本处理超能力-夜雨聆风

提取拆分字符串,用REGEXP函数解锁WPS表格的文本处理超能力

“你是否曾在表格里为处理杂乱文本头疼过？要从混杂了文字、数字、符号的单元格里提取姓名、电话号、数量、金额等，要批量校验几千条号码格式是否正确，要把不规范的日期统一成标准格式等等。过去这些操作要么需要嵌套好几层文本函数，要么只能手动一条条修改，效率低还容易出错。”

作为WPS表格独有的正则表达式函数，REGEXP函数的出现直接解决了这些痛点。它把强大的正则表达式能力封装成了简单的函数形式，只需一个公式就能实现从前复杂操作才能完成的文本处理需求，真正让复杂文本处理变得简单高效。

—

REGEXP函数基础说明

REGEXP函数基于Perl兼容的正则表达式（PCRE）语法标准，支持文本的提取、判断、替换三大核心能力，默认区分大小写，语法结构非常简洁：

=REGEXP(原始字符串, 正则表达式, [匹配模式], [替换内容])

参数	是否必填	说明
原始字符串	是	需要处理的文本内容，可以是单元格引用或直接输入的文本
正则表达式	是	用于匹配文本规则的表达式，决定了函数要匹配的内容特征
匹配模式	否（默认0）	0：提取模式，返回匹配到的文本结果（数组）1：判断模式，返回TRUE/FALSE判断是否匹配2：替换模式，用指定内容替换匹配到的文本3：完整提取模式，返回所有匹配结果（多维数组，适合多值场景）
替换内容	否（仅模式2生效）	替换模式下用于替换匹配内容的文本，支持用`\1`、`\2`引用正则表达式中的分组内容

—

—

下面的案例均来自真实办公场景，公式可以直接套用。

场景：校验客户信息表中的手机号是否符合11位规范，避免后续通知短信发送失败。

=REGEXP(A2,"^1[3-9]\d{9}$",1)

效果：符合规范的手机号返回TRUE，格式错误（比如位数不对、号段不存在）的返回FALSE，配合条件格式可以一键标红错误数据。

正则解析：

场景：从混有汉字、数字、符号的快递地址里，批量提取所有手机号码。公式：

=REGEXP(A2,"(?<=^|\D)1[3-9]\d{9}(?=\D|$)")

效果：即使单元格里同时包含姓名、地址、多个手机号，也能精准把所有手机号提取出来。

正则解析：

(?<=^|\D)

用于限定我们要匹配的内容（比如手机号），它的前面必须是「字符串开头」或者「非数字字符」，如果不限定，那么一长串数字中，如有符合手机号规则的，也会被匹配进来。具体请看示例图片
1[3-9]\d{9}

匹配11位手机号，且是1开头，第二位是3-8的数字串
(?=\D|$)

与前面的前面限定配套使用，限定必须是【字符串】或者【非数字】结尾，以确保不会误截取。

括号内的规则解释后面会作更具体的解答，请留意后续发表的文章

场景：如果需要提取数字并直接求和或乘积的，套个SUM、PRODUCT函数即可，如根据规格得体积、根据数量单价得金额等。公式：

=SUM(--REGEXP(A2,"[0-9.-]+"))=PRODUCT(--REGEXP(A2,"[0-9.-]+"))

效果：提取单元格，混合记录的数量，单价，长宽高等数据，并计算

正则解析：

场景：导出的客户信息中手机号是明文显示，需要批量把中间4位替换为****，实现隐私脱敏。

公式：

=REGEXP(A2,"(\d{3})\d{4}(\d{4})",2,"\1****\2")

效果：原始数据：张三，13800138000 结果：张三，138****8000

正则解析：

—

常用的正则规则

正则表达式函数对于文本处理能力非常强大，后续将继续推出该函数的一些使用案例，尽量让我们在日常工作中复制粘贴即可使用。