[[ :punct: ]]和众多regex类似,这个表示所有的标点符号。
在数据分析时,如果你不需要句子里的标点,可以使用:
gsub("[[:punct:]]", "", x) #这里将x数据里的所有标点符号变成“”(空)。
如下:
x<- 'hello.+$%..world'
gsub("[[:punct:]]", "", x) #结果为 "helloworld"
可以看到,所有标点符号都被消除了
如果想在中间加一个空格(为了美观),我们可以写成:
x<- 'hello.+$%..world'
gsub("[[:punct:]]+", " ", x) #结果为 "hello world"
|