Why (^|\b)на́($|\b)
doesn't match віч на́ віч
?
re.sub(r'(^|\b)на́($|\b)', 'на', 'віч на́ віч', flags=re.UNICODE)
is giving 'віч на́ віч'
, while I want віч на віч
.
Why (^|\b)на́($|\b)
doesn't match віч на́ віч
?
re.sub(r'(^|\b)на́($|\b)', 'на', 'віч на́ віч', flags=re.UNICODE)
is giving 'віч на́ віч'
, while I want віч на віч
.
Use \W
:
import re
s = "віч на́ віч"
final_s = re.findall('\W+', s)[0]
Output:
"віч на́ віч"