I want to remove all words that begin with \u. I believe these are unicode '\uXXXX'.
The original string:
"RT \u2066als \u2066@WBHoekstra\u2069 zijn poot maar stijf houdt in de Italiaanse kwestie. Leest Mattheus 25, 2-13 '"
Desired output:
"RT @WBHoekstra zijn poot maar stijf houdt in de Italiaanse kwestie. Leest Mattheus 25, 2-13 '"
I tried using regex like so:
re.sub('\u\w+','',item )
But I get the following error:
"SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 0-1: truncated \uXXXX escape"