I'd like to clean the string from any words, which does not contain at least one Cyrillic letter (by words I mean parts of string split by whitespace char)
I've tried line = re.sub(' *^[^а-яА-Я]+ *', ' ', line)
where [а-яА-Я]
is set of cyrrilic letters, but when processing string
des поместья, de la famille Buonaparte. Non, je vous préviens que si vous
it returns
поместья, de la famille Buonaparte. Non, je vous préviens que si vous
instead of оf just
поместья