How to use Python to decode
[Hài kịch] Vợ ơi là vợ - Vân Sơn Bảo Liêm & Lê Huỳnh
into this
[Hài kịch] Vợ ơi là vợ - Vân Sơn Bảo Liêm & Lê Huỳnh
Thanks.
I have tried the following code from the above susgeted thread:
import re, HTMLParser
title="[Hài kịch] Vợ ơi là vợ - Vân Sơn Bảo Liêm & Lê Huỳnh"
list_of_html = re.findall("&.+?;", title)
for e in list_of_html:
h = HTMLParser.HTMLParser()
unescaped = h.unescape(e)
title = title.replace(e, unescaped)
print title
but got an error message:
Unsupported characters in input
because I have these words in the title "kịch Vợ ơi vợ - Sơn Bảo Huỳnh". How can I correct it?