import re
# Calea către fișierul tău
file_path = "g:\Pyton+ChatGPT\dictionar_no_duplicates.txt"
# Citește conținutul fișierului
with open(file_path, "r", encoding="utf-8") as file:
text = file.read()
# Elimină cuvintele duplicate
result = re.sub(r'\b(\w+)\b(?=.*\b\1\b)', '', text)
# Elimină spații suplimentare sau virgule consecutive
result = re.sub(r'\s+', ' ', result).strip().replace(" ,", ",")
# Rescrie fișierul cu conținutul fără duplicate
with open(file_path, "w", encoding="utf-8") as file:
file.write(result)
OR THIS
def remove_duplicates(words):
words_stack = []
for val in words:
if val not in words_stack:
words_stack.append(val)
return words_stack
input_file = r'g:\Pyton+ChatGPT\dictionar.txt'
output_file = r'g:\Pyton+ChatGPT\dictionar_no_duplicates.txt'
with open(input_file, 'r', encoding='utf-8') as f:
words = f.read().splitlines()
unique_words = remove_duplicates(words)
with open(output_file, 'w', encoding='utf-8') as f:
for word in unique_words:
f.write(word + '\n')
print("Duplicate removal completed.")
OR THIS
import re
# Calea către fișierul tău
file_path = "g:\Pyton+ChatGPT\dictionar_no_duplicates.txt"
# Citește conținutul fișierului
with open(file_path, "r", encoding="utf-8") as file:
text = file.read()
# Crează o listă pentru cuvintele eliminate
removed_words = []
# Funcție callback pentru a adăuga cuvintele duplicate în listă
def replace_and_collect(match):
word = match.group(1)
if word not in removed_words:
removed_words.append(word)
return ''
# Elimină cuvintele duplicate și virgula asociată folosind funcția callback
result = re.sub(r'\b(\w+)\b,?(?=.*\b\1\b)', replace_and_collect, text)
# Elimină spații suplimentare sau virgule consecutive
result = re.sub(r'\s+', ' ', result).strip().replace(" ,", ",").strip(", ")
# Rescrie fișierul cu conținutul fără duplicate
with open(file_path, "w", encoding="utf-8") as file:
file.write(result)
# Afișează informații despre cuvintele eliminate
print(f"Numărul de cuvinte duplicate eliminate: {len(removed_words)}")
print(f"Cuvintele eliminate: {', '.join(removed_words)}")