我有一个非常大的英语对话JSON数据集,我想询问是否有任何工具或方法可以将其从英语翻译成阿拉伯语?
回答:
有一个适用于Python的Google翻译包。https://pypi.org/project/googletrans/
你可以用Python读取JSON文件,然后逐句翻译。如果你愿意,之后可以再次保存为JSON格式。
假设你有一个名为”translate”的函数(使用该库的包装函数),它可以将一个英文数据点翻译成阿拉伯语。你需要的类似于这样。
with open(data_json_path, 'r') as f: data_json = json.load(f)english_as_list = [sample['text'] for sample in data_json]arabic = [translate(sample) for sample in english_as_list]