#python #json #machine-learning #nlp #dataset
#python #json #машинное обучение #nlp #набор данных
Вопрос:
У меня есть очень большой набор данных JSON разговоров на английском языке, и я хотел бы спросить, есть ли какой-либо инструмент или способ, который может перевести их с английского на арабский язык?
Комментарии:
1. Попробуйте pypi.org/project/googletrans
Ответ №1:
Для python существует пакет Google translate. https://pypi.org/project/googletrans /
Вы можете прочитать файл json на python, а затем перевести каждое предложение одно за другим. Позже, если вы хотите, вы можете сохранить его снова как json.
Предполагая, что у вас есть функция с именем «translate» (функция-оболочка с использованием библиотеки), которая переводит одну точку данных с английского на арабский. Что-то вроде этого — это то, что вам нужно.
with open(data_json_path, 'r') as f:
data_json = json.load(f)
english_as_list = [sample['text'] for sample in data_json]
arabic = [translate(sample) for sample in english_as_list]