Перевод набора данных json на другой естественный язык

#python #json #machine-learning #nlp #dataset

#python #json #машинное обучение #nlp #набор данных

Вопрос:

У меня есть очень большой набор данных JSON разговоров на английском языке, и я хотел бы спросить, есть ли какой-либо инструмент или способ, который может перевести их с английского на арабский язык?

Комментарии:

1. Попробуйте pypi.org/project/googletrans

Ответ №1:

Для python существует пакет Google translate. https://pypi.org/project/googletrans /

Вы можете прочитать файл json на python, а затем перевести каждое предложение одно за другим. Позже, если вы хотите, вы можете сохранить его снова как json.

Предполагая, что у вас есть функция с именем «translate» (функция-оболочка с использованием библиотеки), которая переводит одну точку данных с английского на арабский. Что-то вроде этого — это то, что вам нужно.

 with open(data_json_path, 'r') as f:
    data_json = json.load(f)

english_as_list = [sample['text'] for sample in data_json]
arabic = [translate(sample) for sample in english_as_list]