#python #tensorflow #tensorflow-datasets
Вопрос:
Не будучи инженером, я испытываю проблемы с соблюдением документации TF о том, как создавать набор данных.
Я собрал набор предложений с метками, которые я хотел бы превратить в набор данных TF, аналогичный набору данных IMDB.
Список выглядит так:
LIST=[('text1',0),('text2',1),('text3',1),('text4',0),...]
В списке ~100 000 элементов и 2 возможных метки 0-1.
Моя задача состоит в том, чтобы построить модель, которая связывает данное предложение с одной меткой 0-1, как в базовом примере TF для обзоров IMDB.
Я бы предположил, что мне больше ничего не нужно для создания набора данных. Я ошибаюсь?
Как я могу превратить этот список в набор данных TF?
Я был бы признателен любому гиду
Ответ №1:
Рабочий пример кода
import tensorflow as tf
LIST=[('text1',0),('text2',1),('text3',1),('text4',0)]
text = [x[0] for x in LIST]
label = [x[1] for x in LIST]
dataset = tf.data.Dataset.from_tensor_slices(text)
for element in dataset:
print(element)
Выход:
tf.Tensor(b'text1', shape=(), dtype=string)
tf.Tensor(b'text2', shape=(), dtype=string)
tf.Tensor(b'text3', shape=(), dtype=string)
tf.Tensor(b'text4', shape=(), dtype=string)