Используйте функцию tensorflow text_dataset_from_directory вместо классификации, но регрессии?

#python #tensorflow2.0

Вопрос:

Я использую набор данных обзоров фильмов IMDB и помещаю разные обзоры в разные режиссеры в соответствии с рейтингом отзывов.

подобный этому: введите описание изображения здесь

и код :

 import os
import shutil
import tensorflow as tf
import tensorflow_hub as hub
import tensorflow_text as text
import matplotlib.pyplot as plt
from tensorflow.keras import losses


AUTOTUNE = tf.data.AUTOTUNE
batch_size = 32
seed = 42

raw_train_ds = tf.keras.preprocessing.text_dataset_from_directory(
    'train',
    batch_size=batch_size,
    validation_split=0.2,
    subset='training',
    label_mode='int',
    seed=seed)

val_ds = tf.keras.preprocessing.text_dataset_from_directory(
    'train',
    batch_size=batch_size,
    validation_split=0.2,
    subset='validation',
    label_mode='int',
    seed=seed)

test_ds = tf.keras.preprocessing.text_dataset_from_directory(
    'test',
    label_mode='int',
    batch_size=batch_size)

class_names = raw_train_ds.class_names

print(class_names)
 

вывод выглядит так:
введите описание изображения здесь

но я хочу предсказать рейтинг неизвестных отзывов с помощью меток значений int.

Ответ №1:

хорошо, я добавляю значение int в список.

train_label =[]

когда я использую tf.keras.предварительная обработка.text_dataset_from_directory(), я помещаю список меток в список меток.

 raw_train_ds = tf.keras.preprocessing.text_dataset_from_directory(
    'train',
    batch_size=batch_size,
    validation_split=0.2,
    subset='training',
    labels = train_label,
    seed=seed
    )
 

когда я печатаю метку набора данных, на данный момент она работает.