объединение обучающих и тестовых наборов данных в один с помощью tensorflow

#python #pandas #tensorflow

Вопрос:

Я работаю с классическим набором данных titanic и пытаюсь применить NNs. Мои данные уже разделены на наборы для обучения и разработки. Однако я хочу объединить наборы данных вместе для многих вещей (например, для моего собственного разделения и т. Д.).

Есть ли способ объединить оба набора данных? Я осмотрелся и нашел только информацию о том, как разделить набор данных, но я не смог найти, как объединить их обратно вместе. Какая-нибудь помощь?

Ниже приводится MWE!

 from __future__ import absolute_import,division,print_function,unicode_literals
import numpy as np 
import pandas as pd
import matplotlib
import matplotlib.pyplot as plt
%matplotlib inline

from IPython.display import clear_output
from six.moves import urllib
import tensorflow.compat.v2.feature_column as fc 
import tensorflow as tf 
import seaborn as sns

# URL address of data
TRAIN_DATA_URL = "https://storage.googleapis.com/tf-datasets/titanic/train.csv"
TEST_DATA_URL = "https://storage.googleapis.com/tf-datasets/titanic/eval.csv"

# Downloading data
train_file_path = tf.keras.utils.get_file("train.csv", TRAIN_DATA_URL)
test_file_path  = tf.keras.utils.get_file("eval.csv", TEST_DATA_URL)
# Reading data
data_train = pd.read_csv(train_file_path)
data_test  = pd.read_csv(test_file_path)

MY_DATA= MERGE HERE????? # merge(data_train,data_test)??

 

Ответ №1:

Я предполагаю, что data_train и data_test имеют одинаковое количество столбцов, а имена столбцов одинаковы. Тогда просто сделай

 merged_df= pd.concat([data_train, data_test], axis=0)