#python #pandas #tensorflow
Вопрос:
Я работаю с классическим набором данных titanic и пытаюсь применить NNs. Мои данные уже разделены на наборы для обучения и разработки. Однако я хочу объединить наборы данных вместе для многих вещей (например, для моего собственного разделения и т. Д.).
Есть ли способ объединить оба набора данных? Я осмотрелся и нашел только информацию о том, как разделить набор данных, но я не смог найти, как объединить их обратно вместе. Какая-нибудь помощь?
Ниже приводится MWE!
from __future__ import absolute_import,division,print_function,unicode_literals
import numpy as np
import pandas as pd
import matplotlib
import matplotlib.pyplot as plt
%matplotlib inline
from IPython.display import clear_output
from six.moves import urllib
import tensorflow.compat.v2.feature_column as fc
import tensorflow as tf
import seaborn as sns
# URL address of data
TRAIN_DATA_URL = "https://storage.googleapis.com/tf-datasets/titanic/train.csv"
TEST_DATA_URL = "https://storage.googleapis.com/tf-datasets/titanic/eval.csv"
# Downloading data
train_file_path = tf.keras.utils.get_file("train.csv", TRAIN_DATA_URL)
test_file_path = tf.keras.utils.get_file("eval.csv", TEST_DATA_URL)
# Reading data
data_train = pd.read_csv(train_file_path)
data_test = pd.read_csv(test_file_path)
MY_DATA= MERGE HERE????? # merge(data_train,data_test)??
Ответ №1:
Я предполагаю, что data_train и data_test имеют одинаковое количество столбцов, а имена столбцов одинаковы. Тогда просто сделай
merged_df= pd.concat([data_train, data_test], axis=0)