#python #csv #regression #linear-regression #digits
#python #csv #регрессия #линейная регрессия #цифры
Вопрос:
Из этого примера,
https://github.com/NVIDIA/DIGITS/tree/master/examples/regression
Я test_lmdb_creator.py . То, что я пытаюсь сделать, это * .py, способный загружать CSV-файл следующим образом:
469;class_1
480;class_1
480;class_2
471;class_3
...
Это огромный файл с миллионами строк. Итак, мне нужно взять несколько строк и создать train_db, val_db и test_db с этими строками.
Мне очень сложно программировать это на Python, пытаясь изменить test_lmdb_creator.py для моих нужд. Для каждого изображения градиенты x и y (нормализованные) выбираются случайным образом из равномерного распределения [-0,5, 0,5) в этом фрагменте кода из test_lmdb_creator.py:
for i in xrange(image_count):
xslope, yslope = np.random.random_sample(2) - 0.5
Я должен получить некоторые числовые значения из файла CSV и поместить их на место этого равномерного распределения. После этого я также должен «связать» метки из файла CSV (class_1, classe_2 и т. Д.) Для каждого соответствующего числового значения, разделив некоторые для train_db, а другие для val_db. Test_db, который я уже модифицировал для n изображений, потому что оригинал test_lmdb_creator.py создает только одно тестовое изображение. Но он имеет тот же код строки, который необходимо изменить:
xslope, yslope = 0.5, 0.5
Эти 0,5, 0,5 должны быть получены из остальных числовых значений из файла CSV, которые не используются для train_db и val_db. Я уже составил список со всеми числовыми значениями и классами из CSV-файла на Python, но я не знаю, как «передать» их через xslopes и yslopes и «связать» метки (или классы) для каждого значения. У вас есть какие-либо советы или предложения? Спасибо.
Комментарии:
1. Что вы пытались сделать до сих пор?
2. Извините за потраченное время. Я изменил вопрос.