#c #pytorch #jit #libtorch
#c #pytorch #jit #libtorch
Вопрос:
Я использую одну и ту же модель трассировки в pytorch и libtorch, но я получаю разные выходные данные.
Код на Python:
import cv2
import numpy as np
import torch
import torchvision
from torchvision import transforms as trans
# device for pytorch
device = torch.device('cuda:0')
torch.set_default_tensor_type('torch.cuda.FloatTensor')
model = torch.jit.load("traced_facelearner_model_new.pt")
model.eval()
# read the example image used for tracing
image=cv2.imread("videos/example.jpg")
test_transform = trans.Compose([
trans.ToTensor(),
trans.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5])
])
resized_image = cv2.resize(image, (112, 112))
tens = test_transform(resized_image).to(device).unsqueeze(0)
output = model(tens)
print(output)
Код на C :
#include <iostream>
#include <algorithm>
#include <opencv2/opencv.hpp>
#include <torch/script.h>
int main()
{
try
{
torch::jit::script::Module model = torch::jit::load("traced_facelearner_model_new.pt");
model.to(torch::kCUDA);
model.eval();
cv::Mat visibleFrame = cv::imread("example.jpg");
cv::resize(visibleFrame, visibleFrame, cv::Size(112, 112));
at::Tensor tensor_image = torch::from_blob(visibleFrame.data, { 1, visibleFrame.rows,
visibleFrame.cols, 3 }, at::kByte);
tensor_image = tensor_image.permute({ 0, 3, 1, 2 });
tensor_image = tensor_image.to(at::kFloat);
tensor_image[0][0] = tensor_image[0][0].sub(0.5).div(0.5);
tensor_image[0][1] = tensor_image[0][1].sub(0.5).div(0.5);
tensor_image[0][2] = tensor_image[0][2].sub(0.5).div(0.5);
tensor_image = tensor_image.to(torch::kCUDA);
std::vector<torch::jit::IValue> input;
input.emplace_back(tensor_image);
// Execute the model and turn its output into a tensor.
auto output = model.forward(input).toTensor();
output = output.to(torch::kCPU);
std::cout << "Embds: " << output << std::endl;
std::cout << "Done!n";
}
catch (std::exception e)
{
std::cout << "exception" << e.what() << std::endl;
}
}
Модель выдает (1x512)
тензор выходного размера, как показано ниже.
Выходные данные Python
tensor([[-1.6270e 00, -7.8417e-02, -3.4403e-01, -1.5171e 00, -1.3259e 00,
-1.1877e 00, -2.0234e-01, -1.0677e 00, 8.8365e-01, 7.2514e-01,
2.3642e 00, -1.4473e 00, -1.6696e 00, -1.2191e 00, 6.7770e-01,
...
-7.1650e-01, 1.7661e-01]], device=‘cuda:0’,
grad_fn=)
Выходные данные C
Embds: Columns 1 to 8 -84.6285 -14.7203 17.7419 47.0915 31.8170 57.6813 3.6089 -38.0543
Columns 9 to 16 3.3444 -95.5730 90.3788 -10.8355 2.8831 -14.3861 0.8706 -60.7844
...
Columns 505 to 512 36.8830 -31.1061 51.6818 8.2866 1.7214 -2.9263 -37.4330 48.5854
[ CPUFloatType{1,512} ]
Использование
- Pytorch 1.6.0
- Libtorch 1.6.0
- Visual studio 2019
- Windows 10
- Cuda 10.1
Комментарии:
1. Вы понимаете свой (довольно длинный) код намного лучше, чем мы. Если вы хотите, чтобы мы вам помогли, было бы лучше всего поделиться своими мыслями о проблеме. Как вы думаете, почему этот код не обеспечивает правильный вывод? И что на самом деле должен делать этот код?
2. И c , и python-код, по сути, делают одно и то же, то есть загружается модель CNN и в нее вводятся входные данные. Как уже упоминалось, выходные данные представляют собой тензор размера (1×512). Проблема в том, что значения в этом тензоре выходных данных, задаваемые моделью, отличаются в C и python. Я не уверен, почему это происходит, хотя входное изображение, этапы предварительной обработки, модель одинаковы в обоих.
3. вам просто нужно масштабировать один раз »
tensor_image.sub_(0.5).div_(0.5);
также попробуйте отменить запрос вашего тензора после того, как вы создали тензор (удалите 1 из load_from_blob и просто используйте соответствующие строки и столбцы) также вам не нужно IValue, просто используйтеmodel.forward({tensor_image})
4. кстати, перед этим вам нужно изменить масштаб вашего тензора на 255. а затем выполнить нормализацию
Ответ №1:
перед окончательной нормализацией вам необходимо масштабировать входные данные до диапазона 0-1, а затем продолжить нормализацию, которую вы выполняете. преобразование в float, а затем деление на 255 должно привести вас к этому. Вот фрагмент, который я написал, могут быть некоторые синтаксические ошибки, которые должны быть видны.
Попробуйте это :
#include <iostream>
#include <algorithm>
#include <opencv2/opencv.hpp>
#include <torch/script.h>
int main()
{
try
{
torch::jit::script::Module model = torch::jit::load("traced_facelearner_model_new.pt");
model.to(torch::kCUDA);
cv::Mat visibleFrame = cv::imread("example.jpg");
cv::resize(visibleFrame, visibleFrame, cv::Size(112, 112));
at::Tensor tensor_image = torch::from_blob(visibleFrame.data, { visibleFrame.rows,
visibleFrame.cols, 3 }, at::kByte);
tensor_image = tensor_image.to(at::kFloat).div(255).unsqueeze(0);
tensor_image = tensor_image.permute({ 0, 3, 1, 2 });
ensor_image.sub_(0.5).div_(0.5);
tensor_image = tensor_image.to(torch::kCUDA);
// Execute the model and turn its output into a tensor.
auto output = model.forward({tensor_image}).toTensor();
output = output.cpu();
std::cout << "Embds: " << output << std::endl;
std::cout << "Done!n";
}
catch (std::exception e)
{
std::cout << "exception" << e.what() << std::endl;
}
}
У меня нет доступа к системе для запуска этого, поэтому, если вы столкнетесь с чем-либо, прокомментируйте ниже.
Комментарии:
1. Огромное спасибо! это сработало. Но не могли бы вы сказать мне, зачем масштабировать тензор на 255 перед его нормализацией?
2. @Arki99, это значение по умолчанию для pytorchs ToTensor. когда вы выполняете
ToTensor()
преобразование в Pytorch, оно просто масштабирует входное изображение в диапазоне 0-1. итак, чтобы получить одинаковое поведение, вам нужно сделать то же самое в libtorch.3. понял. Большое спасибо.