Разные выходные данные Libtorch C и pytorch

ProgramBox

Разные выходные данные Libtorch C и pytorch

Post author:admin
Запись опубликована:14 апреля, 2023
Post category:Вопросы по программированию

#c #pytorch #jit #libtorch

Вопрос:

Я использую одну и ту же модель трассировки в pytorch и libtorch, но я получаю разные выходные данные.

Код на Python:

 import cv2
import numpy as np 
import torch
import torchvision
from torchvision import transforms as trans


# device for pytorch
device = torch.device('cuda:0')

torch.set_default_tensor_type('torch.cuda.FloatTensor')

model = torch.jit.load("traced_facelearner_model_new.pt")
model.eval()

# read the example image used for tracing
image=cv2.imread("videos/example.jpg")

test_transform = trans.Compose([
        trans.ToTensor(),
        trans.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5])
    ])       

resized_image = cv2.resize(image, (112, 112))

tens = test_transform(resized_image).to(device).unsqueeze(0)
output = model(tens)
print(output)

Код на C :

 #include <iostream>
#include <algorithm> 
#include <opencv2/opencv.hpp>
#include <torch/script.h>


int main()
{
    try
    {
        torch::jit::script::Module model = torch::jit::load("traced_facelearner_model_new.pt");
        model.to(torch::kCUDA);
        model.eval();

        cv::Mat visibleFrame = cv::imread("example.jpg");

        cv::resize(visibleFrame, visibleFrame, cv::Size(112, 112));
        at::Tensor tensor_image = torch::from_blob(visibleFrame.data, { 1, visibleFrame.rows, 
                                                    visibleFrame.cols, 3 }, at::kByte);
        tensor_image = tensor_image.permute({ 0, 3, 1, 2 });
        tensor_image = tensor_image.to(at::kFloat);

        tensor_image[0][0] = tensor_image[0][0].sub(0.5).div(0.5);
        tensor_image[0][1] = tensor_image[0][1].sub(0.5).div(0.5);
        tensor_image[0][2] = tensor_image[0][2].sub(0.5).div(0.5);

        tensor_image = tensor_image.to(torch::kCUDA);
        std::vector<torch::jit::IValue> input;
        input.emplace_back(tensor_image);
        // Execute the model and turn its output into a tensor.
        auto output = model.forward(input).toTensor();
        output = output.to(torch::kCPU);
        std::cout << "Embds: " << output << std::endl;

        std::cout << "Done!n";
    }
    catch (std::exception e)
    {
        std::cout << "exception" << e.what() << std::endl;
    }
}

Модель выдает (1x512) тензор выходного размера, как показано ниже.

Выходные данные Python

 tensor([[-1.6270e 00, -7.8417e-02, -3.4403e-01, -1.5171e 00, -1.3259e 00,

-1.1877e 00, -2.0234e-01, -1.0677e 00, 8.8365e-01, 7.2514e-01,

2.3642e 00, -1.4473e 00, -1.6696e 00, -1.2191e 00, 6.7770e-01,

...

-7.1650e-01, 1.7661e-01]], device=‘cuda:0’,
grad_fn=)

Выходные данные C

 Embds: Columns 1 to 8 -84.6285 -14.7203 17.7419 47.0915 31.8170 57.6813 3.6089 -38.0543


Columns 9 to 16 3.3444 -95.5730 90.3788 -10.8355 2.8831 -14.3861 0.8706 -60.7844

...

Columns 505 to 512 36.8830 -31.1061 51.6818 8.2866 1.7214 -2.9263 -37.4330 48.5854

[ CPUFloatType{1,512} ]

Использование

Pytorch 1.6.0
Libtorch 1.6.0
Visual studio 2019
Windows 10
Cuda 10.1

1. Вы понимаете свой (довольно длинный) код намного лучше, чем мы. Если вы хотите, чтобы мы вам помогли, было бы лучше всего поделиться своими мыслями о проблеме. Как вы думаете, почему этот код не обеспечивает правильный вывод? И что на самом деле должен делать этот код?

2. И c , и python-код, по сути, делают одно и то же, то есть загружается модель CNN и в нее вводятся входные данные. Как уже упоминалось, выходные данные представляют собой тензор размера (1×512). Проблема в том, что значения в этом тензоре выходных данных, задаваемые моделью, отличаются в C и python. Я не уверен, почему это происходит, хотя входное изображение, этапы предварительной обработки, модель одинаковы в обоих.

3. вам просто нужно масштабировать один раз » tensor_image.sub_(0.5).div_(0.5); также попробуйте отменить запрос вашего тензора после того, как вы создали тензор (удалите 1 из load_from_blob и просто используйте соответствующие строки и столбцы) также вам не нужно IValue, просто используйте model.forward({tensor_image})

4. кстати, перед этим вам нужно изменить масштаб вашего тензора на 255. а затем выполнить нормализацию

Ответ №1:

перед окончательной нормализацией вам необходимо масштабировать входные данные до диапазона 0-1, а затем продолжить нормализацию, которую вы выполняете. преобразование в float, а затем деление на 255 должно привести вас к этому. Вот фрагмент, который я написал, могут быть некоторые синтаксические ошибки, которые должны быть видны.
Попробуйте это :

 #include <iostream>
#include <algorithm> 
#include <opencv2/opencv.hpp>
#include <torch/script.h>


int main()
{
    try
    {
        torch::jit::script::Module model = torch::jit::load("traced_facelearner_model_new.pt");
        model.to(torch::kCUDA);
        
        cv::Mat visibleFrame = cv::imread("example.jpg");

        cv::resize(visibleFrame, visibleFrame, cv::Size(112, 112));
        at::Tensor tensor_image = torch::from_blob(visibleFrame.data, {  visibleFrame.rows, 
                                                    visibleFrame.cols, 3 }, at::kByte);
        
        tensor_image = tensor_image.to(at::kFloat).div(255).unsqueeze(0);
        tensor_image = tensor_image.permute({ 0, 3, 1, 2 });
        ensor_image.sub_(0.5).div_(0.5);

        tensor_image = tensor_image.to(torch::kCUDA);
        // Execute the model and turn its output into a tensor.
        auto output = model.forward({tensor_image}).toTensor();
        output = output.cpu();
        std::cout << "Embds: " << output << std::endl;

        std::cout << "Done!n";
    }
    catch (std::exception e)
    {
        std::cout << "exception" << e.what() << std::endl;
    }
}

У меня нет доступа к системе для запуска этого, поэтому, если вы столкнетесь с чем-либо, прокомментируйте ниже.

1. Огромное спасибо! это сработало. Но не могли бы вы сказать мне, зачем масштабировать тензор на 255 перед его нормализацией?

2. @Arki99, это значение по умолчанию для pytorchs ToTensor. когда вы выполняете ToTensor() преобразование в Pytorch, оно просто масштабирует входное изображение в диапазоне 0-1. итак, чтобы получить одинаковое поведение, вам нужно сделать то же самое в libtorch.

3. понял. Большое спасибо.