Размен данных, хэширование данных

#hash #data-integrity #data-integration #data-security #universal-hashing

Вопрос:

Я хочу сохранить некоторые данные в файле, например .cvs. Одним из условий является то, что данные не могут измениться после записи в файл. Если я хочу прочитать данные, следует сохранить, чтобы данные не изменялись в прошлом, и я хочу получить предупреждение, если данные изменились в прошлом другими.

Например, строка в моем файле .csv выглядит так:

 34, 234, test, monday, peter
 

Как я могу проверить, что эта строка кем-то изменена?
Как я могу заблокировать, чтобы никто не изменил ни одну из моих строк?

Надеюсь, вы понимаете, что я имею в виду. Если использовать google-поиск в контексте этой темы, я часто буду встречаться с темой «хэширование моих данных».

Как это работает?

Ответ №1:

Хэширование-это концепция сбора большого количества данных и сведения их к одной (гораздо меньшей) строке или числу. Итак, существуют различные алгоритмы, которые могли бы взять весь файл целиком и придумать хэш. Например, вот как вы можете это сделать в узле.

Наиболее важным аспектом алгоритма является то, что если содержимое каким-либо образом изменится, то хэш также изменится. Вот как работает git, например.

Итак, что вы могли бы сделать, чтобы хэшировать этот файл и сохранить полученную строку где-нибудь, а затем сравнить результаты позже. Возможно, вы видели, что это загрузка установщика на протяжении многих лет. Иногда они поставляются с хэшем, который вы могли бы проверить сами, чтобы убедиться, что он не был подделан.