k - означает кластеризацию на черно-белом изображении

#r #image #k-means

#r #изображение #k-означает

Вопрос:

Цель

Допустим, у нас есть следующее изображение :

Что я хочу сделать, так это иметь возможность автоматически определять ограничивающие рамки каждого символа и обрезать их на 2 изображения.

Как это можно сделать

Обрезка может быть выполнена с magick::image_crop помощью функции.

Чтобы определить ограничивающие рамки, я подумал о :

преобразование изображения в матрицу пикселей ;

и применение кластеризации k-средств для идентификации каждого символа ;
определите координаты удаленных пикселей для каждого символа, предоставив мне координаты для применения обрезки.

Я застрял в точке 1. Я не знаю, как преобразовать мое изображение в пригодную для использования матрицу :

 library("magick")
path <- "theImage.png"
image_test <- 
  image_read(path) %>%
  image_resize("2000x") %>%
  image_convert(type = 'Grayscale')

Я нашел это, но не уверен, как поступить в моем случае.

1. Будут ли ваши изображения такими же чистыми, как ваш пример? Нет спекла? Хорошо разделенные области?

2. решение будет применяться к таким документам, как счета; идея состоит в том, чтобы обнаруживать текстовые области (обозначенные символами).