Разделите перекрывающиеся монологи на диалог

#algorithm #sorting #nlp #data-analysis #text-mining

Вопрос:

У меня есть список монологов, сгруппированных по ораторам, например:

 speaker 1:
  00:00 Hello
  00:02 How
  00:02 are
  00:03 you
  00:04 ?

speaker 2:
  00:01 Hi
  00:02 Wait
  00:02 !

speaker 3:
  00:00 Hey
  00:03 Good
 

Я хочу преобразовать это представление в читаемый/разумный диалог, например

 speaker 3 00:00 Hey
speaker 1 00:00 Hello
speaker 2 00:01 Hi
speaker 1 00:02 How...
speaker 2 00:02 Wait!
speaker 1 00:02 ...are you?
speaker 3 00:03 Good
 

Это простое представление. Но бывает, что динамики перекрываются сильнее.

Определенно, я могу разобраться с этим к тому времени, но я ищу более продвинутый подход. Например, на основе частоты слов говорящего или любого другого подхода, который был бы более дружественным к человеку.

Примечание: Я ищу какую-нибудь (известную) учебную справку. Любая идея, это лучше, чем сортировка по времени