#algorithm #sorting #nlp #data-analysis #text-mining
Вопрос:
У меня есть список монологов, сгруппированных по ораторам, например:
speaker 1:
00:00 Hello
00:02 How
00:02 are
00:03 you
00:04 ?
speaker 2:
00:01 Hi
00:02 Wait
00:02 !
speaker 3:
00:00 Hey
00:03 Good
Я хочу преобразовать это представление в читаемый/разумный диалог, например
speaker 3 00:00 Hey
speaker 1 00:00 Hello
speaker 2 00:01 Hi
speaker 1 00:02 How...
speaker 2 00:02 Wait!
speaker 1 00:02 ...are you?
speaker 3 00:03 Good
Это простое представление. Но бывает, что динамики перекрываются сильнее.
Определенно, я могу разобраться с этим к тому времени, но я ищу более продвинутый подход. Например, на основе частоты слов говорящего или любого другого подхода, который был бы более дружественным к человеку.
Примечание: Я ищу какую-нибудь (известную) учебную справку. Любая идея, это лучше, чем сортировка по времени