Длительность звука Tika

#java #apache-tika

#java #apache-tika

Вопрос:

Я работаю над поиском длительности звука в mp3-файлах с помощью tika. После извлечения я собрал следующие метаданные. Продолжительность звука, похоже, отличается от первоначальной продолжительности (2 минуты 12 секунд = 132 секунды).

Аудиофайл: https://file-examples-com.github.io/uploads/2017/11/file_example_MP3_5MG.mp3

Метаданные: Метаданные

Длительность xmpDM: составляет около 132236.921875 (я полагаю, в секундах), что, по-видимому, намного больше, чем исходное аудио. Я протестировал то же самое с видеофайлом, и правильная продолжительность (в секундах) присутствует в ключе.

Комментарии:

1. Я не уверен, существует ли фиксированный набор единиц измерения … tika.apache.org/1.24.1/api/org/apache/tika/metadata /… не перечисляет ни одного. Для MP3 длительность измеряется в миллисекундах, см. tika.apache.org/1.24.1/api/org/apache/tika/parser/mp3 /…

2. Я поднял этот вопрос в списке разработчиков Apache Tika, см. / следуйте <a rel="nofollow noreferrer noopener" href="https://lists.apache.org/thread.html/r3b9fd864a9ab897bf0f2a53c2d6fd5f770b9688f8425ab0877e20b6b@» rel=»nofollow noreferrer»> этой теме

3. @Gagravarr исправлена ли проблема в tika 1.x и 2.x?

Ответ №1:

Хорошие новости, эта давняя ошибка наконец-то исправлена! И должен быть выпущен довольно скоро (вероятно, в апреле 2021 года)

В Apache Tika 1.26 и Apache Tika 2.0 MP3-файлы теперь будут соответствовать всем другим аудиовизуальным форматам файлов, а продолжительность будет измеряться в секундах.

Кроме того, в javadocs на xmpDM:duration данный момент также указано, что они находятся в секундах, чтобы избежать первоначальной путаницы.

Смотрите https://github.com/apache/tika/blob/a4c92579d2a012e0296f057b70dd9fb2d0842445/CHANGES.txt#L11 и https://issues.apache.org/jira/browse/TIKA-3318 для получения дополнительной информации.