#java #hadoop #bigdata #hadoop-plugins
#java #hadoop #bigdata #hadoop-плагины
Вопрос:
Я хочу переопределить средство чтения записей Hadoop по умолчанию в моем Java-коде. По умолчанию он читает записи построчно. Я изменил его, когда он встречает «:», разделяет записи. Однако при разделении записей он также выделяет разделитель. Так, например, мои записи:
> I go to school : He goes to school : we go to school
Когда записи считываются, это производит:
I go to school
He goes to school
we go to school
Однако разделитель — «:» исчез. Есть ли способ сохранить этот разделитель в записях? Потому что в разделителях может быть какая-то важная информация.
Комментарии:
1. Какая важная информация? Как правило, весь смысл разделителя заключается в том, что он находится между важной информацией. Можете ли вы показать нам свой текущий код чтения записей?
2. Спасибо за ответ, например, разделитель, может быть, какая-то дата. Или идентификатор записи. В моем случае разделителем является дата транзакций. Например: «19.11.2014 11:44 Начало транзакции: blabla 19.12.2014 11.22 Ошибка транзакции blabla»