Как получить номер строки шаблона в R

#html #r

Вопрос:

У меня есть html-файл. Я пытаюсь найти весь номер строки шаблона » Итак, здесь у меня есть:

 line_num = grep("lt;table", html_file) line_num  

На выходе я получаю строки, содержащие шаблон «:

 ## [1] 199 217 219  

Однако моя проблема в том, что в строке 217 шаблон » Поэтому я хочу, чтобы мой результат выглядел так:

 ## [1] 199 217 217 219  

Таким образом, он печатает номер строки для каждого появления шаблона » Как мне это сделать? ТИА!

Ответ №1:

Вы можете использовать str_count для подсчета количества повторений шаблона, отбросить 0 отсчетов и повторить line_num подсчет несколько раз.

 line_num lt;- grep("lt;table", html_file) line_count lt;- stringr::str_count(html_file, "lt;table") line_count lt;- line_count[line_count != 0] rep(line_num, line_count)