Извлечение данных из XML с одноименными тегами с использованием языка R

#r #data-manipulation

#r #манипулирование данными

Вопрос:

Всем заранее спасибо, я пытался разобрать XML-файл на R, но я застрял, я объясню, в чем я застрял ниже.

Существует несколько имен тегов, в частности, есть тег под названием ID Segment Tag, в котором будет несколько имен идентификаторов, из которых я должен извлечь 2-й идентификатор в сегменте ID. XML1

Ответ №1:

пример данных

Образцы данных не были предоставлены, поэтому я создал свои собственные.

 library(xml2)
doc = read_xml('<?xml version="1.0" ?><ID><IDSegment><IDNumber>ABC1234BD</IDNumber><IDNumber>ABCDEFG</IDNumber></IDSegment></ID>')
  

код

 #get all IDSegment_nodes
IDSegment.nodes <- xml_find_all( doc, ".//IDSegment")
#get the second IDNumber from each IDSegment-node.. NA if missing
xml_text( xml_find_first( IDSegment.nodes, ".//IDNumber[position() = 2]") )
  

вывод

[1] "ABCDEFG"