#r #data-manipulation
#r #манипулирование данными
Вопрос:
Всем заранее спасибо, я пытался разобрать XML-файл на R, но я застрял, я объясню, в чем я застрял ниже.
Существует несколько имен тегов, в частности, есть тег под названием ID Segment Tag, в котором будет несколько имен идентификаторов, из которых я должен извлечь 2-й идентификатор в сегменте ID. XML1
Ответ №1:
пример данных
Образцы данных не были предоставлены, поэтому я создал свои собственные.
library(xml2)
doc = read_xml('<?xml version="1.0" ?><ID><IDSegment><IDNumber>ABC1234BD</IDNumber><IDNumber>ABCDEFG</IDNumber></IDSegment></ID>')
код
#get all IDSegment_nodes
IDSegment.nodes <- xml_find_all( doc, ".//IDSegment")
#get the second IDNumber from each IDSegment-node.. NA if missing
xml_text( xml_find_first( IDSegment.nodes, ".//IDNumber[position() = 2]") )
вывод
[1] "ABCDEFG"