#python #list #tree
Вопрос:
Я пытаюсь преобразовать вложенный список в представление дерева.
Желаемая структура дерева такова, что все элементы в списке, которые не относятся к этому типу list
, находятся в одной иерархии. Вложенный список во вложенном списке является дочерним элементом элемента (это должен быть элемент, который не относится к типу list
), непосредственно предшествующего ему. Например,
lst = [1,['a','b','c','d',['s','t',['ab','cd',['a','b'],'ef'],'u'],'f']]
будет переведено в представление Treelib
from treelib import Node, Tree
tree = Tree()
tree.create_node(1, "root") # We can assume that the list will contain a root node
tree.create_node('a', 'a', parent='root')
tree.create_node('b', 'b', parent='root')
tree.create_node('c', 'c', parent='root')
tree.create_node('d', 'd', parent='root')
tree.create_node('s', 's', parent='d')
tree.create_node('t', 't', parent='d')
tree.create_node('ab', 'ab', parent='t')
tree.create_node('cd', 'cd', parent='t')
tree.create_node('a', 'a1', parent='cd')
tree.create_node('b', 'b1', parent='cd')
tree.create_node('ef', 'ef', parent='t')
tree.create_node('u', 'u', parent='d')
tree.create_node('f', 'f', parent='root')
tree.show()
Желаемый результат:
1
├── a
├── b
├── c
├── d
│ ├── s
│ ├── t
│ │ ├── ab
│ │ ├── cd
│ │ │ ├── a
│ │ │ └── b
│ │ └── ef
│ └── u
└── f
Я бы предположил, что для этого нужна какая-то рекурсивная логика для анализа дерева и идентификации всей иерархической структуры, но я не могу придумать логику для этого. Как бы я написал код для создания узлов дерева для произвольного вложенного списка (который я написал здесь вручную)? Любая помощь будет признательна.
Правка: Сложность здесь в том, что целые куски дерева могут повторяться. Например,
lst = [1,['a','b','c','d',['s','t',['ab','cd',['a','b'],'ef'],'u'],'f','t',['ab','cd',['a','b'],'ef']]]
should translate to the Treelib representation
tree = Tree()
tree.create_node(1, "root") # We can assume that the list will contain a root node
tree.create_node('a', 'a', parent='root')
tree.create_node('b', 'b', parent='root')
tree.create_node('c', 'c', parent='root')
tree.create_node('d', 'd', parent='root')
tree.create_node('s', 's', parent='d')
tree.create_node('t', 't', parent='d')
tree.create_node('ab', 'ab', parent='t')
tree.create_node('cd', 'cd', parent='t')
tree.create_node('a', 'a1', parent='cd')
tree.create_node('b', 'b1', parent='cd')
tree.create_node('ef', 'ef', parent='t')
tree.create_node('u', 'u', parent='d')
tree.create_node('f', 'f', parent='root')
tree.create_node('t', 't1', parent='root')
tree.create_node('ab', 'ab1', parent='t1')
tree.create_node('cd', 'cd1', parent='t1')
tree.create_node('a', 'a2', parent='cd1')
tree.create_node('b', 'b2', parent='cd1')
tree.create_node('ef', 'ef1', parent='t1')
tree.show()
Желаемый результат:
1
├── a
├── b
├── c
├── d
│ ├── s
│ ├── t
│ │ ├── ab
│ │ ├── cd
│ │ │ ├── a
│ │ │ └── b
│ │ └── ef
│ └── u
├── f
└── t
├── ab
├── cd
│ ├── a
│ └── b
└── ef
Спасибо!
Ответ №1:
Вы можете рекурсивно просматривать свой список, отслеживая родительский:
import treelib, itertools as it, collections as ct
lst = [1,['a','b','c','d',['s','t',['ab','cd',['a','b'],'ef'],'u'],'f']]
tree = treelib.Tree()
c = ct.defaultdict(lambda :it.count(1))
def build_tree(d, t, p = None):
last_p = None
for a, b in it.groupby(d, key=lambda x:not isinstance(x, list)):
if a:
for i in b:
t.create_node(i, (last_p:=(i if (n:=next(c[i])) == 1 else f'{i}{n}')), parent=p)
else:
for i in b:
build_tree(i, t, p = last_p)
build_tree(lst, tree)
tree.show()
Выход:
1
├── a
├── b
├── c
├── d
│ ├── s
│ ├── t
│ │ ├── ab
│ │ ├── cd
│ │ │ ├── a
│ │ │ └── b
│ │ └── ef
│ └── u
└── f
Результат по второму дереву:
lst = [1,['a','b','c','d',['s','t',['ab','cd',['a','b'],'ef'],'u'],'f','t',['ab','cd',['a','b'],'ef']]]
tree = treelib.Tree()
c = ct.defaultdict(lambda :it.count(1))
build_tree(lst, tree)
tree.show()
Выход:
1
├── a
├── b
├── c
├── d
│ ├── s
│ ├── t
│ │ ├── ab
│ │ ├── cd
│ │ │ ├── a
│ │ │ └── b
│ │ └── ef
│ └── u
├── f
└── t
├── ab
├── cd
│ ├── a
│ └── b
└── ef
build_tree
без выражения назначения:
def build_tree(d, t, p = None):
last_p = None
for a, b in it.groupby(d, key=lambda x:not isinstance(x, list)):
if a:
for i in b:
n = next(c[i])
last_p = i if n == 1 else f'{i}{n}'
t.create_node(i, last_p, parent=p)
else:
for i in b:
build_tree(i, t, p = last_p)
Удаление повторяющихся компонентов дерева:
from itertools import zip_longest as zl
from contextlib import suppress
def tree_eq(tree, t1, t2):
if not hasattr(t1, 'tag') or not hasattr(t2, 'tag'):
return False
if t1 is None or t2 is None:
return False
return t1.tag == t2.tag and t1._identifier < t2._identifier and
all(tree_eq(tree, *i) for i in zl(tree.children(t1._identifier), tree.children(t2._identifier)))
def prune_tree(d, tree):
yield d
for i in tree.children(getattr(d, 'root', d._identifier)):
yield from prune_tree(i, tree)
tag_d = ct.defaultdict(list)
for i in prune_tree(tree, tree):
if hasattr(i, 'tag') and tree.children(getattr(i, 'root', i._identifier)):
tag_d[i.tag].append(i)
for a, *b in tag_d.values():
for i in b:
with suppress(treelib.exceptions.NodeIDAbsentError):
if tree_eq(tree, a, i):
tree.remove_node(i._identifier)
tree.show()
Выход:
1
├── a
├── b
├── c
├── d
│ ├── s
│ ├── t
│ │ ├── ab
│ │ ├── cd
│ │ │ ├── a
│ │ │ └── b
│ │ └── ef
│ └── u
└── f
Комментарии:
1. Спасибо-легко ли изменить код, чтобы его можно было использовать без оператора walrus?
2. @blueberry Да, пожалуйста, посмотрите мою недавнюю правку.
3. Спасибо за это! Я добавил дополнительную деталь к вопросу-одна из сложностей заключается в том, что целые куски дерева могут повторяться, и приведенная выше логика в таких случаях не работает.
4. Это работает-спасибо! У меня есть дополнительный вопрос-легко ли изменить эту логику, чтобы мы не отображали дочерние ветви, если они уже были «замечены» ранее в дереве? Например, второе дерево просто остановилось бы на втором t, потому что мы «знаем», каковы его дочерние элементы.
5. @blueberry Я думаю, это зависит от обстоятельств. На мой взгляд, этот тип сопоставления , вероятно, должен произойти после создания полного дерева
build_tree
, где становится более тривиальным просто пройти по дереву и найти соответствия поддеревьев. Я добавлю пример этого через минуту.