#python #python-3.x #rdkit
#python #python-3.x #rdkit
Вопрос:
Я обучаю случайный лес с помощью scikit-learn по отпечаткам пальцев Моргана и хотел бы знать, какие структурные мотивы наиболее важны. Для этого я хотел бы нарисовать все фрагменты, которые создают бит в x наиболее важных функциях.
Я нашел Draw.DrawMorganBits
модуль в новой версии и эти примеры для использования: https://iwatobipen.wordpress.com/2018/11/07/visualize-important-features-of-machine-leaning-rdkit/http://rdkit.blogspot.com/2018/10/using-new-fingerprint-bit-rendering-code.html
Однако я не знаю, как создать уникальный набор фрагментов. Ранее я просматривал свой тестовый набор, собирал среды bitinfo и molecular и создавал СМАЙЛЫ Chem.MolFragmentToSmiles
. Затем я создал mol из набора этих смайлов и построил их. Однако это слабое представление среды, и некоторые фрагменты не могут быть нанесены на график. Я могу предоставить свой старый код. Это следует старой документации https://rdkit.readthedocs.io/en/release_2017_03_1/GettingStartedInPython.html#explaining-bits-from-morgan-fingerprints
Комментарии:
1. Если я правильно понимаю, вам нужен морганбит для каждого OnBit, и когда значение дает, например, [8,405,879, …], вы хотите отобразить соответствующий МорганБит. Я попытался создать словарь с key = OnBit и value = MorganBit для целого набора отпечатков пальцев, но проблема в том, что МорганБиты не уникальны, потому что изображение сделано на основе молекулы, из которой оно сделано. Так, например, для onBit 405 каждая молекула дает другую картину. Может быть, лучше хранить SMARTS?
2. Со «старым» MolFragmentToSmiles я получил УЛЫБКИ, да. Но проблема в том, что они иногда не отображают всю информацию. Радиус 0 дает атомы, а для других фрагментов мы не знаем, является ли, например, ‘c’ терминальным или нет / ароматическим или просто двойной связью. С новым модулем это намного лучше, но я не хочу печатать дубликаты. Можем ли мы сохранить SMILRD для r 1 и управлять цветом для рисования, чтобы он выглядел как новый вывод DrawMorganBits?
3. Я не знаю, как управлять цветами рисунка. Вы пробовали SMARTS вместо SMILES? СМАРТ-это фрагменты, которые преобразуются в mol, они показывают разные картинки, а не УЛЫБКИ.