化学反应指纹
rxnfp的Python项目详细描述
RXNFP-化学反应指纹
This library generates chemical reaction fingerprints from reaction SMILES
安装
对于所有安装,我们建议使用conda
来获得必要的rdkit
和{
从pypi
conda create -n rxnfp python=3.6 -yconda activate rxnfpconda install -c rdkit rdkit=2020.03.3 -yconda install -c tmap tmap -ypip install rxnfp
来自github
^{pr2}$如何使用
根据反应微笑计算指纹
</code></pre><pre><codeclass="language-python">fromrxnfp.transformer_fingerprintsimport(RXNBERTFingerprintGenerator,get_default_model_and_tokenizer,generate_fingerprints)model,tokenizer=get_default_model_and_tokenizer()rxnfp_generator=RXNBERTFingerprintGenerator(model,tokenizer)example_rxn="Nc1cccc2cnccc12.O=C(O)c1cc([N+](=O)[O-])c(Sc2c(Cl)cncc2Cl)s1>>O=C(Nc1cccc2cnccc12)c1cc([N+](=O)[O-])c(Sc2c(Cl)cncc2Cl)s1"fp=rxnfp_generator.convert(example_rxn)print(len(fp))print(fp[:5])
256
[-2.0174953937530518, 1.7602033615112305, -1.3323537111282349, -1.1095019578933716, 1.2254549264907837]
或者列出一系列反应:
rxns=[example_rxn,example_rxn]fps=rxnfp_generator.convert_batch(rxns)print(len(fps),len(fps[0]))
2 256
反应图谱
开心果
指纹可用于绘制化学反应空间:
图:用TMAP生成的开心果测试集的注释图集。在
施耐德50k套装-教程
在笔记本中,我们展示了如何生成施耐德50k装置的交互反应图谱。{str}结果与{/str}相似。在
你会发现不同的反应属性在不同的层中突出显示:
图:突出显示不同性质的50k数据集的反应图谱。在
USPTO 1k TPL(反应分类数据集)
我们为1k美国药典引入新的化学反应数据集。USPTO 1k TPL源自Lowe的USPTO data base。它由445k反应组成,分为1000个模板标签。将数据集随机分成训练/有效90%和测试10%。这些标记是通过原子映射USPTO数据集和RXNMapper得到的,然后应用Thakkar等人的template extraction workflow,最后选择属于1000个最常见模板哈希的反应。这些模板散列被用作类标签。与开心果数据集类似,USPTO 1k TPL是严重不平衡的。在
数据集可以从:MappingChemicalReactions下载。在
引文
我们的工作首次在NeurIPS 2019研讨会上展示。我们的预印本的最新版本可以在ChemRxiv上找到。在
@article{Schwaller2019rxnfp,
author = "Philippe Schwaller and Daniel Probst and Alain C. Vaucher and Vishnu H Nair and David Kreutter and Teodoro Laino and Jean-Louis Reymond",
title = "{Mapping the Space of Chemical Reactions using Attention-Based Neural Networks}",
year = "2019",
month = "9",
url = "https://chemrxiv.org/articles/preprint/Data-Driven_Chemical_Reaction_Classification_with_Attention-Based_Neural_Networks/9897365",
doi = "10.26434/chemrxiv.9897365.v3"
}
RXNFP是由IBM欧洲研究院和伯尔尼大学的Reymond group合作开发的。分类模型在RXN for Chemistry平台上使用。在
- 项目
标签: