化学反应指纹

rxnfp的Python项目详细描述


RXNFP-化学反应指纹

This library generates chemical reaction fingerprints from reaction SMILES

安装

对于所有安装,我们建议使用conda来获得必要的rdkit和{}依赖关系:

从pypi

conda create -n rxnfp python=3.6 -yconda activate rxnfpconda install -c rdkit rdkit=2020.03.3 -yconda install -c tmap tmap -ypip install rxnfp

来自github

^{pr2}$

如何使用

根据反应微笑计算指纹

</code></pre><pre><codeclass="language-python">fromrxnfp.transformer_fingerprintsimport(RXNBERTFingerprintGenerator,get_default_model_and_tokenizer,generate_fingerprints)model,tokenizer=get_default_model_and_tokenizer()rxnfp_generator=RXNBERTFingerprintGenerator(model,tokenizer)example_rxn="Nc1cccc2cnccc12.O=C(O)c1cc([N+](=O)[O-])c(Sc2c(Cl)cncc2Cl)s1>>O=C(Nc1cccc2cnccc12)c1cc([N+](=O)[O-])c(Sc2c(Cl)cncc2Cl)s1"fp=rxnfp_generator.convert(example_rxn)print(len(fp))print(fp[:5])
256
[-2.0174953937530518, 1.7602033615112305, -1.3323537111282349, -1.1095019578933716, 1.2254549264907837]

或者列出一系列反应:

rxns=[example_rxn,example_rxn]fps=rxnfp_generator.convert_batch(rxns)print(len(fps),len(fps[0]))
2 256

反应图谱

开心果

指纹可用于绘制化学反应空间:

图:TMAP生成的开心果测试集的注释图集。在

施耐德50k套装-教程

在笔记本中,我们展示了如何生成施耐德50k装置的交互反应图谱。{str}结果与{/str}相似。在

你会发现不同的反应属性在不同的层中突出显示:

图:突出显示不同性质的50k数据集的反应图谱。在

USPTO 1k TPL(反应分类数据集)

我们为1k美国药典引入新的化学反应数据集。USPTO 1k TPL源自Lowe的USPTO data base。它由445k反应组成,分为1000个模板标签。将数据集随机分成训练/有效90%和测试10%。这些标记是通过原子映射USPTO数据集和RXNMapper得到的,然后应用Thakkar等人的template extraction workflow,最后选择属于1000个最常见模板哈希的反应。这些模板散列被用作类标签。与开心果数据集类似,USPTO 1k TPL是严重不平衡的。在

数据集可以从:MappingChemicalReactions下载。在

引文

我们的工作首次在NeurIPS 2019研讨会上展示。我们的预印本的最新版本可以在ChemRxiv上找到。在

@article{Schwaller2019rxnfp,
author = "Philippe Schwaller and Daniel Probst and Alain C. Vaucher and Vishnu H Nair and David Kreutter and Teodoro Laino and Jean-Louis Reymond",
title = "{Mapping the Space of Chemical Reactions using Attention-Based Neural Networks}",
year = "2019",
month = "9",
url = "https://chemrxiv.org/articles/preprint/Data-Driven_Chemical_Reaction_Classification_with_Attention-Based_Neural_Networks/9897365",
doi = "10.26434/chemrxiv.9897365.v3"
}

RXNFP是由IBM欧洲研究院和伯尔尼大学的Reymond group合作开发的。分类模型在RXN for Chemistry平台上使用。在

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何拆分字符串(基于各种分隔符),但不保留空格?   解析。Json格式的txt文件和knime中的java   java Spring rest api为什么在rest api调用的响应中更改了数据类型   升华文本3抛出java。lang.ClassNotFoundException,而记事本++不存在   java Android指纹扫描仪在尝试5次后停止工作?   java Android如何设置精确的重复报警?   java如何使用HTTPGET connect为access API输入用户名和密码   java当测试报告显示没有测试失败时,Gradle为什么说“有失败的测试”?   用Gson实现java获取响应   MapReduce程序中函数错误的java不可映射参数   java spring安全性不符合自动代理的条件   java GWT使用异步回调进行同步/阻塞调用   java奇怪的类数组问题无法在jsp中显示   如何在java中使用PrinterJob使用epl打印条形码   java如何在JTable中居中单元格   将Java Mockito测试转换为Kotlin   html Java正则表达式模式匹配到多个相同标记   testCompile中缺少java Gradle(Android)多项目依赖项   在输入提示后输入字符串时发生java FileNotFoundException