<p>据我所知,使用rdkit是不可能做到这一点的,我不知道有任何python模块具有这种能力。如果您可以使用web服务,那么可以使用<a href="http://cactus.nci.nih.gov/chemical/structure" rel="nofollow noreferrer">NCI resolver</a></p>
<p>下面是从字符串检索IUPAC标识符的函数的简单实现:</p>
<pre><code>import requests
CACTUS = "https://cactus.nci.nih.gov/chemical/structure/{0}/{1}"
def smiles_to_iupac(smiles):
rep = "iupac_name"
url = CACTUS.format(smiles, rep)
response = requests.get(url)
response.raise_for_status()
return response.text
print(smiles_to_iupac('c1ccccc1'))
print(smiles_to_iupac('CC(=O)OC1=CC=CC=C1C(=O)O'))
[Out]:
BENZENE
2-acetyloxybenzoic acid
</code></pre>
<p>你可以很容易地扩展它来转换多种不同的格式,尽管这个函数不是很快</p>
<p>另一个解决方案是使用PubChem。您可以将API与python包<a href="https://github.com/mcs07/PubChemPy" rel="nofollow noreferrer">pubchempy</a>一起使用。请记住,这可能会返回多个化合物</p>
<pre><code>import pubchempy
# Use the SMILES you provided
smiles = 'O=C(NCc1ccc(C(F)(F)F)cc1)[C@@H]1Cc2[nH]cnc2CN1Cc1ccc([N+](=O)[O-])cc1'
compounds = pubchempy.get_compounds(smiles, namespace='smiles')
match = compounds[0]
print(match.iupac_name)
[Out]:
(6S)-5-[(4-nitrophenyl)methyl]-N-[[4-(trifluoromethyl)phenyl]methyl]-3,4,6,7-tetrahydroimidazo[4,5-c]pyridine-6-carboxamide
</code></pre>