把mol2分子的数据库分成N个更小的集合

2024-05-18 00:08:42 发布

您现在位置:Python中文网/ 问答频道 /正文

我从锌数据库(http://zinc.docking.org/)中得到了一大组分子,是mol2(http://tripos.com/index.php?family=modules,SimplePage,,,&page=sup_mol2&s=0)格式的。我希望能够将这个数据库拆分成任意一组N个较小的数据库。在python、bash或perl中,最好的脚本编写方法是什么?我读过openbabel,但它只能产生一组单独的分子。在

如果没有,我也可以将mol2转换成另一种更方便的格式

泰克人


Tags: orgcommodules数据库httpindex格式family
2条回答

csplit可以将文件分成单独的分子:

csplit ~/Download/zinc.mol2 '/@<TRIPOS>MOLECULE/' '{*}'

如果你想把每一个数组或分子都读成一个数组,那么你可以把每一个数组或分子都读出来。在

以下是在linux中执行此操作的方法:

gawk -v RS="@<TRIPOS>MOLECULE" 'NF{ print RS$0 > "zinc"++n".mol2" }' zinc.mol2

相关问题 更多 >