2024-05-18 00:08:42 发布
网友
我从锌数据库(http://zinc.docking.org/)中得到了一大组分子,是mol2(http://tripos.com/index.php?family=modules,SimplePage,,,&page=sup_mol2&s=0)格式的。我希望能够将这个数据库拆分成任意一组N个较小的数据库。在python、bash或perl中,最好的脚本编写方法是什么?我读过openbabel,但它只能产生一组单独的分子。在
如果没有,我也可以将mol2转换成另一种更方便的格式
泰克人
csplit可以将文件分成单独的分子:
csplit
csplit ~/Download/zinc.mol2 '/@<TRIPOS>MOLECULE/' '{*}'
如果你想把每一个数组或分子都读成一个数组,那么你可以把每一个数组或分子都读出来。在
以下是在linux中执行此操作的方法:
gawk -v RS="@<TRIPOS>MOLECULE" 'NF{ print RS$0 > "zinc"++n".mol2" }' zinc.mol2
csplit
可以将文件分成单独的分子:如果你想把每一个数组或分子都读成一个数组,那么你可以把每一个数组或分子都读出来。在
以下是在linux中执行此操作的方法:
相关问题 更多 >
编程相关推荐