把mol2分子的数据库分成N个更小的集合 - 问答 - Python中文网

把mol2分子的数据库分成N个更小的集合

2024-05-18 00:08:42 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我从锌数据库（http://zinc.docking.org/）中得到了一大组分子，是mol2（http://tripos.com/index.php?family=modules,SimplePage,,,&page=sup_mol2&s=0）格式的。我希望能够将这个数据库拆分成任意一组N个较小的数据库。在python、bash或perl中，最好的脚本编写方法是什么？我读过openbabel，但它只能产生一组单独的分子。在

如果没有，我也可以将mol2转换成另一种更方便的格式

泰克人

Tags： org com modules 数据库 http index 格式 family

2条回答

网友

1楼 · 编辑于 2024-05-18 00:08:42

csplit可以将文件分成单独的分子：

csplit ~/Download/zinc.mol2 '/@<TRIPOS>MOLECULE/' '{*}'

如果你想把每一个数组或分子都读成一个数组，那么你可以把每一个数组或分子都读出来。在

网友

2楼 · 编辑于 2024-05-18 00:08:42

以下是在linux中执行此操作的方法：

gawk -v RS="@<TRIPOS>MOLECULE" 'NF{ print RS$0 > "zinc"++n".mol2" }' zinc.mol2

相关问题更多 >

编程相关推荐

热门问题

热门文章