<p>为此,我建议直接使用<a href="http://gephi.github.io/" rel="nofollow">gephi</a>。至少一年前,它完美地工作了,它支持直接导入xml/csv数据格式,而且不需要使用<code>neo4j</code>作为预处理器。在</p>
<p><strong>编辑</strong></p>
<p>哦,我明白了,我想连接已经包括在内了。在这种情况下,必须将xml中的所有数据创建为一个单独的节点—每个<code>enzyme</code>和{<cd3>}以及每个{<cd4>}(带有参数<code>name</code>)的新节点。那些<code>enzyme</code>nad<code>motif</code>节点必须是唯一的,即没有重复。当创建一个<code>organism</code>节点时,可以通过关系将<code>organism</code>与其<code>enzyme</code>和{<cd3>}节点连接起来。完成后,查询/可视化相似的节点就没有问题了,因为公共节点至少共享<code>enzyme/motif</code>中的一个。在</p>
<p>我不知道将数据<code>xml</code>导入到neo4j的任何聪明方法,但是将其转换为两个<code>csv</code>文件应该没有问题。csv的格式应该是:</p>
<p>第一个文件:</p>
<pre><code>name,enzyme
Aminomonas paucivorans,M1.Apa12260I
Aminomonas paucivorans,M2.Apa12260I
Bacillus cellulosilyticus,M1.BceNI
Bacillus cellulosilyticus,M2.BceNI
</code></pre>
<p>第二个文件(我不明白为什么<code>motif</code>是重复的思想):</p>
^{pr2}$
<p>现在我们要做的是<a href="http://docs.neo4j.org/chunked/milestone/cypherdoc-importing-csv-files-with-cypher.html?_ga=1.36841891.2043392826.1399556152" rel="nofollow">import</a>,它创建了<strong>唯一的</strong>节点和关系(因此,上面的重复<code>motifs</code>只会转换成1个唯一的关系)(如果必要,也可以对同一个<code>motif</code>节点有多个关系):</p>
<p>(我不确定是否使用此导入,但它应该可以工作):</p>
<pre><code>USING PERIODIC COMMIT
LOAD CSV WITH HEADERS FROM "file1.csv" AS csvLine
MATCH (o:Organism { name: csvLine.name}),(e:Enzyme { name: csvLine.enzyme})
CREATE (o)-[:has_enzyme]->(e) //or maybe CREATE UNIQUE?
USING PERIODIC COMMIT
LOAD CSV WITH HEADERS FROM "file2.csv" AS csvLine
MATCH (o:Organism { name: csvLine.name}),(m:Motif { name: csvLine.motif})
CREATE (o)-[:has_motif]->(m) //or maybe CREATE UNIQUE?
</code></pre>
<p>这将创建包含2个生物体节点、4个酶节点和2个motif节点的图。每个生物节点都应该与其酶和基序有关系。完成后,您可以前进到前面描述的可视化部分。在</p>