将Wikia转储解析为链接图

<mediawiki xmlns="http://www.mediawiki.org/xml/export-0.6/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.mediawiki.org/xml/export-0.6/ http://www.mediawiki.org/xml/export-0.6.xsd" version="0.6" xml:lang="en"> <siteinfo> <sitename>Wookieepedia</sitename> <base>http:///10.8.66.74/wiki/Main_Page</base> <generator>MediaWiki 1.19.24</generator> <case>first-letter</case> <namespaces> <namespace key="-2" case="first-letter">Media</namespace> ... <namespace key="1202" case="first-letter">Message Wall Greeting</namespace> </namespaces> </siteinfo> <page> <title>Brianna</title> <ns>0</ns> <id>5</id> ... <text xml:space="preserve" bytes="36038">{{Eras|old|featured}} {{Youmay|the [[Echani]] [[hybrid]]|the [[Brianna (Human)|Human]]}} {{Character |type=Jedi ...

1条回答

网友

1楼 · 发布于 2024-09-27 23:27:52

您的方法不合理：请改用links API。有多个Python clients。永远不要自己做wikitext解析，除非绝对强制！在

还要注意，对于所有wiki（除了小wiki）来说，Wikia的转储是完全中断的（在一个随机点截断）。另请参见https://archive.org/details/wikia_dump_20141219和https://github.com/Wikia/app/pull/6118#issuecomment-183633326

相关问题更多 >

编程相关推荐

热门问题

热门文章