我正在为一个使用Python Beautifulsoup的研究项目抓取网站。 我已经收集了几千张记录,并把它们放在excel中。在
本质上,我想提取一个子串文本(例如,“python”来自一篇文章标题“python for dummies”)。 文章标题被刮取并存储在excel的单元格中。 我想提取“pyhon”放在另一个牢房里。在
我需要一些建议,如果它是更好的提取时,刮或离线在excel。 由于这是一个研究项目,不需要实时速度。我在省力。在
另一个相关的问题是python是否可以在脱机模式下进行提取-即打开excel,执行提取,关闭excel。在
任何帮助或建议都非常感谢。在
同时做。它可能只需要几行代码。没有理由把整个文件翻两遍。在
相关问题 更多 >
编程相关推荐