Python包,从整个互联网上抓取食谱

bvodola-recipe-scrapers的Python项目详细描述


VersionTravisCoverallsLicenseGithubBlack formatted一个简单的网站抓取工具配方网站。在

pip install bvodola-recipe-scrapers

然后:

^{pr2}$

注意:scraper.links()返回包含所有<;a>;标记属性的字典列表。属性名是字典键。在

刮板可用于:

贡献

我希望这个开源的部分原因是,如果一个网站做了一个设计变更,它的刮板应该修改。在

如果你发现一个设计变化(或其他东西),使刮板无法为给定的网站工作-请尽快发出一个问题。在

如果你是程序员PRs与修复是热烈欢迎和承认与虚拟啤酒。在

如果你想为一个新的网站添加刮刀

开发人员/贡献

假设您已经安装了python3,请导航到您希望此项目所在的目录并删除这些行

git clone git@github.com:hhursev/recipe-scrapers.git &&
cd recipe-scrapers &&
python3 -m venv .venv &&
source .venv/bin/activate &&
pip install -r requirements.txt &&
pre-commit install &&
python -m coverage run -m unittest &&
python -m coverage report

常见问题解答

  • 如何知道网站是否有配方模式?
    • 去你想要支持的网站上的食谱。在
    • {tt3}点击你的键盘^
    • 在(Ctrl -f)中搜索application/ld+json。它应该在script标记内。在
    • 如果你找到了,那么你的网站很可能支持配方模式。否则,您将需要解析HTML。在

空间感谢:

所有的contributors that helped improving包。你真棒!在

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java随机填充2d数组   java运行时。getRuntime。带有长参数的exec(cmd)   java Minecraft无法放置自定义背景   java AChartEngine YAxis自定义标签区域边距和图表值为字符串?   泛型类的java类型安全错误   整数的java符号等价物。toBinaryString方法?   Java中数组列表的数组   java WebView应用程序在谷歌登录后显示空白屏幕   java从backback中删除特定片段   如果服务器不支持使用的协议,java JSSE是否实现回退?   java Sonarqube正在进行核心漏洞查找。如何解决   javajavax。jcr。UnsupportedPositionOperationException:testVersionable处的节点不可版本化   java在安卓中每隔X小时运行一次文件/函数,无需打开应用程序   java如何为磁盘持久性配置BigMemory?   java BufferWriter不转换383以上的整数   Java7交集类型:规范具体说明了什么?   Java:CollectionHow创建多列   java如何检测运算符的空白   java问题:在firebase中为导航栏中的第二个表单提交数据第一个表单工作正常。实际isse是连接Mainactivity中的另一个活动