Python中文
首页
教程
问答
标签
搜索
登录
注册
我如何分割刮取的数据,并将其保存在单独的列中,作为带有完整链接和描述的csv?
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我正在一个网页刮板工作,这是返回链接和职位说明,如果它匹配的关键字列表。我的问题是,正在导出的csv只是一个长句,链接和描述放在一行。在</p> <p>如何有效地将描述和链接分成两个单独的列?我如何添加链接的剩余部分以便能够单击csv中的链接?还有没有一种方法可以避免csv中的重复条目?在</p> <p>这是我的代码:</p> <pre><code>from selenium import webdriver import time, re, csv from bs4 import BeautifulSoup as BS keywords = ["KI", "AI", "Big Data", "Data", "data", "big data", "Analytics", "analytics", "digitalisierung", "ML", "Machine Learning", "Daten", "Datenexperte", "Datensicherheitsexperte", "Analytikleistungen"] browser = webdriver.Chrome() url = "https://ausschreibungen.usp.gv.at/at.gv.bmdw.eproc-p/public" browser.implicitly_wait(30) browser.get(url) innerHTML = browser.execute_script("return document.body.innerHTML") soup = BS(browser.page_source, 'html.parser') # browser.quit() # print(soup.text) tenders = soup.find('table', {'id': 'tenderlist'}) tbody = tenders.find('tbody') browser.quit() ausschreiben_found = [] for tr in tbody.find_all('tr'): ausschreiben = tr.find_all('td') for keyword in keywords: for word in ausschreiben: if keyword in str(word): ausschreiben_found.append(word) print(ausschreiben_found) with open("ausschreiben.csv", 'a', encoding='utf-8') as toWrite: fieldnames = ["Beschreibung", "Links"] writer = csv.writer(toWrite) writer.writerows(ausschreiben_found) # subprocess.call('./Autopilot3.py') print("Matched Ausschreiben have been collected.") </code></pre>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>使用的换行符和分隔符参数csv.writer班级</p> <p>您可以在这里找到示例:<a href="https://docs.python.org/3/library/csv.html#writer-objects" rel="nofollow noreferrer">https://docs.python.org/3/library/csv.html#writer-objects</a></p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何在乒乓球比赛中预测球的轨迹,对于AI球拍预测?
3 回答
如何在乒乓球游戏中阻止球
8 回答
如何在乘法和模中不乘空间?
6 回答
如何在乘法和除以2个不同的数字之间进行交换?
10 回答
如何在也是数据一部分的单个字符上拆分大字符串
2 回答
如何在乾草堆中找到針,有更好的解決方案嗎?
4 回答
如何在事件wxWidgets中传递自定义数据
3 回答
如何在事件中使用lambda i=i?
8 回答
如何在事件中心只接收最近的数据
8 回答
如何在事件发生之前保持云函数运行?
5 回答
如何在事件发生后使页面重定向到同一页面
9 回答
如何在事件回调之间保持python生成器的状态
6 回答
如何在事件处理程序(pythonsocket、sphinx)中保留docstring
9 回答
如何在事件处理程序中更改wxRichTextCtrl的光标位置?
5 回答
如何在事件处理程序中访问外部对象?
1 回答
如何在事件循环中将协程打包为正常函数?
9 回答
如何在事件循环之外运行协同程序?
4 回答
如何在事件循环结束时为并发未来的所有线程调用类方法?
2 回答
如何在事件文件中只保留一份摘要?
10 回答
如何在事件模板中添加事件
1 回答