Python中文
首页
教程
问答
标签
搜索
登录
注册
当长度变长时,Python会剪切字符串的特定部分
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我正在用python为我的Tennislub开发一个网络爬虫,以便从数据库中的网页保存游戏结果、排名等(然后在我自己的网站上显示)。很好,我有这样的桌子:</p> <p><a href="https://i.stack.imgur.com/avYFx.jpg" rel="nofollow noreferrer"><img src="https://i.stack.imgur.com/avYFx.jpg" alt="enter image description here"/></a></p> <p>然而,有些球队的名字很难在我的网站上很好地输出(特别是当两家俱乐部在一起的时候)</p> <p><a href="https://i.stack.imgur.com/YLULz.jpg" rel="nofollow noreferrer"><img src="https://i.stack.imgur.com/YLULz.jpg" alt="enter image description here"/></a></p> <p>我的问题是:如果一根绳子达到一定长度,比如34,我怎么能用熊猫剪下“/”后面的所有东西</p> <p>到目前为止,我的代码(以及对爬网信息的其他有效更改):</p> <pre><code>for x in range(len(teams)): driver.get('https://baden.liga.nu/cgi-bin/WebObjects/nuLigaTENDE.woa /wa/teamPortrait?team=' + teams[x][1]) table_games = driver.page_source df = pd.read_html(table_games)[1] banned = ['TSG'] f = lambda x: ' '.join([item for item in x.split() if item not in banned]) df["Heimmannschaft"] = df["Heimmannschaft"].apply(f) df["Gastmannschaft"] = df["Gastmannschaft"].apply(f) df = df.rename(columns={'Datum, Uhrzeit.1': 'Termin'}) df[['Datum', 'Uhrzeit']] = df.Termin.str.split(" ", expand=True, ) del df['Termin'] df = df[['Datum', 'Uhrzeit', 'Heimmannschaft', 'Gastmannschaft', 'Matches', 'Spielbericht']] df.to_sql(con=con, name=teams[x][0]+'_Spiele', if_exists='replace') driver.get('https://baden.liga.nu/cgi-bin/WebObjects/nuLigaTENDE.woa /wa/groupPage?targetFed=BAD&championship=B1+S+2021&group=' + teams[x][2]) table_ranks = driver.page_source df = pd.read_html(table_ranks)[0] f = lambda x: ' '.join([item for item in x.split() if item not in banned]) df["Mannschaft"] = df["Mannschaft"].apply(f) df.iloc[0:, 1:].to_sql(con=con, name=teams[x][0]+ '_Tabelle', if_exists='replace') driver.quit() </code></pre> <p>在我的代码示例中,驱动程序会爬到不同的网站进行排名<strong>和<strong>游戏日,在这两种情况下,一些球队的名字都很长(因此我想删掉第二个球队的名字,从“/”开始)</p> <p>我希望你能帮我</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>只有在长度大于等于的情况下,您才能拆分并获得一线队;三十四</p> <pre><code>df['your_column'] = df['your_column'].apply(lambda x: x.split('/')[0] if len(x) > 34 else x) </code></pre>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何添加虚拟方法
7 回答
如何添加表示整数的擦边字符串?
6 回答
如何添加要在Bokeh中使用的新font.ttf文件?
4 回答
如何添加要显示的矩阵XY轴编号和XY轴
10 回答
如何添加计数?
7 回答
如何添加计数器函数?
1 回答
如何添加计数器列来计算数据帧中另一列中的特定值?
9 回答
如何添加计数器来跟踪while循环中的月份和年份?
2 回答
如何添加计数并删除countplot的顶部和右侧脊椎?
1 回答
如何添加计时器wx.应用程序更新窗口对象的主循环?
3 回答
如何添加评论到帖子?PostDetailVew,Django 2.1.5
9 回答
如何添加评论拉梅尔亚姆
8 回答
如何添加诸如矩阵Python/Pandas之类的数据帧?
6 回答
如何添加谷歌地点自动完成到Flask?
9 回答
如何添加超时、python discord bot
2 回答
如何添加超过1dp的检查
5 回答
如何添加距离方法
1 回答
如何添加跟随游戏的敌人精灵
7 回答
如何添加路径以便python可以找到程序?
10 回答
如何添加身份验证/安全性以使用happybase访问HBase?
8 回答