我有一个URL列表,例如:
www.google.com
www.yahoo.fr
www.stackoverflow.com
我想删除所有包含字符串“oo
”和“flow
”的URL。你知道吗
我做了一个python函数:
def my_function(param1,param2,
param3,param4,liste_to_delete,liste2_to_delete):
status=True
SQL_CONSTANT = "url not like '%"
URL_SEP = ";"
# getFirstList
broadcastListe1String =""
listtodelete = liste2_to_delete.split(URL_SEP)
for url in listtodelete:
broadcastListe1String = SQL_CONSTANT + url + "%'"
if(listtodelete.index(url) != len(listtodelete) -1):
broadcastListe1String = broadcastListe1String + " AND "
my_broadcast = sc.broadcast(broadcastListe1String)
然后我做了:
DataFrame= my_DataFrame.where(my_broadcast.value)
这个函数从我列表中的第二个元素开始,它不需要 在我的列表中列出第一个元素。你知道吗
如何更改我的函数并删除列表中的第一个元素? 我希望我说得很清楚 谢谢
输出
我认为您可以使用这样的
filter
函数:例如:
或:
相关问题 更多 >
编程相关推荐