实际上,我正在使用scrapy解析一些html页面,我使用xpath并从一些html标记中获取了一些地址,结果如下所示
result = ["Hno 4-50, Plot No 301, Swathi Pooja Homes,Beside Rajadhani Theater, Vikas Nagar,Dilsukhnagar,Hyderabad","Mr Sravan"]
我想加入下面我已经做过的事情
^{pr2}$得到了以下结果
final_result = "Hno 4-50, Plot No 301, Swathi Pooja Homes,Beside Rajadhani Theater, Vikas Nagar,Dilsukhnagar,Hyderabad,Mr Sravan"
在这里,我们可以观察到final_result
(地址)Mr Sravan
中的名字在末尾,但是通常名字应该在任何联系人的门牌或门牌号之前,对吗?,所以不管加入后列表中有多少字符串,我都应该在开始时得到名称,有没有办法做到这一点?谁能告诉我怎么做吗?在
编辑代码:
目前我一次解析四个url,所以当我使用xpath(或相关的)并从不同的url获取地址时,每个url的结果(例如)如下所示
final_result = ['Addess_2','Newyork', 'Mr T.Jamal(Name)']
['Mr T. Jamal(Name)', 'Addres_1','Extra info']
['Addres_3','Mr T. Jamal(Name)','Extra info','Related scope']
['Addres_4','Extra info','Mr T. Jamal(Name)','Related info']
['Addres_5','Extra info','Related info'] # No name
['Addres_6','Extra info1','Related info1'] # No name
这里对于解析地址中的所有url都要编写适用于上面所有列表的代码
你可以这样做:
编辑: 根据您的评论,如果您知道名称位于排名
^{pr2}$i
,可以这样做:这样的怎么样:
屈服:
^{pr2}$更新
这将在原始列表中的任何位置找到“Mr”字符串,并使其按您想要的方式工作。在
这与OP在updatepost中提供的4个测试字符串一起工作
更新2OP更改问题,使“Mr”不在列表中
此代码将检测Mr是否在列表中,并将其移到前面,如上所示。它还将检测它是否不在列表中,并避免出现索引越界的情况。参见下面的输出。在
测试串:
^{4}$代码:
产量分别为:
相关问题 更多 >
编程相关推荐