将字符串从其他列表追加到列表

2024-09-28 03:21:12 发布

您现在位置:Python中文网/ 问答频道 /正文

嗯,我有两个列表(名称和bilananu2017)名称包含公司名称,bilananu2017包含每个公司的pdf有一些缺少的链接问题是名称长度为80,bilananu2017长度为75我希望两个列表的长度相同,这样我可以制作一个数据帧。我的想法是在bilananu2017中为每个缺少的链接添加一个字符串“null” 基本上,我会将每个公司名称与所有链接进行比较,如果有一个包含campany名称的链接,然后将该链接附加到一个新列表中,如果没有附加(“null”),那么在最后,我会有一个新列表,其中每个缺少的链接的名称长度为null 我试过这个密码

for n in names:
    t=False
    for b in bilananu2017:
        if n in b:
            bilananu2017_2.append(b)
            t=True
    if t==False:
        bilananu2017_2.append("Null")

它做的工作,但不知怎的比拉南U2017的长度现在是89???应该是80 所以我尝试了以下代码:

for n in names:
    t=False
    if any(n in bil for bil in bilananu2017):
        bilananu2017_2.append(bil)
        t=True
    if t==False:
        bilananu2017_2.append("Null")

现在我得到了一个错误,说bil没有很好的定义,这是显而易见的,但我如何才能修复它

这就是我的名字

['ab', 'adwya', 'aetec', 'al', 'alkim', 'ams', 'artes', 'assad', 'ast', 'atb', 'atl', 'tjari', 'tjl', 'maghrebia', 'bl', 'bh', 'ml', 'biat', 'bna', 'bt', 'bte', 'salim', 'cc', 'cell', 'creal', 'cil', 'scb', 'city', 'dh', 'lstr', 'nakl', 'sokna', 'ecycl', 'gif', 'hl', 'icf', 'lndor', 'mag', 'mip', 'mnp', 'mpbs', 'nbl', 'oth', 'office', 'pltu', 'pgh', 'sah', 'sam', 'smd', 'servi', 'sfbt', 'siame', 'simpa', 'sipha', 'sits', 'somoc', 'sopat', 'sotem', 'sotet', 'stpap', 'stpil', 'mgr', 'sotuv', 'spdit', 'star', 'stb', 'steq', 'stip', 'tgh', 'tlnet', 'tpr', 'tinv', 'tre', 'tair', 'tls', 'uadh', 'ubci', 'uib', 'unimed', 'wifack']

在bilananu2017的75个链接中,我将放置4个,这样您就可以有一个想法:

http://www.bvmt.com.tn/sites/default/files/societes/ab/etats-financiers/ab-etats-financiers-annuels-31-12-2017.pdf',
 'http://www.bvmt.com.tn/sites/default/files/societes/adwya/etats-financiers/adwya-etats-financiers-annuels-individuels-31-12-2017.pdf',
 'http://www.bvmt.com.tn/sites/default/files/societes/aetec/etats-financiers/aetec-etats-financiers-annuels-31-12-2017.pdf', 
'http://www.bvmt.com.tn/sites/default/files/societes/alkim/etats-financiers/alkim-etats-financiers-annuels-individuels-31-12-2017.

例如: 名称中的第一个名称是“ab”,如果我们尝试在链接中查找该名称,我们将发现第一个链接包含“ab”

http://www.bvmt.com.tn/sites/default/files/societes/ab/etats-financiers/ab-etats-financiers-annuels-31-12-2017.pdf

here/societes/ab


Tags: in名称comhttpabpdf链接www
1条回答
网友
1楼 · 发布于 2024-09-28 03:21:12

试试这个,它可以很好地工作:

import re

names=['ab','bbb','ccc','adwya'] #Dummy Data
bilananu2017=['http://www.bvmt.com.tn/sites/default/files/societes/ab/etats-financiers/ab-etats-financiers-annuels-31-12-2017.pdf', 'http://www.bvmt.com.tn/sites/default/files/societes/adwya/etats-financiers/adwya-etats-financiers-annuels-individuels-31-12-2017.pdf']
pattern = re.compile("http:\/\/www\.bvmt\.com\.tn\/sites\/default\/files\/societes\/(.*?)\/")
toBeAdded = []
for i in range(len(names)):
    status=False
    for bil in bilananu2017:
        x=re.search(pattern, bil)
        if x:
            if names[i] == x.group(1):
                status = True
                break
    if(status==False):
        toBeAdded.append(i)

for i in toBeAdded:
    bilananu2017.insert(i,"Null")

print(bilananu2017)

输出

['http://www.bvmt.com.tn/sites/default/files/societes/ab/etats-financiers/ab-etats-financiers-annuels-31-12-2017.pdf', 'Null', 'Null', 'http://www.bvmt.com.tn/sites/default/files/societes/adwya/etats-financiers/adwya-etats-financiers-annuels-individuels-31-12-2017.pdf']

相关问题 更多 >

    热门问题