如何使用Python从Excel表中提取OLE对象?

2024-09-23 06:31:40 发布

您现在位置:Python中文网/ 问答频道 /正文

我想使用Python将OLE对象从Excel表提取到Windows剪贴板中

This post没有进一步的帮助,因为它是用于VBA的。 而且this post仍然没有得到答复

假设给定的Excel表格(带有ChemDraw或ChemSketch OLE对象):

enter image description here

有一些Python模块可以处理Excel文件,例如openpyxlxlrd。 模块win32clipboard可以将数据放入剪贴板

我的问题:

  1. 我不知道如何将嵌入的OLE对象放入剪贴板。可能,openpyxlxlrd以及win32clipboard不适合这样做
  2. 有一个Python模块oletools可能可以做到,但我不理解它是如何工作的。 https://pypi.org/project/oletools/

从本页:

oleobj: to extract embedded objects from OLE files.

这似乎正是我要找的,但是,我找不到任何MCVE。不幸的是oleobj的文档基本上被缩减为:“阅读源代码,了解自己”。如果您能给予提示和帮助,我将不胜感激

到目前为止,我的代码是:

### trying to extract OLE objects from Excel table into clipboard
from openpyxl import load_workbook
import win32clipboard as clpbd

def set_clipboard(data):
    clpbd.OpenClipboard()
    clpbd.EmptyClipboard()
    clpbd.SetClipboardText(data)    # I'm aware, this is only for text, is there anything for OLEs?
    clpbd.CloseClipboard()

def print_clipboard():
    clpbd.OpenClipboard()
    data = clpbd.GetClipboardData()
    clpbd.CloseClipboard()
    print(data)

wb = load_workbook(filename = 'tbChemOLE.xlsx')
ws = wb.active

myName = ws['A3'].value    # result: napthalene
myImage = ws['B3'].value   # result: None
myObject = ws['C3'].value  # result: None

set_clipboard(myName)
print_clipboard()          # result: Naphtalene
# set_clipboard(myImage)   # crash, because myImage is None
print_clipboard()     
# set_clipboard(myObject)  # crash, because myObject is None
print_clipboard()        

wb.close()
### end of code

Tags: 模块对象nonedatawsisresultexcel
2条回答

我构建了一个python模块来完成这项工作,请在这里查看https://pypi.org/project/AttachmentsExtractor/该模块也可以在任何操作系统上运行

安装库后,请使用以下代码段:

 from AttachmentsExtractor import extractor
            
 abs_path_to_file='Please provide absolute path here '
 path_to_destination_directory = 'Please provide path of the directory where the extracted attachments should be stored'
 extractor.extract(abs_path_to_file,path_to_destination_directory) # returns true if one or more attachments are found else returns false.

与此同时,我发现了this post,OP实际上不希望将OLE对象放在剪贴板上,但对我来说这很好。实际上,不需要openpyxlxlrd,但需要win32com.client

我可以获取所有OLE对象,但是,它们(可能)是按照添加顺序索引的。 所以我需要创建一个字典,行索引作为键,一组OLE对象索引和名称作为值

代码:

### copy OLE object in certain cell to clipboard
import win32com.client as win32
import win32clipboard

excel = win32.gencache.EnsureDispatch('Excel.Application')
ffname = r'C:\Test\tbChemOLE.xlsx'
wb = excel.Workbooks.Open(ffname)
ws = wb.Worksheets.Item(1)
objs = ws.OLEObjects()

def get_all_OLEs():
    oleNo_dict = {}     # dictionary for all OLE objects
    for i in range(1,len(objs)+1):    # loop all OLE objects
        obj = objs.Item(i) 
        myRow = obj.TopLeftCell.Row        # row of OLE object
        myName = ws.Cells(myRow,1).Value   # corresponding name
        oleNo_dict[myRow] = (i, myName)
    return oleNo_dict

def get_OLE(row):
    try: 
        objs[oleNo_dict[row][0]].Copy()
        win32clipboard.OpenClipboard()
        data = win32clipboard.GetClipboardData(0xC004) # Binary access
        win32clipboard.CloseClipboard()
    except Exception as e:
        print(e)
        win32clipboard.OpenClipboard()
        win32clipboard.EmptyClipboard()
        win32clipboard.CloseClipboard()
    return oleNo_dict[row]
    # and OLE is on clipboard if found

oleNo_dict = get_all_OLEs()

row = 4
myMolecule = get_OLE(row)
print(myMolecule[1], "OLE object is now on the clipboard.")

wb.Close()
excel.Application.Quit()
### end of code

结果:

Anthracene OLE object is now on the clipboard.

相关问题 更多 >