有 Java 编程相关的问题?

你可以在下面搜索框中键入要查询的问题!

java如何使用pdfbox获取pdf中选定文本的字体信息

我有pdf中所选文本的坐标。我使用PDFTextStripperByArea添加和提取区域以获取文本信息

但是我想获得所选文本的字体信息。当我使用PDFTextStripperByArea类的getResources()方法时,它返回null。下面是示例代码-

    PDFTextStripperByArea stripper = new PDFTextStripperByArea();
    stripper.setSortByPosition(true);
    Rectangle2D rect = new Rectangle(96, 150, 101, 11);
    stripper.addRegion("selectedText", rect);
    PDPage firstPage = document.getPage(0);
    stripper.extractRegions(firstPage);
    System.out.println(stripper.getTextForRegion("selectedText"));
    PDResources resources = stripper.getResources();
    // gives a null pointer exception for resources object in the below line
    for (COSName fontName : resources.getFontNames())
    {
        PDFont font = resources.getFont(fontName);

        System.out.println(font.getFontDescriptor().getFontName());
        System.out.println(font.getFontDescriptor().getFontFamily());
        System.out.println(font.getFontDescriptor().getFontWeight());
        System.out.println(font.getName());
        System.out.println(font.getSubType());
    }

我是否做错了什么,或者是否有其他方法可以做到这一点


共 (0) 个答案