[TIKA-2229] NullPointerException at org.apache.tika.parser.microsoft.ooxml.XWPFListManager.getFormattedNumber(XWPFListManager.java:64) - ASF JIRA

XML

Word

Printable

JSON

Details

Type: Bug
Status: Resolved
Priority: Major
Resolution: Fixed
Affects Version/s: 1.14
Fix Version/s: 1.15, 2.0.0
Component/s: parser
Labels:
- OOXML

Description

I got an error to extract text from PDF with the following stacktrace:

java.lang.NullPointerException
	at org.apache.tika.parser.microsoft.ooxml.XWPFListManager.getFormattedNumber(XWPFListManager.java:64)
	at org.apache.tika.parser.microsoft.ooxml.XWPFWordExtractorDecorator.writeParagraphNumber(XWPFWordExtractorDecorator.java:297)
	at org.apache.tika.parser.microsoft.ooxml.XWPFWordExtractorDecorator.extractParagraph(XWPFWordExtractorDecorator.java:168)
	at org.apache.tika.parser.microsoft.ooxml.XWPFWordExtractorDecorator.extractIBodyText(XWPFWordExtractorDecorator.java:107)
	at org.apache.tika.parser.microsoft.ooxml.XWPFWordExtractorDecorator.buildXHTML(XWPFWordExtractorDecorator.java:93)
	at org.apache.tika.parser.microsoft.ooxml.AbstractOOXMLExtractor.getXHTML(AbstractOOXMLExtractor.java:112)
	at org.apache.tika.parser.microsoft.ooxml.OOXMLExtractorFactory.parse(OOXMLExtractorFactory.java:112)
	at org.apache.tika.parser.microsoft.ooxml.OOXMLParser.parse(OOXMLParser.java:87)
	at org.apache.tika.parser.CompositeParser.parse(CompositeParser.java:280)

Attachments

- Sort By Name
- Sort By Date
- Ascending
- Descending

NPEatXWPFListManager#getFormattedNumber.docx
03/Jan/17 13:55
15 kB
Jorge Spinsanti

Activity

People

Assignee:: Unassigned

Reporter:: Jorge Spinsanti

Votes:: 0 Vote for this issue

Watchers:: 2 Start watching this issue

Dates

Created:: 03/Jan/17 12:39

Updated:: 12/Apr/21 12:59

Resolved:: 03/Jan/17 14:11