怎么提取文档中的公式内容

公式.docx (10.6 KB)

现在我遇到一个问题.
文档中的公式,我可以提取成图片,但是如何把公式内容提取出来给html做展示?

@wsy123 您可以使用以下代码:

Document doc = new Document("input.docx");

OfficeMath officeMath = (OfficeMath)doc.getChild(NodeType.OFFICE_MATH, 0, true);

HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.setOfficeMathOutputMode(HtmlOfficeMathOutputMode.MATH_ML);
System.out.println(officeMath.toString(saveOptions));

新建公式.docx (16.5 KB)

不好意思,我之前的提问有遗漏,
我发现在文档中有多种公式,nodetype是OfficeMath的公式可以直接取到内容.
但是有一种公式不是OfficeMath类型的公式就没办法提取了.
我用aspose解析 结构是paragraph子级是shape

@wsy123 这些公式存储为 ole 对象,形状内部包含 WMF 图像。 遗憾的是,无法使用 Aspose.Words 将这些形状转换为 OfficeMath。 我们已在问题跟踪器 WORDSNET-20976 中记录了功能请求,并将在准备就绪后通知您。

好的谢谢回答 ,
现在这种公式 我确实是先提取成WMF然后再转换成图片做展示的.