We're sorry Aspose doesn't work properply without JavaScript enabled.

Free Support Forum - aspose.com

Aspose.Words for .net怎么读取Word文档中的数据

我们用Word,需要读取Word文档中的数据,转换成结构化数据保存至数据库,但是有两个问题需要你们的帮助。
1、附件图片1中的【操作】部分,读取出来后,文字前面的编号,如1,a b 点号等没有
如何获取word 每个段落前的编号(自动编号),如:下面内容中的A.B.C.
A.第一行;
B.第二行;
C.第三行。
获取的数据为:第一行;第二行;第三行;看不到前面的编号。
2、根据测试,能获取表格中的文字与图片,但图片所有的位置无法识别,应该怎么识别图片的位置呢?(附件图片2)文件.zip (285.3 KB)

@yichunxia

谢谢你的询问。

在您的文档中,1,a,b是列表标签。 请使用ListLabel.LabelString属性获取列表标签。 您可以使用Paragraph.IsListItem属性检查段落是否为列表项。

Aspose.Words.Layout命名空间提供的类允许在将文档格式化为页面时访问诸如页面上的特定文档元素所在的页面和位置等信息。

下面的代码示例显示了如何获取Shape节点的位置。

Document doc = new Document(MyDir + "input.docx");
LayoutCollector collector = new LayoutCollector(doc);
LayoutEnumerator enumerator = new LayoutEnumerator(doc);
                 
foreach (Shape shape in doc.GetChildNodes(NodeType.Shape, true))
{
    if (shape.HasImage)
    {
        enumerator.Current = collector.GetEntity(shape);
        Console.WriteLine(enumerator.Rectangle);
    }
}