請問是否有RAG的範例?

您好,
請問是否有利用 Aspose 針對 Retrieval Augmented Generation (RAG) 讀取各種格式文件的範例或是建議的方法嗎?
目前在讀取pdf, word 中的 table ,圖片等等,要如何解析文件的 章、節、段 … 來處理呢?

@rainmaker_ho 您可以使用 DocumentVisitor 来浏览文档结构并对其进行分析。

請問PDF檔案也可以用 DocumentVisitor 嗎?

@rainmaker_ho

PDF 文件格式与 Word 文件有很大不同,Aspose.PDF 不提供任何公开文档结构的方法或功能。我们已创建调查票以进一步分析此请求。该票证在我们的问题跟踪系统中记录为 PDFNET-57283。一旦解决,我们会通知您。
您能否也分享一份 PDF 样本以供参考吗?

此外,@alexey.noskov Aspose.Words还支持加载PDF文档,这个建议的方法也可以用于使用Aspose.Words分析PDF文件吗?

您好,
請參考以下的pdf:
ESG 報告書

@rainmaker_ho PDF 文档会根据 DOM 加载到 Aspose.Words 中。但 PDF 和 Word 各有不同,我们无法保证 PDF 文件内的所有节点都支持,而且将来也会支持。不过,通过 DocumentVisitor,您可以获得有关段落、运行、表格和字段的信息。

@rainmaker_ho

我们已将示例文件附加到已记录的票证中,并在有更新后通知您。

1 Like