您好,
請問是否有利用 Aspose 針對 Retrieval Augmented Generation (RAG) 讀取各種格式文件的範例或是建議的方法嗎?
目前在讀取pdf, word 中的 table ,圖片等等,要如何解析文件的 章、節、段 … 來處理呢?
請問PDF檔案也可以用 DocumentVisitor
嗎?
PDF 文件格式与 Word 文件有很大不同,Aspose.PDF 不提供任何公开文档结构的方法或功能。我们已创建调查票以进一步分析此请求。该票证在我们的问题跟踪系统中记录为 PDFNET-57283。一旦解决,我们会通知您。
您能否也分享一份 PDF 样本以供参考吗?
此外,@alexey.noskov Aspose.Words还支持加载PDF文档,这个建议的方法也可以用于使用Aspose.Words分析PDF文件吗?
@rainmaker_ho PDF 文档会根据 DOM 加载到 Aspose.Words 中。但 PDF 和 Word 各有不同,我们无法保证 PDF 文件内的所有节点都支持,而且将来也会支持。不过,通过 DocumentVisitor,您可以获得有关段落、运行、表格和字段的信息。