如何取得多欄式PDF正確順序的內容

您好,
以下的 PDF 檔內容是多欄式的,每一頁是左欄擷取文字後,再擷取下一欄中的文字,
請問如何透過 Aspose.PDF 來達到呢? 謝謝您。

例如第2頁內容中,
… 因此現代廚房的設計重點除了動
要接下一欄的
線與風格外,烹飪家電的選擇更值得用心…

@rainmaker_ho

您能否分享您用来提取文本的示例代码片段?我们将在我们的环境中测试该场景并相应地解决它。

您好,使用的代碼如下,
using(var doc = new Aspose.Pdf.Document(pdfFile))
{
//取 SubScripts and SuperScripts, 順序比較OK一點,但字會亂跑
var textFragmentAbsorber = new Aspose.Pdf.Text.TextFragmentAbsorber();
doc.Pages[2].Accept(textFragmentAbsorber);
Console.WriteLine(textFragmentAbsorber.Text);
}

有比較順,但 Page 2 最上面的 Title 會在之中
輸出的結果如下,

渴望的嘴、更能為一家的健康把關,因此現代廚房的設計重點除了動

->>> 這裡 應該要在第一行 b e s t 要 成 為 您 的 家 庭 生 活 中 心: 親子互動、溫馨歡樂和諧、健康無油煙、便利快速 享受健 康、優 雅 的生活 <<<-

線與風格外,烹飪家電的選擇更值得用心,優質商品不僅好用便利、

@rainmaker_ho

我们已在内部问题跟踪系统中打开以下新票证,并将根据 Free Support Policies 中提到的条款提供修复。

问题 ID:PDFNET-55511

如果您需要优先支持,以及直接联系我们的付费支持管理团队,您可以获取 Paid Support Services