Aspose.Words LoadFormat.Html 時,字串裡有   並不會被顯示在 Word 之中

您好,
我使用 Aspose.Words 載入一份 Html 檔案(Word 另存 html 格式),
使用Browser 可以看到   的空白,但另存成 Word 時,空白卻不見,沒有顯示出來。

var filePath = "test.html";
var opts = new HtmlLoadOptions();
opts.LoadFormat = LoadFormat.Html;
var doc = new Document(filePath);
foreach (Section sec in doc)
            {
                sec.PageSetup.PaperSize = PaperSize.A4;
                sec.PageSetup.LeftMargin = 36;
                sec.PageSetup.RightMargin = 36;
            }
doc.Save("out.docx");

測試如附件,
demo.zip (9.0 KB)

@rainmaker_ho

请注意,Aspose.Words模仿MS Word的行为。 如果使用MS Word将文档转换为DOCX,将获得相同的输出。

您能ZIP并附上您期望的输出文件吗? 然后,我们将为您提供有关您的查询的更多信息。

您好,
test.zip (1.3 MB)
zip 中有 AUO312010_1090519_094349.htm 為 word 的 html 格式,可以使用 Word 開啟它。
wordSaveAs 為 Word 開啟 htm 另存的結果,asposeSave.docx 為使用 AsposeWord.Save 的結果。
目前發現有3個問題,有截圖為
Err1.png : 序號 Word 為重1開始,而 Aspose 另存出來變成了 3
, err2.png : 項次 頁次 中間的空白不見了
, Err3.png : Table 中的 間距也不與 另存出來的結果不同

麻煩您了.

@rainmaker_ho

我们已经测试了该方案,并设法在我们这边重现了第一期。 为了更正,我们已在问题跟踪系统中将此问题记录为 WORDSNET-20485(HTML到DOCX转换后,列表号未正确导出)。 解决此问题后,将通过此论坛主题通知您。对于给您带来的不便,我们深表歉意。

我们正在努力解决剩余的问题,并将尽快与您联系。

@rainmaker_ho

我们已经测试了这种情况,并设法在我们这边重现了第三期。 为了更正,我们已在问题跟踪系统中将此问题记录为 WORDSNET-20486(在将HTML转换为DCOX后,行高已更改)。 解决此问题后,将通过此论坛主题通知您。 对于给您带来的不便,我们深表歉意。

我们无法在您的文档中找到与第二期相关的“目录”字段。 您能否分享有关此问题的更多详细信息以及重现此问题的代码示例。

您好,
是「項 目 頁次」哦!

@rainmaker_ho

您能否與我們分享有關此問題的更多詳細信息以及代碼示例,以最終重現此問題?我們將對此問題進行調查,並為您提供更多信息。

同一份文件,同樣的程式碼,請參考前面附件,wrod 檔第2頁第2行。
asposeSave.docx vs wrodSaveAs.docx
差異圖為附件中的 err2.png

@rainmaker_ho

我們已經使用MS Word 2016和Aspose.Words 20.5將HTML保存到DOCX。輸出是相同的。請檢查隨附的輸出文件。docs.zip (43.3 KB)

您好,我使用您產出的 docx ,透過 Word 2019 for Mac 來看,是不同的,
請看附件的圖示比較
different.jpg (260.1 KB)

@rainmaker_ho

我们已在问题跟踪系统中将这个问题记录为WORDSNET-20523。 解决此问题后,将通过此论坛主题通知您。 对于给您带来的不便,我们深表歉意。

@rainmaker_ho

关于WORDSNET-20523,能否请您分享使用的是哪个WordProcessing应用程序? 还请共享您正在使用的操作系统。 我们无法在Microsoft Word中重现此问题。

您好,
我使用的是 Mac 作業系統(zh-TW),Mac Office 2019

@rainmaker_ho

感谢您分享细节。 我们已将此信息记录在我们的问题跟踪系统中。 一旦有关于此问题的更新,我们将通知您。