使用Aspose.Words 轉PDF

在DOC 中存在異體字(由2個bytes組成),在轉換成PDF後, 只會出現原本的造字+一個空格,已經設定
pdfOptions.setEmbedFullFonts(true);
在查看PDF時,也見到有關的FONT 已經embedded, 請問是什麼原因?

@ikieong, 您能否附上源DOC文档和输出PDF以进行分析?

testWordToPdf.docx (12.2 KB)

font主要來自
http://code.web.idv.hk/miscs/miscs.php

而PDF embedded 後file size太大,未能上載,可參考截圖
image.png (13.6 KB)

@ikieong, 您能否将 PDF 上传到任何文件共享服务(例如 Dropbox 或 Google Drive)并提供该文件的链接?

https://drive.google.com/file/d/1OIZLtpoktiTl2Jkm7-VWOwkPrmlklKPd/view?usp=sharing

@ikieong, 要解决字符问题,您需要在保存 PDF 文档之前启用 HarfBuzz 插件:

Document doc = new Document("testWordToPdf.docx");
doc.getLayoutOptions().setTextShaperFactory(com.aspose.words.shaping.harfbuzz.HarfBuzzTextShaperFactory.getInstance());
doc.save("out.pdf");

您不需要调用 pdfOptions.setEmbedFullFonts(true)

HarfBuzz 插件有一个文档页面:
https://docs.aspose.com/words/java/enable-opentype-features/

Thank you Denis.
It works.