我使用如截图所示的方法获取doc和docx文档的总字符数,但是和word自身统计的字符数偏差比较大,我使用官方的 https://products.aspose.app/words/zh/wordscounter/word word统计工具就能够得到比较精确的结果,能告诉我你们是怎么做的吗?
@chenjienn 这个应用程序没有什么特别之处。唯一不同的是,我们在使用 doc.setIncludeTextboxesFootnotesEndnotesInStat(true);
之前使用了 doc.updateWordCount(true);
。您可能会因为缺少某些字体而出现问题,也可以尝试使用 LoadOptions 加载文档:
LoadOptions loadOptions = new LoadOptions();
loadOptions.getLanguagePreferences().setDefaultEditingLanguage(EditingLanguage.CHINESE_PRC);
Document doc = new Document("input.docx", loadOptions);
如果没有任何帮助,请在此提供文件进行测试。
(WP10%)某框架结构办公楼施工组织设计.docx (165.7 KB)
你可以尝试用这个docx文档做测试,官方的在线统计工具是正确的字符数:13541,我使用上述的代码得到的字符数是:5618,差距比较大,另外我尝试了LoadOptions,并不会造成什么影响
@chenjienn 我已经检查了结果,并确认如果您使用的是没有许可证的 Aspose.Words,则结果为 5618。如果您使用的是许可证,则结果为 13541。您可以尝试使用 Aspose.Words 的 临时许可证 并检查结果。