Aspose.words for java 在html 转 docx 后会丢失有序列表得样式 cjk-ideographic

docx.docx (2.5 MB)

<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
	<head>
		<!--[if gte mso 9]><xml><w:WordDocument><w:View>Print</w:View><w:TrackMoves>false</w:TrackMoves><w:TrackFormatting/><w:ValidateAgainstSchemas/><w:SaveIfXMLInvalid>false</w:SaveIfXMLInvalid><w:IgnoreMixedContent>false</w:IgnoreMixedContent><w:AlwaysShowPlaceholderText>false</w:AlwaysShowPlaceholderText><w:DoNotPromoteQF/><w:LidThemeOther>EN-US</w:LidThemeOther><w:LidThemeAsian>ZH-CN</w:LidThemeAsian><w:LidThemeComplexScript>X-NONE</w:LidThemeComplexScript><w:Compatibility><w:BreakWrappedTables/><w:SnapToGridInCell/><w:WrapTextWithPunct/><w:UseAsianBreakRules/><w:DontGrowAutofit/><w:SplitPgBreakAndParaMark/><w:DontVertAlignCellWithSp/><w:DontBreakConstrainedForcedTables/><w:DontVertAlignInTxbx/><w:Word11KerningPairs/><w:CachedColBalance/><w:UseFELayout/></w:Compatibility><w:BrowserLevel>MicrosoftInternetExplorer4</w:BrowserLevel><m:mathPr><m:mathFont m:val="Cambria Math"/><m:brkBin m:val="before"/><m:brkBinSub m:val="--"/><m:smallFrac m:val="off"/><m:dispDef/><m:lMargin m:val="0"/> <m:rMargin m:val="0"/><m:defJc m:val="centerGroup"/><m:wrapIndent m:val="1440"/><m:intLim m:val="subSup"/><m:naryLim m:val="undOvr"/></m:mathPr></w:WordDocument></xml><![endif]-->
	</head>
	<body>
		<ol style="list-style-type: cjk-ideographic;">
			<li>sadsad</li>
			<li>asdas</li>
			<li>asdasdaas</li>
			<li>asdasd</li>
		</ol>
	</body>
</html>

@wzy1027 Aspose.Words 输出与 MS Word 输出相同。 因此 Aspose.Words 的行为是预期的。
aw.docx (8.4 KB)
ms.docx (13.0 KB)

可是与html页面显示不一致

如果我想实现显示结果和html一致,我该如何做

@wzy1027 该行为是预期的,Aspose.Words 模仿 MS Word 行为。 请注意,Aspose.Words 设计用于处理 MS Word 文档。 HTML 文档和 MS Word 文档对象模型有很大不同,将一种格式转换为另一种格式后并不总是能够提供 100% 的保真度。 在大多数情况下,Aspose.Words 在处理 HTML 文档时会模仿 MS Word 的行为。

ok,我想知道是否有办法让其保持一致

@wzy1027 由于格式的差异,恐怕无法从 HTML 生成看起来与浏览器中完全相同的 MS Word 文档。 使用 Aspose.Words 或 MS Word 都无法实现这一点。

当我使用spire.doc去处理得时候就可以做到,我想aspose.words应该也可以把

因为ms word中是有一、这种编号样式的

cjk-ideographic这个也是约定好的,我觉得aspose.words是不是缺少了对html这种样式的处理

@wzy1027 正如我所提到的,Aspose.Words 在处理 HTML 文档时模仿 MS Word 的行为。 Aspose.Words 生成的文档看起来与 MS Word 从 HTML 生成的文档完全相同。