DCOX-HTML-DOCX変換で段落の配置が失われました。

文書を左寄せで作成したWORDをHTMLへ変換するとtext-align:leftが指定されない状態で変換されます。このHTMLを再度WORDに変換すると、text-align:leftの指定がないため、両端揃えのワードに変換されてしまいます。
本来、①WORD→②HTML→③WORDを行った結果、①と③が完全に同じであるべきだと思うのですが、実現する方法はありますでしょうか。

添付資料は①②③の変換した結果、④は②が本来こういう形になるべきではとテキスト編集したHTMLとなります。ご確認お願いします。№18_添付ファイル.zip (26.7 KB)

@dirbi

Aspose.Words for Java 19.12の最新バージョンを使用してシナリオをテストしましたが、共有の問題は見つかりませんでした。 そのため、Aspose.Words for Java 19.12を使用してください。

それでも問題が解決しない場合は、単純なJavaアプリケーション(コンパイルエラーのないソースコード)を作成してください。これにより、問題を再現し、テスト用にここに添付できます。 問題を調査し、詳細を提供します。

ご確認ありがとうございます。一度19.12のバージョンで再度試してみます。
念のためですが、そちらで①→②に変換した結果と②→③に変換した結果を添付いただくことは可能でしょうか。

@dirbi

次のコード例を使用して、Aspose.Words for Java 19.12の最新バージョンで出力ドキュメントを生成しました。 添付の出力ドキュメントを確認してください。

Docs.zip (10.8 KB)

Document doc1 = new Document(MyDir +"justify.docx");
doc1.save(MyDir + "result.html");

Document doc2 = new Document(MyDir +"result.html");
doc2.save(MyDir + "justify result.docx");

コードと結果の送付ありがとうございます。もう一度確認してみます。

ただし、現在使用しているソースでバージョンを最新にしても結果は変わりませんでしたので設定しているオプションの設定を送付します。
----私たちの設定----
// HTML保存オプションを設定する
HtmlSaveOptions htmlSaveOptions = new HtmlSaveOptions(); htmlSaveOptions.setExportRoundtripInformation(true);
htmlSaveOptions.setExportImagesAsBase64(true);
htmlSaveOptions.setScaleImageToShapeSize(false);
htmlSaveOptions.setCssStyleSheetType(CssStyleSheetType.INLINE);

上記の設定の一つを以下にすると明示的に「text-align:left;」はついたのですが、BODYの外にスタイルが設定され、こちらが望むHTMLの形式ではありませんでした。
「htmlSaveOptions.setCssStyleSheetType(CssStyleSheetType.EMBEDDED);」

そちらでも同じ結果になるか教えてください。再現するなら、現在の設定のまま中央揃い、右揃い、両端揃いと同様に左揃いが指定できる方法を教えてください。

頂いた回答結果を確認しましたが、私たちの質問と認識が異なっています。
私たちは左揃いのWORDをHTMLに変換した時にtext-align:leftの設定がHTMLに設定されなかったことを疑っています。
text-align:leftの設定をしないHTMLをWORDに変換すると、両端揃いになりませんか?
頂いたソースを見ると、justify.docx → justify result.docx に変換しただけに見えるので検証頂いた作業の意味がよくわかりません。頂いた資料の中にjustify.docxはありませんでした。

@dirbi

2つの単語文書を共有しました。 1つのドキュメントには左揃えの段落があり、他のドキュメントには正当化の段落があります。 わかりやすいようにドキュメントの名前を変更しました。

タイムリーかつ正確な応答を確保するために、テストのために以下のリソースをここに添付してください。

  • 入力ドキュメント。
  • 望ましくない動作を示す出力ファイルを添付してください。
  • 目的の動作を示す予想される出力ファイルを添付してください。
  • 問題を再現し、テスト用にここに添付するのに役立つ単純なJavaアプリケーション(コンパイルエラーのないソースコード)を作成してください。

これらの情報が準備でき次第、問題の調査を開始し、詳細情報を提供します。 ご協力いただきありがとうございます。

PS:これらのリソースを添付するには、zipしてアップロードしてください。

ご依頼いただいた通り資料を用意しました。
こちらの質問がわかりにくかったと思うので、説明(一部ソースコード記載).xlsx
をご確認ください。
№18_添付ファイル_20191213再問合せ.zip (250.5 KB)

@dirbi

次のコード例では、Aspose.Words for Java 19.12の最新バージョンを使用してシナリオをテストしましたが、共有の問題は見つかりませんでした。 したがって、Aspose.Words for Java 19.12を使用してください。 参考のために、出力文書がこの投稿に添付されています。Docs.zip (17.1 KB)

Document doc = new Document(MyDir + "çBHTMLü-WORDò¤èÀâtâ@âCâï.docx");

HtmlSaveOptions htmlSaveOptions = new HtmlSaveOptions(); htmlSaveOptions.setExportRoundtripInformation(true);
htmlSaveOptions.setExportImagesAsBase64(true);
htmlSaveOptions.setScaleImageToShapeSize(false);
htmlSaveOptions.setPrettyFormat(true);
htmlSaveOptions.setCssStyleSheetType(CssStyleSheetType.INLINE);

doc.save(MyDir + "19.12.html", htmlSaveOptions);
doc.save(MyDir + "19.12.docx");

Document htmlDoc = new Document(MyDir + "19.12.html");
htmlDoc.save(MyDir + "htmltodocx-19.12.docx");

試験頂いた内容がよくわかりません。 まず、「“çBHTMLü-WORDò¤èÀâtâ@âCâï.docx”);」は私たちが提供した「①HTML変換用WORDファイル.docx」(左揃いのWORD)でしょうか?

そうであれば、それを変換した「19.12.html」にtext-align:justify; (HTML上の両端揃いの設定)がされた結果になるのはおかしくないですか?
問題点を記載したので添付資料をご確認ください。確認.zip (227.3 KB)

INPUTの左揃いのWORDとOUTPUTのHTMLがわかるよう添付をお願いします。

念のため確認ですが、私たちが提供した「①HTML変換用WORDファイル.docx」はそちらのWORDで開いても左揃い設定になっていますよね?

19.12で実行しましたが、結果は変わりませんでした。ご確認お願いします。最新版での実行結果.zip (510.3 KB)

@dirbi

2つのWord文書を共有しました。 1つのドキュメントには左揃えの段落があり、他のドキュメントには揃え揃えの段落があります。

正当化テストケースの場合、DOCX> HTML> DOCXが変換されると、出力HTMLおよびDOCXに正当化スタイルが存在します。 このケースには問題はありません。 添付ファイルを確認してください。Docs.zip (5.9 KB)

左揃えの場合、DOCX> HTML> DOCXが変換されると、出力DOCXに左の信号が表示されます。 段落のデフォルトの配置は左揃えです。 そのため、このスタイルは出力HTMLにエクスポートされません。 ただし、この問題は問題追跡システムに WORDSNET-19704として記録しています。 この問題が解決されると、このフォーラムスレッドを介して通知されます。

ご不便をおかけして申し訳ございません。

20.1のリリースノートを確認したところ、今回の問題解決は含まれておりませんでした。
解決する予定がいつか分かれば教えてください。
私たちのお客様が困っているため、状況を説明する必要があります。

@dirbi

あらゆるお客様のご要望にタイムリーに対応できるよう最善を尽くしておりますが、残念ながらすべてのお客様の問題に対する納期を保証することはできません。 私たちは先着順で問題に取り組みます。 これは、大部分の顧客のニーズを満たすための最も公平で最も適切な方法であると感じています。

現在、問題は分析のため保留中であり、キューにあります。 問題の分析が完了すると、見積もりを提供できるようになります。

納期を保証する必要はないので、参考までに情報を提供してください。
私たちの並び順はどの程度で、貴社の過去実績からどの程度期間で分析を開始されますでしょうか。

@dirbi

お問い合わせいただきありがとうございます。 この問題の分析が完了すると、ETAを提供できるようになります。 お待ち頂きまして、ありがとうございます。

すいません。回答になっておりません。

私たちの並び順はどの程度で、貴社の過去実績からどの程度期間で分析を開始されますでしょうか。

推測でいいのでETAを提供できる日を教えてくださいという問い合わせになります。

@dirbi

分析を完了せずに問題が何であるかを言うことは困難です。 分析が完了すると、推定値を共有できるようになります。

この問題は無料のサポートフォーラムで報告されており、通常の優先度で処理されます。 問題の解決の進行を高速化するには、次のリンクから有料サポートポリシーを確認することをお勧めします。
有料サポートポリシー

@dirbi

Aspose.Wordsは、デフォルト値を持つCSSプロパティの記述を避けます。 この場合、ブラウザがデフォルトでテキストに適用するものであるため、「text-align:left」は省略されます。

「テキスト整列」が欠落している問題の原因を教えてください。

HTMLでtext-align:left を省略してしまうと、HTML→WORDに保存した時に両端揃いになることが問題だといっていることは理解いただいていますでしょうか?
WORD→HTML→WORD の順で変換した場合に結果が変わることが問題だと言っています。

あなたにお願いしたいのは①②のどちらかの対応です。
①HTML(テキスト整列を指定しない)→WORDに変換した場合、WORDも左揃いを明示的に指定して変換してくれること。
②WORD(左揃い)→HTMLに変換した場合、HTMLに明示的にtext-align:left を指定して変換してくれること。