您好,感谢您的查看和帮助!
我使用以下代码生成TXT文档,发现生成的TXT保留了原始的空格,空行!
我需要,生成的TXT文本,自动去掉空字符,空格,换行等等特殊的标记。
//Open document 打开PDF文件
Aspose.Pdf.Document pdfDocument = new Aspose.Pdf.Document(PDF);
//Create TextAbsorber object to extract text 创建文本吸收器对象来提取文本
Aspose.Pdf.Text.TextAbsorber textAbsorber = new Aspose.Pdf.Text.TextAbsorber();
//Accept the absorber for all the pages 接受所有页面的吸收器
pdfDocument.Pages.Accept(textAbsorber);
string extractedText = textAbsorber.Text;
//创建txt文本和写入权限
FileStream fs = new FileStream(txt, FileMode.Create, FileAccess.Write);//创建写入
TextWriter tw = new StreamWriter(fs);
// Write a line of text to the file 在文件中写入一行文本
tw.WriteLine(extractedText);
// Close the stream 关闭小溪
tw.Close();
fs.Close();