0

I am trying to read in .doc files using FileReader, and use it to extract the text. Upon getting results I am getting a lot of broken characters, the first paragraph I get contains: ��ࡱ�>�� !#���� ��������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������Y ��bjbj�W�W

is there any way to just get the text written in the .doc file without all the formatting?

Carter
  • 101
  • 1
  • 7

0 Answers0