I am trying to read in .doc files using FileReader, and use it to extract the text. Upon getting results I am getting a lot of broken characters, the first paragraph I get contains:
��ࡱ�>�� !#���� ��������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������Y ��bjbj�W�W
is there any way to just get the text written in the .doc file without all the formatting?