以下のコードでPDFからテキストを抽出してファイルに保存しようとしているのですが、
Unicodeの表記揺れが発生します。テキスト抽出時に正規化を行うオプション設定はありますか?
また、例えば①のような丸付き数字は正規化しないなどのオプション設定はありますか?
// PDFからテキストを抽出
StringBuilder sb = new StringBuilder();
string extractedTex…...Replace(".pdf", "") + ".txt", sb.ToString());...