群島舎

よくある質問

OCRで埋め込んだテキストが消える

Adobe Acrobat を用いて OCR テキストを埋め込んだ PDF は、保存を伴う操作によって埋め込まれた OCR テキストが破損する場合があります。特に日本語など、欧文以外の PDF では高確率で発生することがわかっています。

これは iOS 組み込みの PDF フレームワーク (PDFKit) の問題で、iPadOS/iOS 26 上の「プレビュー」アプリでも発生します。shelff においては、マーカーや注釈を書き込むときに PDF の保存が発生し、このタイミングで破損が起きます。

PDF に注釈を書き込む際は、事前に PDF のバックアップを取り、注釈を書き込んだ後に PDF を閉じて開き直し、OCR テキストの選択ができるか確認することをお勧めします。OCR テキストが破損する PDF については、shelff での注釈書き込みは行わないようお願いいたします。

PDF の OCR テキストが破損してしまった場合は、元の OCR 処理を行ったソフトウェア (Adobe Acrobat 等) で再度 OCR 処理を行ってください。

shelff では、この問題を解決する方法を継続的に検討しています。