GoogleKeepで永島慎二作品リストをテキスト抽出!!

https://kaze88.hatenablog.jp/entry/2020/07/11/162222

森田氏作成のこの作品リストを以前紹介しているが 1P目だけだった。
昨日 ある方法で全ページテキスト化!!


スキャナーに付随のCannonのは操作法不明で フリーのOCR用のソフト・アプリいろいろ探してみたが・・・どれも一長一短! 精度が低い!
精度の良さそうな試用版は・・・6000¥ちょいする!たかが9ページほどのファイルに出す気にもなれず探してたら、GoogleKeepでできるというような情報をゲット。

やってみたらこれが優秀、精度が格段に良い!
いろいろ精度維持するには工夫が必要ではあるがなんにしてもコピーペーストでできる便利さ! 表形式のファイルを列ごとの画像ファイルに分割保存!
で そのファイルをGoogleKeepに取り込んで(or貼り付けて)「画像のテキストを抽出」でOK!
縦書きのファイルも十分な精度で変換してくれます。
表形式や縦二段組などの特殊な形式は各段、各列ごとに分割すれば
十分な精度で抽出変換してくれます。該当形式のファイル作ってそこに個別にコピペする!!

 タイトル名で2~3抽出ミスしてところがあったが、それ以外で大きなミスは見当たらない。
細かいところでミスはちらちらありはしたが本筋とは別物!
見落としあるだろうが・・・無事全抽出!!

 

MSONenotでも同じようなことができるのだが・・・(環境なのかOnenoteのバージョンなのか、officeLensが入ってないとうまく機能しないようなところもあって よくわからんww)
精度的にはGKeepのほうが良さそうな気配!GDive、Gfフォト使ってる身としては
Keepのほうが格段に便利です。