文字読み取り機能について
文字読み取り(OCR: Optical Character Recognition)は、画像内の文字を認識してテキストデータに変換する機能です。本の引用を手入力する手間を省いたり、手書きメモをデジタル化したりできます。
対応言語
読書の森の文字読み取り機能は以下の言語に対応しています:
- 日本語 - 漢字・ひらがな・カタカナ対応
- 英語 - アルファベット・数字対応
文字読み取り機能は横書き(左から右へ書かれた)テキストに対応しています。縦書きの日本語書籍には対応していません。
初回使用時に文字認識用のデータ(約15MB)をバックグラウンドでダウンロードします。2回目以降は高速に動作します。
文字読み取りの使い方
-
メモ欄の画像をクリック
メモ欄に表示されている画像をクリックすると、コンテキストメニューが表示されます -
[画像の文字を読み取る] を選択
メニューから [画像の文字を読み取る] を選択すると、文字読み取りウィンドウが開きます。クリックした画像がプレビューに表示され、自動的に画像の傾きや歪みの検出・補正が行われます -
自動補正結果を確認
補正された画像がプレビューに表示されます。[補正前]/[補正後] ボタンで補正前後の画像を切り替えて確認できます -
読み取りを実行
[読み取り] ボタンをクリック。進捗バーで処理状況が表示されます。中綴じ本の見開きが検出された場合は、[左ページ]/[両ページ]/[右ページ] から読み取る範囲を選択します。[両ページ] では左右のページを並列に処理し、それぞれの進捗バーが表示されます -
結果を確認・編集
抽出されたテキストが表示されます。必要に応じて修正できます -
[OK] で画像の直下に挿入
[OK] ボタンをクリックすると、クリックした画像のすぐ下にテキストが挿入されます。この操作は [元に戻す] で取り消せます
対応画像形式
以下の画像形式に対応しています:
- JPEG(.jpg, .jpeg)
- PNG(.png)
- GIF(.gif)
- WebP(.webp)
- BMP(.bmp)
読み取り解像度の選択
文字読み取り実行時の解像度を3段階から選べます。速度と精度のバランスを調整できます。
高速
画像を1500px以下に縮小して読み取りを実行。処理が速く、大まかなテキスト抽出に向いています
標準(デフォルト)
画像を2500px以下に縮小して読み取りを実行。速度と精度のバランスが良い設定です
高精度
元の解像度のまま読み取りを実行。小さい文字も認識しやすくなりますが、処理時間が長くなります
選択した解像度設定は自動的に保存されます。次回以降も同じ設定が使用されます。
自動補正機能
文字読み取りウィンドウを開くと、画像の傾きや歪みを自動で検出・補正します。
傾き補正
文字列の傾きを検出し、自動的に水平に補正します
ページ切り出し
撮影されたページの四辺を検出し、台形の歪みを補正してページだけを切り出します
見開き本対応
中綴じ本の見開きページを自動で検出。左ページ・右ページ・両ページを選んで読み取れます。両ページモードでは左右を並列に処理するため高速です
プレビューの [補正前]/[補正後] ボタンで補正前後の画像を比較できます。補正が不要な場合は自動的にスキップされます。
認識精度を上げるコツ
明るくクリアな画像
十分な光量があり、文字がはっきり見える画像を使用してください
適切な解像度
文字が小さすぎず、適度な大きさで写っている画像が最適です
水平な文字
文字が水平に並んでいると認識精度が上がります
高コントラスト
文字と背景のコントラストが高いほど認識しやすくなります
撮影環境の整備
黒い紙や板の上に原稿を置き、ガラス板を乗せて撮影すると、原稿が平らになり影が少なくなります。小さい本や背が割れた本でも高精度に読み取れます
- 照明を斜めから:ライトをカメラの真後ろではなく、斜め45度の位置に配置すると反射を軽減できます
- 間接照明を使う:ライトを天井や白い壁に向けて反射させた光で照らすと、柔らかく均一な光になります
- カメラの角度を調整:カメラを真上ではなく、わずかに斜めから撮影すると反射を避けられます。歪みは自動補正されます
- アクリル板を使う:ガラス板の代わりに透明アクリル板を使うと反射が少なくなります(数百円程度)
- 縦書きの日本語テキスト
- 手書き文字(崩し字、草書体など)
- 装飾的なフォント
- ぼやけた画像(斜めの文字は自動補正されます)
- 背景と文字色が似ている場合
活用例
本からの引用
本のページを撮影し、引用したい部分の文字を読み取って抽出。手入力よりも素早く正確に記録できます。
板書・ホワイトボード
授業や会議の板書を撮影してテキスト化。後から検索・編集しやすい形で保存できます。
名刺・資料
紙の資料をデジタル化して読書録に記録。情報の整理に役立ちます。
よくある質問
Q: 初回使用時に時間がかかるのはなぜですか?
初回は文字認識用のデータ(約15MB)をダウンロードするため、数秒〜数十秒かかることがあります。一度ダウンロードすれば、次回以降は高速に動作します。
Q: オフラインでも使えますか?
文字認識データがダウンロード済みであれば、オフラインでも文字読み取り機能を使用できます。
Q: 認識結果が間違っています
文字の読み取りは完璧ではありません。抽出後のテキストを確認し、必要に応じて手動で修正してください。認識精度を上げるコツも参考にしてください。
Q: スマートフォンでも使えますか?
はい、スマートフォンのブラウザでも利用できます。カメラで撮影した画像の文字を直接読み取ることも可能です。