紙媒体をテキストデータにしたい
レポート書くときやブログの執筆でもそうだけど、新聞や雑誌、書籍などの紙媒体の記事を引用したい場合、基本的には原文の引用したい箇所を入力しますよね。
自分も最近までそうしてた。
ずいぶん昔(と言っても10年ぐらいかな)、OCRのスキャナーとソフトを会社で買って使ってたけど、あまり精度がよくないのと、いちいち機械をつないで起動して・・・とかが面倒くさくなって使わなくなった。そのうちバージョンアップもサポートもされずに倉庫のどこかで眠っているか素材ゴミに出してしまったか?
最近では、公的な資料もほぼネットにPDFで出ているから、そこからテキストデータを抜き出せばいいので楽だ。ニュースもネットで記事探せば出てくるし。でも、最近ちょっと紙の新聞記事を引用したくてテキストデータを打ち込みはじめたけど、老眼のはじまった自分には新聞の字が小さくて記事と画面を行ったり来たり・・・
「あ”あ” ε=(`δ´メ)=3 もう~!!!」となって
「そうだ! 写真撮って文字読みとるぐらいネットで出来るんじゃないの?」と思いついて調べたら・・・
やっぱりある (*^o^*)
Googleドライブに写真データをドラック&ドロップして、Googleドキュメントで開くだけ!
何これ! 超簡単じゃん (^O^)
よし。備忘録も兼ねて簡単にやり方を残しておこう。
Googleアカウントを作って、Googleドライブを使う
まず、Googleアカウントを持っていることが前提。持っていない方はアカウント作るか別の方法を探しましょう。
必要な記事の写真を撮る(iPhoneで撮って、iCloudのようにクラウドで共有できるようにしておけばPCでサクッと作業できる)。
写真のデータをGoogleドライブにドラッグ&ドロップしてデータをアップロードする。
こんな感じの画面にポイッと放り込むだけ。
Googleドキュメントで開けば「あら!もうデータ化されている」
データ化したい写真のファイルを選択して右クリック
↓
アプリで開く
↓
Googleドキュメントをクリック。
すると、読み込んだ画像が表示される。
下の方へスクロールすると
おおー (゜Д゜)!!!
見事にデータ化されている。
見出しやグラフなんかが複雑にレイアウトされた記事だと順番がバラバラになるけど、必要なところだけ抜き出せばいいので自分はこれで十分。有料のOCRだと、複雑なレイアウトも段落に分けてデータ化してくれるらしいが、まあ、そこまで頻繁に使うもんでもないから今のところ必要性は感じない。
ミッション型のビジネスモデルが主流になる・・・けど
しかしGoogleはスゴイね。これを無料で提供しているんだから。なんだろう。何か作って売るというプロダクトアウトのビジネスモデルってもう古いのかな。既存市場でやろうと思っても参入障壁が高すぎるし。
「世の中をこういう便利な社会にしたい」というミッション型のビジネスモデルがこれから主流になる・・・いや、もうなっているのかな。
以前に資産運用のアルゴリズムを開発して創業したウェルスナビの柴山和久さんの講演を聴いたことがあるけど、このサービスもミッション型という感じだった。
世の中の不便を便利にする。
言葉にすれば簡単だけど、実践するのは「ひらめき」と「信念」と「行動力」の掛け合わせなんですよね。
そこがなかなか凡人には乗り越えられない大きな壁が・・・
はぁ~ (´Д`)=33