5ちゃんねる ★スマホ版★ ■掲示板に戻る■ 全部 1- 最新50  

■ このスレッドは過去ログ倉庫に格納されています

OCRのことなんですが…

1 :スキャナ初心者:2001/07/30(月) 23:59
既出だったらすみません。
スキャナを買ったのですが、付属のOCRソフトが使えなくて悩んでいます。
横書きはいいのですが、縦書きだと見事に文字化けしてしまって。
縦書きでもOKなOCRソフトで、おすすめがあったら推薦してください。
できれば…2万以下で。

202 :199:02/11/22 01:54
>>200
第二水準の設定しましたけど、それでも駄目でした。。

203 :名無しさん@そうだ選挙にいこう:02/11/22 02:36
中国語対応のバイリンガルOCRじゃないと無理のような・・・
繁体字対応のヤツ。

素朴な疑問なんですが、認識されないのは第1・2水準漢字なのでしょうか?


204 :199:02/11/22 03:01
ん?
第一か、第二水準漢字かは分からないのですが、
たとえば「くさかんむり」の下に「市」
って書く文字だったり
読み⇒(フツ)
「たけかんむり」の下に「移」と書く文字だったり。。
読み⇒(イ)
ご迷惑かけてすみません。わざわざ有難うございます。

205 :名無しさん@そうだ選挙にいこう:02/12/05 02:32
参考になったのでage

206 :名無しさん@そうだ選挙にいこう :02/12/07 09:06
読取革命Ver7いいですね 乗り換え版が8000円程度で買えるし
機能もいい 

207 :佐々木健介:02/12/07 09:29
>>1
     ______
    /_      |
    /. \ ̄ ̄ ̄ ̄|
  /  /  ― ― |
  |  /    -  - |
  ||| (5      > |
 | | |     ┏━┓|   / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
| | | |     ┃─┃|  < こんなサイトを見つけた
|| | | |  \ ┃  ┃/    \  正直、スマンカッタ
| || | |    ̄         \_________
http://freeweb2.kakiko.com/mona/

208 :hide:02/12/11 10:12
下線や括弧が多用されている書類を読みとりたいのですが
現在誤認識が多くて閉口しています。
これは、OCRソフトの限界ですか。それとも認識率を上げる
方法があるのでしょうか。
ちなみに、今回は400dpiで取り込んだtiffファイルを
 読んでココ体験版で認識させました。
もし少しでも認識率が上がれば、そのソフトを購入したいと思っています。
ご存じの方よろしくお願いします。

209 :名無しさん:02/12/17 06:52
>208
読んでココのバンドル版は、認識率がかなり悪い。
エーアイソフトに言わせれば、製品版を買えってことだろう。
しかし、あんなに性能の悪いソフトを掴まされると、製品版の出来が不安になる。
だから、おれはe.Typistを買った。
エプソンは読んでココと手を切ってほしいね。


210 :名無しさん@そうだ選挙にいこう:02/12/18 00:33
>>209
エプソンがエーアイソフトと手を切ることはない。
なぜなら、エーアイソフトってエプソンの子会社だから

211 :名無しさん@そうだ選挙にいこう:02/12/18 04:28
>210
そうなんだ。知らなかった。
プリンタ・スキャナ・OCRは相性や値段で密接に関わり合っているから、OCR目的の人はCANON系を
買ったほうがいいな。個人的には、プリンタ単体ならエプソンが一番良いと思っているだけに
残念。

212 ::02/12/19 00:44
エプソンスキャナ使用中なのですが、他社OCR入れても問題ないスよね?

213 :名無しさん:02/12/19 01:05
>212
ソフト会社が発表している動作確認済み機種で、確認したほうが無難だと思う。


214 :名無しさん@そうだ選挙にいこう:02/12/19 11:38
>>209
バンドル版と体験版を混同しているようだが…
体験版は製品版と基本は同じもので、認識率は飛躍的に良いぞ。

たしかにe.Typistはデフォルトでは認識率が良いけど
読んdeココも認識辞書で誤変換癖を修正していけば同等。
どれでも少なからず誤変換癖はあるから、手間は結局似たり寄ったりだよ。
軽快感や図表の認識の得手不得手など、ホントに一長一短だし。
どっちで決まりとは断言できないんで、俺は両者を場面に応じて使い分けてる。



215 :名無しさん@そうだ選挙にいこう:02/12/19 14:50
何年かぶりにe.Typistをバージョンアップしてv8.0にしました。
前のバージョンでは認識途中でセーブして後でその状態から
再開できなかったのですがそれが可能になっていて良かったです。

日本語認識は以前から悪くなかったのですが、古いプログラム
ソースを読み込ませてみて、変換精度がかなり良くなっていました。

Epson GT-7600U 400dpiで読み込ませています。

216 :209:02/12/20 04:13
>214
いちお、バンドル版と体験版の違いはわかってます。
体験版での比較をせずに、読んでココのバンドル版は質が悪い→e.Typistを買うをやったので、読んでココの製品版はどのような出来なのかは知りません。
軽快感や図表認識は、読んでココのほうが良いのですか?

217 :名無しさん@そうだ選挙にいこう:02/12/20 08:45
認識率
読取革命>読んでココ>>>>>>e.Typist

操作性
読んでココ>読取革命>>>>>>e.Typist

218 :214:02/12/20 15:27
>>216
今まで使ってみた限りでは、軽快感はダントツで読んdeココ、
図表の認識ではe.Typistの方が優秀というような印象です。
やはり体験版を比較して決めるのがいいでしょう。

219 :名無しさん@そうだ選挙にいこう:02/12/21 21:14
読んdeのムカつくところはエラーで強制終了すると(結構よくある)
そのあとツールバーとかの表示が初期状態に戻ること。
新しいスキャナ買ったらe.Typistエントリーが付いてきたので
来年はe.Typist Ver.9にしてみようかと思う。

220 :名無しさん@そうだ選挙にいこう:02/12/24 08:06
hosyu

221 :名無しさん@そうだ選挙にいこう:02/12/28 01:22
キャプチャー画像のテキスト化に強いOCRソフトあります?
WinReader6.0ではOCRできませんでした。
画面では12ポイントぐらいなんですけど。


222 :名無しさん@そうだ選挙にいこう:02/12/28 13:34
>>221
単にキャプチャー画像って言われてもなんだか判らないがな。
キャプチャーした状態で表示して12ポイントだったら普通は無理だと思うぞ。
ドットで16ドットくらいだろ? スキャン原稿換算で3ポイントにも満たないからな。



223 :221:02/12/28 23:06
そうなんです。でも、サイズが小さい代わりに、スキャンに伴う
カスレとかが一切ないのでなんとかならないかなと思いまして。

で、レスをヒントに、画像処理ソフトで2倍に拡大してみたら、
なんと半分以上認識されるようになりました。
この方向で工夫してみます。どうもありがとうございました。


224 :名無しさん@そうだ選挙にいこう:03/01/02 21:02
読んdeココ Ver.8 とエプソンGT8300UFを買いました。
数字ぎっしりの紙の表(主に財務諸表関係)をエクセル
に落としまくろうと思ったもんで。
しかし,と.をうまく判読してくれない。これじゃ全然使えないっす。
なんとかなりませぬか??


225 :224:03/01/02 21:19
そっか、substitute関数で置き換えりゃいいのか!解決っす。

226 :名無しさん@そうだ選挙にいこう:03/01/03 02:19
置き換えなら読んdeココ上でもできまっせ。
認識辞書を鍛えるのも良し。

227 :名無しさん@そうだ選挙にいこう:03/01/07 18:53
e.typist8で、「画像PDF」を「テキスト付きPDF」に変換すると、
変換後のファイルサイズが20倍近くになって困ってます。
相談窓口に相談しても解決せず。

170のいう「変更」ってどうやるんだ?
>読んdeココ8の透明文字つきPDFの画像部は、
>取り込み画像のままで、解像度は変更できないのだそうだ(仕様)。
>おしいなあ、e.Typist8のように変更できれば、
>ファイルサイズを小さくできるのに。

228 :227:03/01/07 19:19
すみません。解決しますた。。。。

229 :名無しさん@そうだ選挙にいこう:03/01/07 22:11
>228
何をどうしたら解決したのか、同じトラブルをかかえている人のためにも
記録としてココに書き込んでおいて下さい。
質問だけして逃げないように!!

230 :困ったチャン:03/01/09 21:09
あの・・・業者さんにOCR頼むと1枚あたりどれくらい取られるの?
100枚ぐらいの書類を電子化したいのです。
業者さんがソフトより高かったら自分でソフト買ってコツコツやろうかな・・・。

231 :227:03/01/11 13:03
>>229

失礼しました。

1.メニュー「その他」→「環境設定」
2.「その他」タグの「図領域出力DPI」で、解像度を変更。

ちなみに、私は
 DPI=「96」
に設定しました。
ただし、画像の解像度を失っているかもしれません。これは不明です。
変換の前後で画像サイズがあまり変わらないので、もしかすると実質的な解像度は同じかもしれません。

もっと最適な方法があるかもしれませんが、今はこの方法しか知りません。
試行錯誤でみつけました。


本来なら、
 DPI=「原稿画像DPIを保持」
という設定のままでサイズが維持されるべきだと思うのですが、
この設定のままでは、変換後のサイズが20倍近くになってしまいます。
PDF読込み時に解像度をあげ、解像度を戻さずに保存しているのかもしれません。

相談窓口のお姉さんに同じファイルで試してもらいましたが、同じ症状でした。


以上です。




232 :名無しさん@そうだ選挙にいこう:03/01/12 00:08
ありがとう。<傍観者より

これはコピペ保存するに足る情報だ。

233 :名無しさん@そうだ選挙にいこう:03/01/12 15:41
>224
 公官庁の出版している細かい数字の表を取り扱う目的で、
e.Typist8・読んde!!ココ Ver.8・読取革命2002などを
さまざま試してみました。
結局、東芝のExpress Readerが認識率・速度とも最良でした。


234 :名無しさん@そうだ選挙にいこう:03/01/12 19:34
でも¥20万じゃなー

235 :名無しさん@そうだ選挙にいこう:03/01/14 01:19
e.typstエントリーの事で質問があります。
キャノンのスキャナー(のおまけでついてきた体験版なんですけど
体験版だとテキスト編集みたいな事できないんでしょうか?
色々やってみるんですが文字化けしてしまって訳がわかりません。
サポセンに何度電話しても繋がらなくて途方に暮れてます。
バージョンアップしないと正常に動かないんでしょうか?
それともやり方が悪いんでしょうか?
ご存じの方いらっしゃったら教えてください。

236 :名無しさん@そうだ選挙にいこう:03/01/15 01:43
>235
認識結果が文字化けするんですか?
解像度はいくつくらいでスキャンしてますか?


237 :名無しさん@そうだ選挙にいこう:03/01/15 02:31
テキスト編集ができないわけないので
表示フォントが外国語になっちゃってるとか
初歩的なところを疑うのは失礼でしょうか?

あ、画像部分(もしくはロゴみたいにでっかい文字)を
強引に文字領域として認識させると製品版でも化けることある。
そのことかな?

製品版での知識でアドバイスすると(エントリー版は一度も使わぬまま
アップグレード版で上書きしたので)、認識領域を自動解析モードにするか、
怪しそうなところは手動で画像領域に指定して再度トライだ!

つーかまず素直に読めそうなところを文字領域で指定して、
すこしずつ練習してごらん。

238 :名無しさん@そうだ選挙にいこう:03/01/15 11:34
>>235
読みとり精度が良くて、カスタマイズしやすい
読んdeココか、読取革命の最新バージョンを買えば、よい。

239 :235:03/01/15 14:43
>>236>>237>>238
ご回答ありがとうございます。
それでですね、私がバカかアホかってな感じだったんです。
すいませんでした。OCRそのものをよく理解していませんでした。
ほんと申し訳ありませんでした。罫線を使ったフォームを編集したかった
んです。それで罫線が文字化けの原因って事がわかり。。。
ホント間抜けな質問してすいませんでした。
ピタットフォームというフォームの編集ができるソフトの体験版を
DLしてから回線切って首吊って逝ってきまつ・・・・



240 :山崎渉:03/01/15 16:39
(^^)

241 :名無しさん@そうだ選挙にいこう:03/01/15 23:51
そんなに恐縮しなくても(笑)。

242 :名無しさん@そうだ選挙にいこう:03/01/16 14:43
スキャナを初めて購入しようと思ってる者です。
今まで使った事ないので、変な質問かもしれませんが・・・

Fujitsu の ScanSnap! (fi-4110EOX2)
http://www.pfu.fujitsu.com/sales/snap/
これで読んdeココとかって使えますか?

243 :名無しさん@そうだ選挙にいこう:03/01/16 15:21
>>242
LECは著作権にうるさいぞ

244 :名無しさん@そうだ選挙にいこう:03/01/16 15:29
>>242
使える。
読ココはアクロバットのプラグインとしてつかるから、PDFで読み込んでそのままOCRをかけるのが吉。
スキャンスナップならば、読ココが一番使い勝手がいいと思う。

詳細が効きたければ、
http://pc3.2ch.net/test/read.cgi/hard/1039872188/l50
【ADF】スキャナで連続取り込み003.jpg【OCR】
へどうぞ。


245 :242:03/01/16 15:40
>243 >244
レスThanks! 「TWAIN規格」(?)対応のスキャナでないと言うことで
ちっと心配でした。PDFでできるのですね!

で、LECって何??

246 :名無しさん@そうだ選挙にいこう:03/01/17 18:55
読んdeココのお試し版をアクロバットのプラグインとして
使おうと思ったのですが、設定の仕方が分かりません。
読ココお試し版をインストールするだけで自動で設定されると
思ったのですが・・・。
お試し版ではプラグインとして使えないのでしょうか?
ご存じの方がいらっしゃいましたら教えて下さい。

247 :名無しさん@そうだ選挙にいこう:03/01/17 22:19
スタート→プログラム→読んdeココ→アドインの追加と削除
でAcrobatにチェック入れるとプラグインがインスコされるよ。
ちなみにアンインスコはチェック外すだけ。

248 :名無しさん@そうだ選挙にいこう:03/01/17 23:19
>>247
有り難うございます。
プラグイン出来ました。
早速使ってみます!


249 :名無しさん@そうだ選挙にいこう:03/01/20 20:26
>>243
このネタで笑える香具師は多いのか?

250 :名無しさん@そうだ選挙にいこう:03/01/20 22:50
ウヘ     ,--─i'''""        'ヽ、
     /   i,             ヽ,
    ..i     |.              i,
    /    _i-、  ___,       i,
    |   ┌'    ̄ ̄     ヽ、    l
    |    l             i,    |
    |   i ,,,,,,,,,,     ,,,,,,,,,,,,  ヾ,    i
    .|  /  _ "     __ "'   i ,--i
    .ト、.l  -=・=-    -=・=-   ト'/"i |
      .|       l :::::.   ::::::::::::::::::∂ l
      |       l  ::::::...  ...:::::::::::: -' ノ
      .|     '~-  -::::::::::::::::::::::::::::┌-'
      ヽ,  i \___/ `i:::::::::::::::::l 
       ヽ,    \/  ::::::::::::::::::ノl  
         \     ...::::::::::::::::/::ト、
          ~ト、....:::::::::::::::::::/::::/ >、
          il,  ̄ ̄ ̄ ̄::::/  /  \
        _,,-| \   ::_,--'"    /    ヽ-、
    _,,,.--'"~ |   >,-'''"       /      | ~"--,,_
  _,,.-'" /    |i  i" ヽ     //      |     ~''-,,__

251 :名無しさん@そうだ選挙にいこう:03/01/24 00:24
>>250
こっちには笑えた(w


86 KB
■ このスレッドは過去ログ倉庫に格納されています

★スマホ版★ 掲示板に戻る 全部 前100 次100 最新50

read.cgi ver 05.04.02 2018/11/22 Walang Kapalit ★
FOX ★ DSO(Dynamic Shared Object)