5ちゃんねる ★スマホ版★ ■掲示板に戻る■ 全部 1- 最新50  

■ このスレッドは過去ログ倉庫に格納されています

OCRのことなんですが…

1 :スキャナ初心者:2001/07/30(月) 23:59
既出だったらすみません。
スキャナを買ったのですが、付属のOCRソフトが使えなくて悩んでいます。
横書きはいいのですが、縦書きだと見事に文字化けしてしまって。
縦書きでもOKなOCRソフトで、おすすめがあったら推薦してください。
できれば…2万以下で。

2 :名無しさん@そうだ選挙にいこう:2001/07/31(火) 11:19
既スレ
http://mentai.2ch.net/test/read.cgi?bbs=bsoft&key=977117663
OKREADER2000
http://www.sesys.co.jp/product/ocr/index_f.html
読取物語EXV4
http://www.rsk-tokyo.co.jp/products/yomitori/index.html
読取革命2001
http://www2.panasonic-it.com/pcsoft/yomikaku/yomikaku.htm

3 :1:2001/07/31(火) 11:45
すみません、削除依頼を出しておきます…。
わざわざ、教えてくださってどうもありがとうございました。

4 :1ではないが:2001/08/02(木) 17:34
 既スレは過去ログにいちゃってるのですけれども?
しかも、製品のホームページを見ただけでは、どこが良いのか判らないのですが?

5 :2:2001/08/03(金) 06:29
これは失礼しました。(先日まで既スレが見れたのですが。)
過去ログ倉庫↓
http://mentai.2ch.net/bsoft/kako/977/977117663.html
既スレではOKREADERと読取物語を推薦する人がいました。
私自身は、読んde!!ココ → e.Typist v5.0 → 同 v6.0
→ 読取革命2001 を使用してきて、読取革命にほぼ満足しています。
OCRは、認識対象との相性や、
各ソフト特有の認識のクセみたいなものがあるし、
認識率以外の機能や使い勝手にもソフトにより一長一短があるので、
できれば各ソフトの体験版をダウンロードして、実際に試用のうえ
自分の用途に適するものを選ぶのがいいと思います。

6 : :2001/08/03(金) 14:31
2へ
 ありがとうございました。

7 :名無しさん@そうだ選挙にいこう:2001/08/03(金) 16:20
「メールニュース配信における誤作動のお詫び」
トレーディングポストWEBマスターの伴と申します。
この度、平成13年7月31日16:29頃配信された、8月1日付けトレーディン
グポスト・メールニュース Vol.5につきまして、全ての受信者の氏名とメール
アドレスが記載されるという誤作動が発生致しました。
これは、メール配信ソフトの不具合によるもので、すでにこのような事が今後起こら
ない様に対応済みです。
トレーディングポストでは事の重大さを厳しく受けとめ、深く反省しております。
この件で多くの方に不快な思いをさせてしまいましたことを心からお詫び申し上げま
すと共に、今後このようなことのないよう、細心の注意を払う所存でございますの
で、何卒ご容赦賜りますようお願い申し上げます。
*************************
TRADING POST WEB MASTER
info@lifegear-tradingpost.com
www.lifegear-tradingpost.com
*************************

8 :遅レス:2001/08/26(5) 37:00
>>1
OCRソフトはどれも横書き縦書き両方いける筈です。
商品によって認識率の差はありますが、
「縦書きだけが見事に文字化けする」というのは
その商品の性能の問題ではないと思います。

■考えられる原因(その1)
スキャナのバンドル版OCRは、製品版と違って
簡易版がついている場合があります。
どこが簡易かは、その商品によって違います。
製品版は横書き縦書き両方いけるけども
簡易版は横書きのみ、というケースがあります。
そういう場合は、添付の説明書かreadme
若しくはhelpに必ず書いてあります。

■考えられる原因(その2)
横書き縦書き両方いける製品版の場合でも、
認識ブロック毎に、そのブロックが縦書きなのか
横書きなのかを、設定する必要があります。
縦書き原稿なのに、それを横書きとして設定していると、
むちゃくちゃな認識結果になります。

9 :皆さん、ありがと:01/08/27 23:51 ID:Rkw4mHf.
私も、1 さんと同様に、スキャナにおまけでついていた
「読んでココ」の簡易版で、縦書きがバケてしまい困っていました。
皆さんの情報が、とても参考になり、助かりました。
ありがとうございます。

10 :名無しさん@そうだ選挙にいこう:01/08/28 23:21 ID:Foa6GOg2
「OCRソフトより、画像閲覧ソフトの方が、実用的」という
コメントを別のスレで見たのですが、
OCRソフトは、使いにくいものなのでしょうか。

11 :名無しさん@そうだ選挙にいこう:01/08/29 00:15 ID:OtEJ.kAU
えっ、どーゆーこと?
全然方向の違うソフトのような気がするけど。

あっ、なるほど、こーゆーことか。
本や雑誌や書類の内容を、電子化するのに、
OCRでテキスト化するのと、
単に画像として保存するのと、
どっちがいいか、ということか。

そりゃまあ、
人によって、やりたい事 ちゅーか 求めるものは違うから、
その人がイイと思うほうがイイんじゃない?
テキストの再利用はしなくて、単に画像として見られるだけでイイ
という人は後者だろうし・・・

>OCRソフトは使いにくいか?
別に使いにくいということはないけど
結構手間がかかる、というか、手順が多いから、
まとまった量でなければ、手入力より時間がかかるデスネ。

12 :名無しさん@そうだ選挙にいこう:01/08/29 15:58 ID:EgDWHarg
11様
DocuWorksというソフトが良さそうですが、
このソフト、どう思われますか?

DocuWorksというソフトは、
OCRでテキスト化するのと、単に画像として保存するのとの
中間の感じがいたしますが。

13 :名無しさん@そうだ選挙にいこう:01/08/29 16:01 ID:EgDWHarg
DocuWorksソフトに関する情報

日経PC21 4月号でも取り上げられた画像管理ソフトの決定版

各種アプリケーションで作成した文書でも同じウィンドウ内で一括して扱うことができ、
紙の文書もスキャナーで読み込むことによって他の電子文書と同様に扱えます。

個人の文書管理からグループ、さらには企業レベルでの統合的な活用まで、
異なるアプリケーションで作成した電子文書や、さまざまな紙文書を一元管理。
わずらわしかったドキュメント作業が効率的に進みます。

■編集・整理・保管・検索
作成文書の保管・検索も素早く行なえます。
スキャナーで取り込んだ画像に対して自動的にOCRをかけることで、
画像データに対しても全文検索できます。

■アウトプット
数種類のアプリケーションで作成した文書でも、DocuWorks文書として一括出力。
配信先のアプリケーションを気にせず配信できます。

○対応OS
Windows(R) 95/98/Me
Windows NT(R) 4.0 (Service Pack 3以上)
Windows(R) 2000

標準価格:\13,200- → bStore販売価格:\11,880-

14 :名無しさん@そうだ選挙にいこう:01/09/02 11:12 ID:RVwhzl/U
カタログを見ると
eTypist7より読んdeココの方がいいみたい。

15 : :01/09/04 11:05 ID:GNbaF0Cs
ネットで必要な情報があると図や写真もある時は、キャプチャーでjpeg保存
してあるんだけど、それをOCRソフトで文章の部分をテキスト化したいんだけ
ど、そういう事できるソフトありますか?

16 :名無しさん:01/09/04 15:55 ID:7kKL4O7Q
>14
私はeTypist7も読んdeココも持ってますが,読み取り性能は
eTypist7の方がけた違いにいいですよ。ココの方は辞書の搭
載語数が多いので良く見えるけど、認識エンジンの性能自体
が悪いです。

17 :名無し:01/09/05 01:03 ID:Vh9XVJ6s
 1番の方、原稿の向きはいかがな状態でしょうか。
ソフトとPC(ソフト同士もあり)の不具合がなければ
何通りにも、おいて、チャレンジしてください。
 ちなみに 私、日本語縦書き、OKREADER2000
でなんとかなりました。

18 :名無しさん@そうだ選挙にいこう:01/09/05 13:59 ID:iXTT0ioc
>>17
>>1はソフトの設定間違えただけで、今ごろ恥ずかしい思いしてるんだから
それ以上突っ込まないでやってくれ

19 :名無しさん@そうだ選挙にいこう:01/09/06 03:56 ID:8LuqEZhU
>>15
> 図や写真もある時は、キャプチャーで jpeg 保存してあるんだけど

文字も含めて全部ですか?
その画像になった文字を、OCRで再度拾う、ということですか?

それは多分ムリでしょう。
HPの本文の文字は、大体 10dot×10dot くらいで表示されていますから。
ニュースのタイトル文字でも、その倍くらいでしょうし。
一方、通常のOCRでは、
10point の文字を 400dpi で取り込むと、1文字は大体 50dot×50dot になります。
だから、どの OCR ソフトでも、解像度不足で認識できないんじゃないでしょうか。

カラーの背景に書かれた、カラーの文字なんかになると、なおさら・・・

20 :15:01/09/06 10:04 ID:0vktFdLc
>>19
ムリですかぁ。残念です。
ワープロに打ち出すのもめんどいし、キャプチャーjpegをプリントアウト
してスキャナーに読み込ませてOCRソフトに読ませるしかないのかなぁ。
資源と労力の無駄ですが仕方ないですね。ありがとうございました。

21 :名無しさん@そうだ選挙にいこう:01/09/06 12:23 ID:1Gq4afBI
>>20
違うよ。そのまま読ませることできるよ
>>19
が逝ってるのは解像度が悪いからろくに読み込めないってことだろ

22 :19:01/09/06 19:20 ID:hvpkeevs
>>20
今、表示しているHPを、そのまま印刷した場合は、
画面上では10×10dotの文字でも、
ギザギザがとれて滑らかに印刷されてきますから、
それをOCRにかければ、認識してくれるかもしれません。
ま、もっとも、
今、表示しているHPなら、そんなことする必要は無いですが。

しかし、>>15 の書込みを見ると、あなたは、
HPをキャプチャーして、既に画像として保存してある、とありますから、
それを印刷した場合は、画面上で10×10dotだった文字だと、
印刷結果も10×10dotのギザギザ文字になって印刷されてくるでしょう。
だから、その紙をOCRにかけても結果は同じです。

試しに、文字サイズ(小)で表示してある このページをキャプチャーして、
15 のあなたの書込みをOCRにかけてみました。
して、その結果は・・・

やっぱりダメです。
認識率云々以前に、全く認識結果のテキストを吐き出してくれません。
ソッポ向いてる感じです。

因みに、使用ソフトは、
4・5年前の発売当時は、雑誌の評価でもコンスタントにベスト3に入っていた、
「超整理er (Ver1.0)」です。
このソフトは、もう今は店頭ではお目にかかれませんが、
今でも、週間文春・週間新潮の記事だと、99%認識してくれます。

23 :名無しさん@そうだ選挙にいこう:01/09/07 03:01
>>22
超生理erはファイリング・ソフトとしてはどうなのれすか?

24 : :01/09/07 05:04
>>23
「超整理er (Ver1.0)」についているファイラーは、
いろいろなファイルを管理できるファイリングソフトじゃなくて、
「OCRの対象となる画像」と「その認識結果のテキスト」だけを管理する為の
いわば、「超整理erでのOCR作業に特化されたファイラー」って感じですね。

このOCRの認識率は、今でも充分使える優れたものですが、
ファイラーも含めた それ以外の使い勝手は、はっきり言ってイマイチですね。

(Ver1.0) では、ファイラーに取り込める画像は、白黒2値の bmp と tiff だけですし、
フォルダーは、「キャビネット → フォルダー → ファイル」と、2階層(3階層?)までしか作れませんし、
また、OCRにかける画像は、必ず一旦このファイラーに取り込んで、
そこからOCRを呼び出す、という手順を踏まなければいけなくて、
OCRだけを単体では利用できません。
必ず、このファイラーを通す必要があります。
そこのところも、ちょっと不便ですね。

ただ、さっきも言ったように、このOCRの認識率は、今でも充分使える優れたものです。

25 :通りすがりですが:01/09/09 01:56
とても丁寧なレス、参考になりました。

24さんは、
ソフトのバージョンアップ又は乗換をなさる予定は
ないのですか?

もしあれば、参考までに御意見をお伺いしたいのですが。。。

26 :花男:01/09/09 10:28
>>24 さんの解説、とても参考になりました。
ところで、
24 さんは、Windows環境でしょうか?
超整理erは、MacとWinのHi-bridですよね(?)
日本語ヴァージョンのファイリング・ソフトで、
Hi-Brid版は珍しいと思うので、
在庫があれば、買おうかどうしようかと。。
ファイルの共通性があるなら魅力ですから。
ちなみに、
他のファイリング・ソフトも、
単純な階層構造やOCR前の取り込みなどは、
同じようなものじゃなかったかと思います。
(今、手元にないのではっきりしませんが、多分)


27 :26:01/09/09 10:34
URLを
http://www.nova.co.jp/products/chosera.html
この値段で10ケ国語対応っていうのも魅力かも

28 :26:01/09/09 10:57
超整理er 以外に、Mac対応のファイリング・ソフトありますか?
英語版なら、Paper Port があるみたいなんですけど、
日本語での全文検索可能なのがあれば。
Macは、シャーロックがあるけど、
画像とOCRテキストを別ファイルで持つのは面倒っぽいので。

29 :名無しさん@そうだ選挙にいこう:01/09/10 13:37
超生理はマックでも使えるのか
マックもあるからいいかもしれない。
他にもそういうソフトあるのかね?

30 :22・24:01/09/11 20:54
>>26
>24 さんは、Windows環境でしょうか?
私はWindowsです。 MACではありません。

>>25
>24さんは、ソフトのバージョンアップ又は乗換をなさる予定はないのですか?
OCRのバージョンアップや買い替えの予定は、今のところありません。

>>28
>超整理er 以外に、Mac対応のファイリング・ソフトありますか?
>>29
>他にもそういうソフトあるのかね?
MAC用OCRも、一応売られてはいますが、Windows版ほど選択肢は多くはありません。
ましてや、ファイラーまでついているものとなると、私は知りません。

>>26
>超整理erは、MacとWinのHi-bridですよね(?)
>>29
>超生理はマックでも使えるのか
私の使っている超整理er は、ハイブリッド版のようですねぇ。 私も知りませんでした。
となると、MACでも使えるファイラーつきOCRということで、これは貴重な存在ですねぇ。

>>26
>日本語ヴァージョンのファイリング・ソフトで、Hi-Brid版は珍しいと思うので、
>在庫があれば、買おうかどうしようかと。。
超整理er (Ver1.0) は、4・5年前には、定価2万数千円、店頭価格2万円の値段がついてました。
私は乗り換え版を 13000円で買いましたが・・・
それが1年くらい前でしたか、処分品用ワゴンで 500円で売られているのを見ました。
あれ以来、店頭では見かけていません。
今日も、大きな PCshop を数件回ってみましたが、全く売られていませんでした。
VersionUp の案内も、3年半前に来たっきりですし、
>>27のHPも、2年半前から更新されてないみたいですし。
もしかしたらNovaは、OCRからは手を引いたんじゃないでしょうかねぇ。
もしそうなら、サポートの面からも、他の製品のほうがいいんじゃないですかね。
それより、もう手に入らないでしょう。

31 :因みに:01/09/11 20:57
「ファイラー つき OCR」 又は 「OCR つき ファイラー」 は、
Windows 版なら↓このように たくさん出ています。

●メディアドライブ
http://www.mediadrive.co.jp/

   ・ e Typist Ver7 (OCR)
    http://www.mediadrive.co.jp/products/package/win/et70w/mark01.html
    実売価格22000円

   ・ やさしくファイリング3 (ファイラー)
    http://www.mediadrive.co.jp/products/package/win/yfiling3/index.html
    実売価格7500円

   ・ e Typist Ver7 +ファイリング (OCR とファイラーのセット)
    http://www.mediadrive.co.jp/products/package/win/et70w/et7p.html
    実売価格25000円

●オムロンソフトウエア
http://www.omronsoft.co.jp/

   ・ OmCR Ver3 (ファイラー つき OCR)
    http://www.omronsoft.co.jp/SP/win/omcr/index.html
    実売価格7380円

   ・ PaperPortDELUXE PRO (高機能ファイラー)
    http://www.omronsoft.co.jp/SP/win/ppd/index.html
    実売価格????円

●FUJI XEROX
http://www.fujixerox.co.jp/

   ・ Docu Works (OCR つき ファイラー)
    http://www.fujixerox.co.jp/soft/docuworks/
    実売価格11000円

●富士通ミドルウェア
http://www.fmw.co.jp/

   ・ image OFFICE Ver4 (OCR つき ファイラー)
    http://www.fmw.co.jp/s11/imagev40/top.html
    実売価格27000円

32 :名無しさん@そうだ選挙にいこう:01/09/11 23:12
>>31
情報、どうもありがとうございました。

Docu Works以外の情報が乏しいです。
ご存知の方いらっしゃいましたら、お願いします。

33 : :01/09/12 00:57
>>32
Docu Works の製品情報は、

>・ Docu Works (OCR つき ファイラー)
>    http://www.fujixerox.co.jp/soft/docuworks/
>    実売価格11000円

上のページの、左端の列の、縦に並んでいる項目をクリックですので・・・
見落としているといけないので、一応、念の為。

34 :33:01/09/12 01:08
すみません。間違えました。
33は取り消します。
「Docu Works以外の情報が乏しいです」を
「Docu Worksの情報が乏しいです」と
見間違えました。

35 :名無しさん@そうだ選挙にいこう:01/09/19 19:19
認識率を向上させるために、何か工夫されていますか?

36 : :01/09/19 23:04
・ 600dpiで取り込む。(←俺のスキャナでは これが最高)
 400dpiに比べると、サイズは倍以上になるのに、
 認識率は、ほんのちょっとしか良くならない。
 けど、そのほんのちょっとの為に、
 やっぱり600dpiで取り込んでいる。
・ まっすぐに取り込むのは当然として
・ あと、一番注意しているのは、
 取り込むときの、しきい値。
 気持ち 薄め のほうがイイみたい。

37 :読んdeココのユーザー:01/09/20 00:22
@面倒ですが、小さい文字の場合、拡大コピーするとか、
A辞書ファイルを鍛えるという方法もありますね。
新たな単語登録をその都度行う。
およそ使わないであろう文字を認識対象から外す。

38 :36:01/09/20 05:18
あっ、そうそう、忘れてた。
あと、イメージのパターン登録。

39 :名無しさん@そうだ選挙にいこう:01/09/21 23:24
倍角の文字の誤変換は困るなぁ。

40 :名無しさん@そうだ選挙にいこう:01/09/25 21:16
ほんと、困りますね。
置換くらいしか対策が思いつかない。

41 :1:01/09/25 21:42
その画像ならココ
http://www.f2.dion.ne.jp/~impact14/

42 :名無しさん:01/09/26 19:35
>>41
やめれ。ここは半角板じゃないぞ

43 : :01/09/27 20:14
>>39
倍角というのは、WP専用機でよく使われる、縦倍角文字・横倍角文字のことですか?

思いつく対策

●使われているのが本文じゃなくて、タイトルだけとかで文字数が少ない場合。
  ・ イメージをパターン登録させる。
  ・ その部分だけ手入力する。(こっちのほうが手っ取り早いか?)

●本文にも使われていて、文字数が多い場合。
  ・ 有効な対策が思いつきません。
  ・ 元のデータファイルがあるなら、OCRでなくて、
   いっそのこと、コンバーターソフトを使って、形式変換する。

44 :名無しさん@そうだ選挙にいこう:01/11/08 19:13
結局、どれがいいの〜?

超整理er ver.1.03を持ってるけど、そんなに認識率が良くないんで、
別に買おうかと思ってる。
けど、このスレを読む限り、これ以上のものは望めないみたい・・・。

45 :名無しさん@そうだ選挙にいこう:01/11/08 20:29
DocuWorksのOCR機能はいいよ。
お気に入りです。

46 :名無しさん@そうだ選挙にいこう:01/11/08 21:28
>>45
精度はどれくらいですか?

あと、DocuWorksって、更に外部のOCRソフトも組み込めましたよね。
超整理erも組み込めますか?

47 :名無しさん@そうだ選挙にいこう:02/02/10 20:51
A.Iソフトの読んでココ&Presto!について語りましょう。
カスタマイズや学習
認識率
スキャナーとの相性
ナドナド


48 : :02/02/10 23:04
ここまでみてDocuWorksか読取物語にしようか迷ってる。

49 :名無しさん@そうだ選挙にいこう:02/02/10 23:53
>>47
OCRソフトとスキャナとの相性は、無関係では。



50 :名無しさん@そうだ選挙にいこう :02/02/11 13:02
OKREADER使えるよ

51 :名無しさん@そうだ選挙にいこう:02/03/10 06:02
agetokou

52 :名無しさん@そうだ選挙にいこう:02/03/10 13:20
フォントきたねえけど、docuお勧め

53 :チQ:02/03/13 02:12
WinReader使ってるけどまぁまぁだぞ。
いい感じで読んでくれる。
結構お勧めかも。

54 :名無しさん@そうだ選挙にいこう:02/03/23 18:26
名詞が沢山たまってきたのでスキャンして整理しようと思うのですが、
名詞ならこれがお勧めって言う奴有りますか?。
まだスキャナも持っていないので、とりあえずエプソンのスキャナと読んでココ
を購入するか、小さなスキャナも付いている「やさしく名刺ファイリング」を購
入するかの二つを中心に検討しています。
名詞をスキャナで整理している人でこれは止めておけとかこれはいいぞってあっ
たら教えて欲しいです。

55 :名無しさん@そうだ選挙にいこう:02/03/23 18:39
>>54
読んde!!ココについてくる「読んで名刺」結構おすすめかも。
「やさしく〜」は使ったことないから、わからん。


56 :54:02/03/24 23:14
>>55
情報ありがとうです。
う〜ん、でも他にも名刺用のOCRって結構あって
悩みますね〜〜。
Scanbox Pro 名刺管理って奴がネットで落とせて試用期間が
一月あるのでまずはそれを試してみます。
300dpiの古いスキャナは家にあるので……。

57 :名無しさん@そうだ選挙にいこう:02/03/31 22:21
>>54
>小さなスキャナも付いている「やさしく名刺ファイリング」を購
>入するかの二つを中心に検討しています。

名刺データをPalmに入れて持ち歩くために、最近「やさしく名刺ファイリング」
を買って入力中です。入力したデータベースからエキスポートしてPIMソフト「Palmデスク
トップ」用の並びになるcsvファイルに変換して、「Palmデスクトップ」側でインポート
しています。これを同期してPalmで持ち歩くという寸法です。

良い点
安い。店頭での実売が1万円程度。

悪い点
URLなどの決まりきったことの認識率が結構上手くない。httpのあとはコロンと
スラッシュ2本だっちゅーに。coとjpの間にあるのは.だっちゅーの。あと、
カッコだったりハイフンだったりする電話番号の表記を、全部勝手に
03-xxxx-yyyyの一定のフォーマットに置き換えてくれると楽なのに。

似た製品に「名刺PORT」というものがありますが、こちらは店頭価格が
2万円くらいですね。その分認識率が高いのかどうかわかりませんが。
自宅にはスキャナとか持ってないので、「やさしく名刺ファイリング」
には値段から考えて結構満足しています。

でももし「名刺PORTのほうが効率が良くてストレスたまらないよ」などの体験談
があるかたがいらしたら教えてください(まだ入力途上なので、場合によっては
買い換えるかも……)。

58 :名無しさん@そうだ選挙にいこう :02/04/01 06:49
>300dpi
ではきついのでは?

59 :54:02/04/01 23:30
>57
情報ありがとうです。
Scanbox Proでも mail address : hontono@adoado.ne.jpを
addresshontono@adoado.ne.jpって認識してました。
mailの後は問答無用でアドレスに組み込まれるようです。
この辺りを賢く対応して貰えると楽になりそうなんですが。
それとも600dpiくらいあれば認識できたのかなぁ。
あ、もちろんこのアドレスは適当です。

Scanbox Pro 名刺管理を試してみました。
結論から言うと58さんの言うとおりに300じゃ辛かったです。
電話番号や住所などに含まれる数字の認識は良かったのですが、
文字の認識が悪く、うまくいきませんでした。
 どのぐらいだと大丈夫でしょうか?。もし1200で誤認識が無く
なり、訂正や確認をせずに取り込めるのなら、すっごく助かるの
ですが……。やっぱり確認くらいは必要ですかね(^^ゞ。

60 :名無しさん@そうだ選挙にいこう:02/04/18 13:34
Eタイピスト最高!認識率最高!

61 :名無しさん@そうだ選挙にいこう:02/04/18 13:35
Eタイピストが「知子の情報」と連携できたらいいんだけどな。
できないでしょう?

62 :名無しさん@そうだ選挙にいこう:02/04/19 11:23
>>60
それは、2-3年前の話ですよ。
最近の各種雑誌の比較実験見ると、
読取革命・読んでココ・OKReaderの方が認識率がいい結果だぞ。


63 :名無しさん@そうだ選挙にいこう:02/04/19 14:13
東芝のExpressReaderProいいですよ。
縦書き、横書き、表混在、横倍角、縦倍角、なんでもござれ。
RTF形式での出力が出来るので、罫線のある文書を一太郎やWordへ
取り込む際に重宝します。


64 :名無しさん@そうだ選挙にいこう:02/05/17 06:18
>63 ちょいと高くないかい。体験版で試したけどほとんどETypistと
かわらなかったよ。

65 :名無しさん@そうだ選挙にいこう:02/05/17 15:02
名刺の管理できるソフトを探しています。
要件としては、
1、スキャナで読み込みOCRでDB化。
2、登録した情報をブラウザやグループウェア等を使用して社内で共有。
こんなソフトはありますか?

66 :名無しさん@そうだ選挙にいこう:02/05/23 00:02
>>65
ここみれ

名刺OCR
http://www.fmw.fujitsu.com/products/package/meishi/

表計算OCRとWordOCRしか使ったことないので、詳細は存ぜぬ。

67 :65:02/05/23 20:33
>>66
ありがとうございます。
確かに、「情報の共有が可能!」と書いてありますね。

その後調べてみたんですけど、
e.Contact v.4.0
ttp://www.mediadrive.co.jp/products/package/win/econ/econ40/index.html

このソフトは専用のビューアで共有できるみたいですね。
名刺OCR はどうやって共有するのかご存知の方いますか?
それと、それぞれソフトを使われてる方がいましたら、
使用感を教えてください。

68 :他にも:02/05/23 23:01
名刺管理ソフトだと リコーからでてる「名刺フォルダー」っていうのがあるはずです。会社で使ってます。
認識率とかは 他の会社のと比べたことがないのですが 住所録を入力するよりは楽です
しかも 20枚くらいまとめて専用機にセットできるんです
値段は分からないけど(^^;

69 :名無しさん@そうだ選挙にいこう:02/05/31 09:43
http://www.mediadrive.co.jp/topics/20020527_et80w.html

70 :名無しさん@そうだ選挙にいこう:02/05/31 13:22
法律関係は読んでココ

71 :名無しさん@そうだ選挙にいこう:02/06/01 01:53
OmOCRってだれか使ってるかたいますか、Etypist7.0を使っているけど
切り分けがいまいちでその辺がOmCRだと学習できるみたいなのと自然言語
処理機能があるみたいなので興味があるのですが、体験版がないため導入に
ふみきれない。どなたか感想をおしえていただけるとありがたいのですが、、

Etpisってそんなに悪くないけど連続画像取り込み100Pまでの制限がちょっと
うざい。

72 : :02/06/06 04:58
http://biztech.nikkeibp.co.jp/wcs/show/leaf?CID=onair/biztech/pc/189170

73 :名無しさん@そうだ選挙にいこう:02/06/08 14:13
読んでココで英文取り込ませたら、単語のスペース無視で全部繋がっちゃう
なぜ…? 他はそれなりに認識してるけど、これじゃ使えないよ〜

74 :名無しさん@そうだ選挙にいこう:02/06/08 15:24
>>73
英文モード又は、和英混在モードに、設定を変更で。



75 :名無しさん@そうだ選挙にいこう:02/06/08 15:34
は〜るがキタ━━━━━━(゚∀゚)━━━━━━!!
は〜るがキタ━━━━━━(゚∀゚)━━━━━━!!
どこに〜キタ━━━━━━(゚∀゚)━━━━━━!!
や〜まにキタ━━━━━━(゚∀゚)━━━━━━!!
さ〜とに キタ━━━━━━(゚∀゚)━━━━━━!!
の〜に〜も〜キタ━━━━━━(゚∀゚)━━━━━━!!

76 :名無しさん@そうだ選挙にいこう:02/06/11 19:31
>>74
その英文モードへの設定変更はどこでできるの?
なんか見つからないボ。


77 :名無しさん@そうだ選挙にいこう:02/06/12 11:42
>>76
枠の設定にある。

78 :名無しさん@そうだ選挙にいこう:02/06/16 23:28
あげ

79 :名無しさん@そうだ選挙にいこう:02/07/06 07:55
OCR地獄1

OCR地獄にはまっている者です。

省力化の方策を教えてください。
書籍,計10,000頁を,対象とします。
スキャンは,A5,600dpi,で完了しました。
OCRを,6,000頁まで終了しましたが,まだ,4,000頁も残ってます。しんどいです。
もう少し省力化できないものでしょうか。
経験者の方,アドバイスを下さい。

80 :名無しさん@そうだ選挙にいこう:02/07/06 09:21
>>79
会社の業務なら、業務用スキャナを


81 :名無しさん@そうだ選挙にいこう:02/07/06 13:20
OCR地獄2

(現在,一度に100頁しか扱えないこともあり),さらに,他のOCRソフトを導入し,併用を検討しています。

読んde!!ココ7が,メインです。最新パッチを当て,ツールバーをカスタマイズして,使っています。
読取革命2002は,購入し,まだインストールしていません。
読んde!!ココ8は,購入し,10月頃にインストール予定です。
(v6とv7で,パッチ無し地獄と、旧バージョン排他仕様地獄を,味わいましたので)。
e.Typist7は,購入し,ほとんど使っていません。
e.Typist8は,購入検討中です。

82 :名無しさん@そうだ選挙にいこう:02/07/06 13:21
OCR地獄3

二段割注(地獄)に,はまっています。
二段割注とは,縦書文書で,1行の中で(  )内だけ2行になっている,書式です。
読んde!!ココ7は,正確に変換できません。
そこだけ別に枠設定するのは、嫌になってやめました。
誤変換された二段割注部分を,全てキーボード入力しています。
なんとかならないものでしょうか。

83 :名無しさん@そうだ選挙にいこう:02/07/06 13:24
>>79
スキャンは終わったんですよ。
現在の問題は,OCRソフトなんです。


84 :名無しさん@そうだ選挙にいこう:02/07/06 13:29
>>79
スキャンも大変だったんですけどね。
一応,終わりました。

85 :名無しさん@そうだ選挙にいこう:02/07/06 13:43
読取革命の発売開始っていつ頃なんですかね?
読取革命2002    ??年??月
読取革命2001    ??年??月
教えて下さい。
ちなみに,
読んde!!ココ7  2000年02月
読んde!!ココ8  2001年02月
e.Typist7    2000年07月
e.Typist8    2001年07月
,と記憶しております。


86 :名無しさん@そうだ選挙にいこう:02/07/06 13:45
訂正。年が間違っていました。

読取革命の発売開始っていつ頃なんですかね?
読取革命2002    ??年??月
読取革命2001    ??年??月
教えて下さい。
ちなみに,
読んde!!ココ7  2001年02月
読んde!!ココ8  2002年02月
e.Typist7    2001年07月
e.Typist8    2002年07月
,と記憶しております。


87 :名無しさん@そうだ選挙にいこう:02/07/06 21:13
>>82
上田民訴、大谷…


88 :名無しさん@そうだ選挙にいこう:02/07/07 01:42
>>各ソフトの評価をお願いします。

89 :名無しさん@そうだ選挙にいこう:02/07/07 03:34
読んde!!ココ8と読取革命2002を使っています。
以前は読んde!!ココ8を主に使っていましたが、最近は読み取り革命が
メインです。理由は動作は重いが、認識率が良い ということにつきます。
原稿の程度によりますが、認識率は読んでよりも良いと思います。
ただし、レイアウト認識がおバカですので、手動で指定してやらないといけないのが、難点です。
いずれのソフトも、レイアウト範囲の属性(文字なのか表なのか英文和文縦横)をきっちり指定してやることが、
正確な認識への近道かと。。
大量処理・自動処理は読んで の方が良いかも知れません。
スキャンは終わっているとのことですが、よっぽど細かい文字でない限り、400dpiで十分ですし、認識率が600dpiよりも良い場合すらあります。
e.Typistは使ったことがありません。
100ページ以上のOCRはしたことがありませんので、えらそうなことは言えませんが、
がんばって下さい。

90 :名無しさん@そうだ選挙にいこう:02/07/07 09:03
>>88
読取革命2002の評判がいいみたいですね。
私も、OCRの最重要ポイントは認識率だと思っております。
自動化は、使える所もあるが、使えない所の方が多いと思っております。
7月下旬に時間をとれるので、導入します。

読んde!!ココ7は、
マニュアルがごちゃごちゃしています。
画面のレイアウトがケバいです。カスタマイズするまで嫌でした。
パッチが公開されるまで、基本機能に不具合が散見され、使い物にならなかったりします。
(最終)パッチを当てると、使い物になります。
読んde!!ココ7一本でここまで(6000頁)きました。これました。しかし、疲れました。


91 :名無しさん@そうだ選挙にいこう:02/07/10 12:01
OCR地獄4

OCR地獄の入り口,OCRソフト購入について。

各OCRソフトに,いくつかの種類があり,正規版とアップグレード版とで,価格が(大きく)異なります。
アップグレード版使用可能対象者は,旧バージョンやスキャナバンドル版の所有者だったりします。
ソフトによって,乗り換え版が用意されています。
乗り換え版使用可能対象者は,他社(有名)OCRソフト(含 スキャナバンドル版)の所有者だったりします。
安価に購入したい場合,アップグレード権・乗り換え権を得る方法があります。
アップグレード権・乗り換え権は,スキャナバンドル版付きのスキャナを購入するで得るケースが,多いと思われます。
問題は,スキャナ1台を購入しただけでは,すべてのOCRソフトのアップグレード権を得られない,ことです。

使いたいソフトのアップグレード権・乗り換え権を得られるスキャナを買う,方法があります。
しかし,スキャナには,読み取り方式の違い,機能の違い,付属品・オプション品の違い,等,があります。
安易な選択は,後悔をもたらすでしょう。
「CCD式で,高速で,ADFを使える,このスキャナでは,あのソフトのアップグレード権がえられない・・・」。
ジレンマです。



92 :名無しさん@そうだ選挙にいこう:02/07/10 23:11
CCD式で,高速で,ADFを使える>>現時点ではGT-8700しかないなぁ
ADFは、ヨドバシが一番安かった。
読み取り革命2002は乗り換えアップグレード版があり安価で手に入った。

93 :よろしくお願いします:02/07/13 17:12
教えてください!
OCRソフトが存在しない言語について調べているのですが、
各言語ごとにOCRソフトの有無を確認できるようなサイトをご存知の方
いらっしゃったら教えていただけないでしょうか?
海外のサイトでもかまいません。
(英語分かりませんが辞書で調べますので・・・)
よろしくお願いします。

94 :名無しさん@そうだ選挙にいこう :02/07/13 17:55
>>93
そういうことを調べて

95 :名無しさん@そうだ選挙にいこう:02/07/13 21:18
>>89 >>90
読取革命2002は認識結果画面が見にくいのが難点
読んde!!ココは、認識結果を英数字カナを色分けしてくれる


96 :名無しさん@そうだ選挙にいこう:02/07/14 02:45
そろそろe.Tyist8買ってくるかな・・・

97 :名無しさん@そうだ選挙にいこう:02/07/14 10:10
体験版はまだ e.Typist v.7.0だね
自信があったらすぐ新しい体験版出すと思うんだけど・・・

98 :名無しさん@そうだ選挙にいこう:02/07/14 11:09
>>97
は????


99 :名無しさん@そうだ選挙にいこう:02/07/14 11:37
>>98

ま?

100 :記念カキコ:02/07/15 19:30

       @ノノヽヽヽ@ ミ _ ドスッ
       ( ・^▽^)─┴┴─┐
       /   つ.  1 0 0 │
      /_____|└─┬┬─┘
        ∪ ∪    ││ _ε3

101 :名無しさん@そうだ選挙にいこう:02/07/16 18:49
保存できる画像ファイル形式

[読取革命2002]
TIFF G4圧縮
TIFF 非圧縮
TIFF JPEG圧縮
BMP
AWD
DCX
PCX
JPEG

[読んde!!ココ7]
BMP
TIFF 非圧縮
TIFF MH圧縮
TIFF G4圧縮
TIFF PackBits圧縮
PCX
JPEG
PNG

[e.Ttpist7(オープンできる画像ファイル形式)]
BMP
TIFF 無圧縮
TIFF Packbits圧縮
TIFF G3圧縮
TIFF G4圧縮
TIFF FX
JPEG
PNG

102 :名無しさん@そうだ選挙にいこう:02/07/16 18:53
EPSONスキャナ新製品 GT-8300は、
モノクロ2値OCRに向いてますか?


103 :名無しさん@そうだ選挙にいこう:02/07/16 20:30
>>102
向いている。
ただ、モノクロなら、どのスキャナでも高速でスキャンできる。
データが小さいから。

問題は、OCRソフトを何にするか。
文字ならPNG保存できないと困る。


104 :名無しさん@そうだ選挙にいこう:02/07/18 04:15
 請求明細とか支払明細のような表形式を取り込まれている方で、
実用になるOCRソフトを教えて下さい。

105 :名無しさん@そうだ選挙にいこう:02/07/19 00:54
読取物語を使用しています。

良い点
1.領域の作成が早い、認識作業も早い
2.認識率が高い
3.一度に200ファイルまで自動認識できる
悪い点
1.高い(私が買ったのは乗り換え版でしたがそれでも高かった…)
2.高いゆえにユーザーが少なく、集まる情報も少ない

私の場合は数万枚のファイルをOCRにかける必要があったため、
何よりスピードが最優先でした。個人的に値段の分の価値はあると
思います。

>>104
読取物語は表の認識も結構良いです。但し活字限定ですが。
手書きの文字がある場合は全然だめでした。

106 :名無しさん@そうだ選挙にいこう:02/07/20 06:07
読取物語の試用版を使ったことあるが速攻で捨てた。
他のメーカと比べると完全に時代遅れ
長所は値段が高いことぐらいだろう


107 :名無しさん@そうだ選挙にいこう:02/07/21 20:01
>>89 >>95

ようやく時間をとれました。今、インストール完了しました。
読んde!!ココ7、読取革命2002、e.Typist8、で、やっていく予定です。

読んde!!ココ7の良さを再認識しました。
設定項目の多い(多様な要求に対処できる)。
ツールボックスを自分に必要な作業で固めた時、作業効率が良い。
多量の文書を、手動処理する場合に、向いている、と思いました。
OCR(地獄)マニアの私には向いているのかもしれません。
機能はこのままで、
マニュアルをもっと論理的に書いてくれれば、初心者の方が取り組みやすくなると思います。

読取革命2002、e.Typist8、も、好印象です。(あくまで30分使っただけの段階ですが)。

読取革命は、認識結果のクセが少なく、使いやすそうです。
手動で訂正する必要があまり無いのかもしれません。

e.Typist8は、認識精度が、向上したようです。
他と比べて見劣りしないと思います。
いいソフトだと思います。


108 :名無しさん@そうだ選挙にいこう:02/07/21 22:36
書籍をスキャンする際,ADFを使用するためには,
製本されている書籍を,バラす必要があると思うんですが,
具体的にどうやってやるんでしょうか。
経験者の方,アドバイスお願い致します。
コツや,ポイントは,どのへんでしょうか。

手でバラすと,切れ目がギザギザになります。裁断機で整えるんでしょうか。
バラすサービスなどが,あるんでしょうか。
失敗した場合の,修復方法はどうでしょうか。もう1冊購入するんでしょうか。
切り屑が,スキャンに悪影響を及ぼすことがあるでしょうか。


109 :名無しさん@そうだ選挙にいこう:02/07/22 02:25
>108
私は裁断機で綴じてる部分を切ります。
裁断機は、近所の文房具やが持っているものを、ご厚意で使わせていただいております。

裁断機を使うと、
・一瞬でできる
・紙の大きさが揃う
のがメリットではないかと。

絶版ではない本ならば、2冊購入して1冊裁断が一番効率的ですね。

110 :名無しさん@そうだ選挙にいこう:02/07/22 08:42
>>107
読んでココバージョン8は、更にいいよ。


111 :名無しさん@そうだ選挙にいこう:02/07/22 10:10
↓裁断機:カール ディスクカッター
http://www.carl.co.jp/japanese/

112 :名無しさん@そうだ選挙にいこう:02/07/22 23:25
全く同じ形式の帳票ばかりを大量に読み取る
のが得意なOCRはどれですか?

以前使っていた業務用の帳票OCR(日立超LSI)では
一度エディットした構造情報をもとに100枚まで
全自動・連続読み取りできました。
こんな使い方の出来るOCRが望ましいです。
連続枚数の多少はあまり気にしていません。

e.typistを使ってみましたが、
どうもていねいに1枚1枚構造を認識してるようで
セル構造が崩れてしまって良くありませんでした。

113 :名無しさん@そうだ選挙にいこう:02/07/23 21:43
>109
裁断機は、1回で何枚程度まで裁断できますか。
900頁(450枚)の本を1回で裁断、などと妄想しますが、無茶でしょうか。


114 :名無しさん@そうだ選挙にいこう:02/07/23 22:01
>110
読んde!!ココ8は、動作が安定してますでしょうか。
(現在までに8.00 8.01 8.02 の3ヴァージョンあるようです)。
10月頃まで待とうかと、考えていました。。

読んde!!ココ7では、
7.00と7.01の時に、悲惨な目に遭わされました。
(7.03は、すごく安定しています)。
旧バージョン排他だったので、戻るに戻れず、困りました。


115 :名無しさん@そうだ選挙にいこう:02/07/23 23:18
本の背にアイロンをあててロウを溶かす

116 :109:02/07/24 00:04
>103
私が使わせていただいているものは、所謂コピー用紙で1000枚位は簡単に裁断できるものです。
450枚くらいは別に妄想でも何でもなく、製本されている以上当然裁断機もあるわけでして。
近所に町の製本屋・印刷屋等がありますと、そちらを訪ねられては?

アイロンで溶かすという技もあるのですが、
1.手間がかかる(裁断機は使える場所さえ見つかれば一瞬です)
2.紙がきれいに揃わない
3.ひもで綴じてある場合は、そもそも使えない
という問題もありますので、一概にはどうかと。

117 :名無しさん@そうだ選挙にいこう:02/07/24 01:09
>>112
e.Typist で認識テンプレートを使用してもだめですか?


118 :名無しさん@そうだ選挙にいこう:02/07/24 01:12
表をエクセルに取り込みたいのですが、何のOCRソフトがいいでしょうか?

119 :名無しさん@そうだ選挙にいこう:02/07/24 01:19
>>118
専用ではこんなのがある。
http://software.fujitsu.com/jp/ocr/hocr/index.html

表対応のだったら、いけるとは思うけどね。

120 :名無しさん@そうだ選挙にいこう:02/07/24 02:55
>>118
新手の宣伝方法か?

121 :名無しさん@そうだ選挙にいこう:02/07/24 17:06
>116
製本を行う印刷屋をあたってみます。
以前、コピーサービス、出力サービス、を行う印刷屋で尋ねたところ、
100枚程が限度、と言われたので、諦めておりました。
アドバイスありがとうございました。

122 :名無しさん@そうだ選挙にいこう:02/07/27 00:48
名刺用OCRソフトって実際のところどうなんでしょうか?
名刺なので様々なレイアウトがあるかとおもわれ
それを誤認識なく データ管理につかえるものか?
使っているかたいましたら 教えてください

123 :名無しさん@そうだ選挙にいこう:02/07/30 04:25
[同一ソフト複数起動の可否]
e.Typist8   不可
読取革命2002  不可
読んde!!ココ7 不可

124 :名無しさん@そうだ選挙にいこう:02/07/30 04:36
>>86
自己レスですが。

[発売開始時期]
ここで調べられます。
http://computers.yahoo.co.jp/computers/software/business/ocr/

125 :名無しさん@そうだ選挙にいこう:02/07/30 04:56
>>107
自己レスですが。

文書OCR for Word v3.0
文書OCR for Word v4.0
今度、知人の所で使わせてもらおうと思います。

[現状]
読んde!!ココ7  メイン。操作に慣れ、効率的なので。縦書専用としています。
読取革命2002   試用中。横書専用としています。
e.Typist8    試用中。2段割注の補正専用としています(読んde!!ココ7とセットで使っています)。

126 :名無しさん@お腹いっぱい。:02/07/30 07:10
こちらも、宜しく
http://www.sesys.co.jp/product/ocr/

127 :名無しさん@そうだ選挙にいこう:02/08/10 13:32
>>125
自己レスです。

知人のPCのトラブル解決に追われ,
文書OCR for Word v3.0
文書OCR for Word v4.0
のテストどころではありませんでした。
次の機会に使わせてもらおうと思います。


128 :名無しさん@そうだ選挙にいこう:02/08/10 13:45
>>80 >>89 >>95 >>105 >>106
全10,000頁中、9,000頁まで終了しました。残り1,000頁です。
アドバイスをくださった皆様のおかげです。


129 :名無しさん@そうだ選挙にいこう:02/08/13 14:09
[OCR作業,計1万頁を要求されたら]

仮に,これから全ての準備をするなら,現状では,以下のように考えるかもしれません。

スキャナ(ADF付き)     canon製 DR-2080C
スキャナ(フラットベッド) EPSON製 GT-8300UF
OCRソフト         e.Typist8 アップグレード版
             読んde!!ココ8 アップグレード版
             読取革命2002 乗換版
PC            デスクトップ・タワー型
             CPU 高速
             メモリ 多量
             内蔵HDD 静音・高速・大容量・2台以上
             DVDマルチ 殻付DVD-RAM使用可能・高速(秋頃の新製品に注目か)

一体,何十万かかるのだろう……。

130 :host9.po-konan.co.jp:02/08/13 15:05
nya

131 :名無しさん@そうだ選挙にいこう:02/08/14 07:49
つ〜か
普通の結論だね・・・。

132 :名無しさん@そうだ選挙にいこう:02/08/14 08:17
そうです、そうです。
普通の結論を目指しました。
うまくいかないと困りますから。
(もっとも、検証不十分ですが)。

133 :名無しさん@そうだ選挙にいこう:02/08/14 08:56
[かつて,OCR作業,計1万頁を要求されて]

かつて,以下の環境で作業していました。

スキャナ(ADF付き)     無し
スキャナ(フラットベッド) EPSON製 GT-8700(ADF無し)
OCRソフト         読んde!!ココ7 アップグレード版 のみ
PC            ノートブック・薄型
             CPU 低速(Pentium2-333MHz)
             メモリ 少量(192MB)
             内蔵HDD 静音不考慮・低速・小容量(6.4GB)・1台
             MO

自分は何か大きな間違いをしているのではないか……。


134 :名無しさん@そうだ選挙にいこう:02/08/14 10:58
毎日100頁、計1万頁、のように、枚数が多い場合、気になりますが、
数枚をたまに、のように、枚数が少ない場合は、気になりません。
枚数が多いが、時間をかけたくない場合、
適切な投資をして、時間短縮する、ということでしょう。
適切な投資の、試案の1つです。あくまで、試案です。

135 :名無しさん@そうだ選挙にいこう:02/08/14 11:21
電子出版されていない書籍等を,
わざわざ,OCRという愚直な方法を用いてまで,電子化するのは,
それなりのメリットを認識し,それなりの目的を持っている,場合が,少なくないと思います。
そういう方には,無難な情報は,有り難いのでは,と思っております。
(かつて,よくわからないまま,「地獄」を味わった者としては)。

136 :名無しさん@そうだ選挙にいこう:02/08/14 12:22
まあ、普通に、マタリといきましょうや。

137 :名無しさん@そうだ選挙にいこう:02/08/15 04:10
OCRに関連する作業の(特に前期の)多くは,静止画像処理です。
静止画像処理について(今でも)専門知識を持たない私です。
OCRするにあたってよくわからなかったことを書き残して引退したいと思います。
間違いは,修正してやってください。


138 :名無しさん@そうだ選挙にいこう:02/08/15 04:12
[スキャンした画像の保存]

画像ファイルは,(ファイル形式と圧縮形式の組み合わせで),多数のものが存在するようです。
OCRで重要なのは,ファイル形式では,何色扱うか(色数),であり,圧縮形式では,可逆圧縮・不可逆圧縮,圧縮率,です。
色数は,白黒2色(白黒2値・モノクロ2値)が,現状では向いています。グレースケール,カラー,はOCR認識率を下げる要因となりそうです。
画像ファイルの中で,モノクロモードをもたない(全てカラーとして扱う)ものがあります。データ量がかなり大きくなると思われます。(例えば,JPEG)。
圧縮形式は,可逆変換,無圧縮,が向いています。不可逆変換は避けるのが無難でしょう。(例えば,JPEG)。
結局,JPEGは,採用しにくいと思います。
OCRソフトは複数存在します。各OCRソフトにより,扱える画像ファイルが異なります。扱い方には,読み,書き,が有ります。

     読んde!!ココ8  読取革命2002  e.Typist8
TIFF G4    ○       ○       △(読みだけ)
JPEG      ○       ○       ○
PDF      ○       ○       ○

TIFFは,複数画像を1つのファイルにすることができるが,逆にそれがOCR上でやや扱いにくさにつながる。
JPEGは,不可逆圧縮である。モノクロモードをもたない。
PDFは,よくわかりません。画像専用ファイルというより,画像・文書等複合ファイルのような気がします。

JPEG専用スキャナは,購入をためらわせます。



139 :名無しさん@そうだ選挙にいこう:02/08/15 04:12
[dpi]
dpiの選択は,原稿の文字の大きさ(ポイント数)に依存します。注や,文庫本,など,の小さい文字については,dpiを精細に(例えば600dpi)にします。



140 :名無しさん@そうだ選挙にいこう:02/08/15 04:14
[原稿の読点]
日本語なのに,読点が「。」ではなく「.」である書籍があります。
読んde!!ココ7は,文末判定に.を採用しない場合がすごく多いとおもいます。
読点「.」の原稿で1認識枠内に複数の段落がある場合,文末判定の失敗の故,1つの段落と誤変換されます。
(600頁の書籍のほとんどの段落を手動入力するのは苦痛でした)。
読取革命2002は,改行の設定を自動判定にすることで,何ら問題は起きません。

読点が「.」の書籍は,読取革命2002を使いましょう。読んde!!ココ7は,段落の修正に骨が折れます。



141 :名無しさん@そうだ選挙にいこう:02/08/15 04:14
[ADF]
私は,所有していません。
コピー専用機のADFを複数使ってきましたが(全て富士ゼロックス製),かなりまじめに作らないと,役にたたなそうです。
原稿給紙機構が単純な方がいいようです。180度回転,よりも,0度回転,がいいのかもしれません。
多量のADFスキャンをする方は,基本的に,ある程度金をかけた方がいいのではないでしょうか。
EPSON製GT-8700の別売りADFを,以上の理由で敬遠した私です。



142 :名無しさん@そうだ選挙にいこう:02/08/15 04:51
>>140

自己レス。
重大な誤植を発見しました。読点ではなく句点。

↓↓ 修正版はこちら ↓↓


143 :名無しさん@そうだ選挙にいこう:02/08/15 04:53
[原稿の句点]※修正版※

日本語なのに,句点が「。」ではなく「.」である書籍があります。
読んde!!ココ7は,文末判定に「.」を採用しない場合がすごく多いとおもいます。
句点「.」の原稿で1認識枠内に複数の段落がある場合,文末判定の失敗の故,1つの段落と誤変換されます。
(600頁の書籍のほとんどの段落を手動入力するのは苦痛でした)。
読取革命2002は,改行の設定を自動判定にすることで,何ら問題は起きません。

句点が「.」の書籍は,読取革命2002を使いましょう。読んde!!ココ7は,段落の修正に骨が折れます。



144 :名無しさん@そうだ選挙にいこう:02/08/15 05:07
>>136
OCR使いにも,
文書の内容をコンピュータが保持することを希望する人もいれば(代替手段),
文書の内容を自分の頭が保持することを希望する人もいます(補助手段)。
前者は,誤変換へのこだわりが小さいですが,
後者は,誤変換へのこだわりが大きいです。
前者は,作業のあらゆる局面で,寛容ですが,
後者は,作業のあらゆる局面で,シビアです。
前者は,閲覧ソフト,検索ソフト,等に関心を向けますが,
後者は,変更方法(ワープロ),修正方法(学習機能,置換機能,ワープロ)等へ関心を向けます。
かみ合わないなと思ったら,目的が違わないか確認するのが大事っスね。

145 :名無しさん@そうだ選挙にいこう:02/08/15 18:55
>>131
まあ,楽しくOCRするのが一番ですから,
私みたいなのは,ほっときましょう。


146 :名無しさん@そうだ選挙にいこう:02/08/15 18:57
>>144
書き忘れましたが、自己レスでした。

147 :荒野草途伸:02/08/21 22:36
OCRがらみの開発をすることになったのですが、ライセンスがいろいろ面倒です。開発用とは別にライセンスが必要だと、顧客いっこ決まるたびに、ライセンス取得しなきゃいけないとか。
そこで、再配布自由なOCRソフト又はコンポーネントを探しています。フリーでなくてもかまいません。
とりあえず、エーアイはそういうのやってる事が解りました。他にもないものでしょうか?
以上、ご存じの方がいるならよろしくお願いします。

148 :名無しさん@そうだ選挙にいこう:02/08/22 08:35
>>142-143
日本語なのに,句点が「。」ではなく「.」である書籍といえば、
前田本や内田本がそうだな。


149 :名無しさん@そうだ選挙にいこう:02/08/23 00:44
要するに東京大学出版会ってこった

150 :名無しさん@そうだ選挙にいこう:02/08/24 23:40

紙情報のデジタル化◆ドキュメントスキャナ
http://pc3.2ch.net/test/read.cgi?bbs=hard&key=1030199319


151 :名無しさん@そうだ選挙にいこう:02/08/28 14:54
【読んde!!ココ7に注文】

ツールバーに「画像を保存」ボタンを作ってください。
デフォルトで表示されなくてもいいですから,「ツールバーの設定」の設定により表示できるようにしてください。
私の場合,頻繁に使うボタンです。メニュー経由は手間がかかります。


152 :名無しさん@そうだ選挙にいこう:02/08/28 14:55
【読んde!!ココ7に注文】

unicode対応をお願いします。
特に,漢字以外です。欧文文字とか,ナンバリング用の記号とか。
書籍中に頻出なのに,未対応なのは,使いにくいです。
キーボード入力しても表示できなくて,困りました。


153 :祇園精舎の鐘の声:02/09/10 09:00
輸入機械の英文マニュアルを翻訳してます。
今の所手分けして人海戦術で原文をテキスト入力して、それを見ながら私が翻訳した和文を
併記する形で入力してます。が、生産作業ではない周辺作業と言う事で、主担当と並行して
やらされているので、いかな外注にかなり頼んでいるとは言え予算的、納期的、体力的に限界を
迎えつつあります

 そこで英文マニュアルに絞ってOCRを探しています。
  @10〜12ポイントのプレインテキスト(ボールド、イタリック、アンダーラインは無し)を
   400字−600字詰め原稿一頁辺り4、5箇所以内の手修正でテキスト取り込みが可能なOCR能力を有する事。
  Aイラストや画像(白黒)を原稿のレイアウト通りに取り込める事。
  B連続取り込み機能で原稿をOCR取り込みしたら、テンポラリファイルネームが付けられて、指定のディレクトリに
   自動的に格納される事。

 Omnipage<良さげだが10万円以上でチョット。Textbridg<レイアウト崩れないか不安。
 OKREADER<価格的に良いけど、レイアウト機能が不安。その他eTypist,読んでココはレイアウト 
 取り込みにも識字率にもやや不安が有って二の足踏んでます。
 英文取り込み経験豊富な方、ぜひご意見を!

154 :名無しさん@そうだ選挙にいこう:02/09/10 17:29
句読点に「,」「.」を使ったりするのって、
理系論文の伝統かなんかなの?
すごい違和感あるんだけど。
で、結局どれがイイの?
スキャナにバンドルされてるようなヤツは
パッケージ版に比べて制限が多いんですかね。


155 :名無しさん@そうだ選挙にいこう:02/09/10 19:56
eTypist8でPDFファイルのOCRをやると、ファイルの読込みでやたら時間を食うのでかなわん。
複数ページのうちの1ページだけをOCRかけたいのに、全部のページを読み込まなくてはならない。
10ページくらい入っているPDFだとOCR始めるまでに3分近く待たされる。正直うんざり。

読んdeココでの場合はどうなんでしょうか。体験談きぼんぬ。

156 :名無しさん@そうだ選挙にいこう:02/09/10 23:44
>>154
>スキャナにバンドルされてるようなヤツは
>パッケージ版に比べて制限が多いんですかね。

これは、まぁ常識やね。

「,」「.」は理系の本では多いけど、正直違和感があるな。

157 :155:02/09/16 15:43
誰もやったこと無いようなので結局自分で試した。読んdeココ8の体験版だけど。
Adobe Acrobat 5.0のアドインから、20ページ入ったPDF(1.4MB)をOCRにかけてみた。
結果、読んdeココの圧勝。たったの2分50秒弱で文字認識完了。
eTypist8は画像登録だけで6分費やし、文字認識完了までで計10分50秒弱。もうね、アフォかと。

ただし読んdeココは、Adobe Acrobat 5.0(約3万)が無いと、PDFのOCRはできない。
eTypistはAcrobat Reader(無料)だけあれば良いので、圧倒的に安くて済む。
もっとも、多数処理する必要がある場合は、この差額を払っても安く感じるであろう。
とはいえ、ADFスキャナに幅広く対応しているのはeTypistなので、まさしく一長一短ですな。

158 :名無しさん@そうだ選挙にいこう:02/09/16 18:09
読んでココって、PDFを使った文書管理ができるみたいですが、
あの高いソフトを買わなくても、PDF変換できるのですか?
http://ai2you.com/ocr/product/koko8fos.asp

159 :155:02/09/16 19:21
読んdeココでは認識結果をPDF形式で保存できるのみで、PDF読み込みはできません。
単体では加除修正できないので、いわゆる文書管理は困難であるといえます。

ちなみにeTypistなら、Acrobat Readerもインストールしてあれば単体でPDF読み込みも
可能なので、加除修正もやれなくはありませんが、読み込みに時間食ってお話になりません。


160 :bloom:02/09/16 19:30

http://www.leverage.jp/bloom/start/

161 :二つ目のお気に入りとして:02/09/16 23:15

今までに無かった総合リンク集です。ナビゲーション
リンク機能を使って右フレームに役立つページ、便利
なページをさくさく表示。

http://home9.highway.ne.jp/cym10262/


162 :名無しさん@そうだ選挙にいこう:02/09/30 18:37
間違いだらけですいません。
まだ間違っていると思いますが,以下でいかがでしょうか。

163 :名無しさん@そうだ選挙にいこう:02/09/30 18:39

          対BMP(%) ファイルサイズ(KB) 文書OCR for Word4  e.Typist8  読取革命2002  読んde!!ココ8

BMP 100.0%, 1834KB ○ ○ ○ ○
TIFF 非圧縮 99.2%, 1820KB ○ ○ ○ ○
TIFF G4圧縮     4.6%, 85KB ? ○ ○ ○
PDF 5.1%, 94KB ? ○ ? ?
JPEG 78.0%, 1430KB ○ ○ ○ ○
PCX 27.3%, 501KB ○ × ○ ○
PNG 10.3%, 189KB ○ ○ × ○
TIFF MH圧縮 9.9%, 182KB ? × × ○
TIFF Huffman圧縮 9.9%, 182KB ? ○ × ×
TIFF G3圧縮 10.3%, 188KB ? ○ × ×
TIFF PackBits圧縮 24.2%, 444KB ? × × ○
TIFF JPEG圧縮 664.2%, 1430KB ? × ○ ×
AWD 16.6%, 304KB × × ○ ×
DCX 27.5%, 505KB × × ○ ×


164 :名無しさん@そうだ選挙にいこう:02/09/30 18:41
うまくアップできなかった……。
ワープロ等で直してみて下さい。

165 :名無しさん@そうだ選挙にいこう:02/09/30 18:43

A5,600dpi,白黒2値・モノクロ2階調・1ビット画像(16.7%)。
原稿 : 2002年7月19日初版第1刷,p.062。
読んde!!ココ7 で保存:BMP,JPEG,PCX,PNG,TIFF G4圧縮,TIFF MH圧縮,TIFF PackBits圧縮,TIFF 非圧縮。
e.Typist8 で保存:PDF,TIFF G3圧縮,TIFF Huffman圧縮。
読取革命2002 で保存:AWD,DCX,TIFF JPEG圧縮。



166 :名無しさん@そうだ選挙にいこう:02/09/30 18:48
>>153
非ADFスキャナ・日本語OCR 10,000頁終了野郎より。

異なる境遇につき,アドバイスできませんが,いくつか。

「ハードウェア」板 「スキャナで連続スキャン」スレッド は,若干参考になるかもしれません。
もっとも,振り回されない方がいいでしょう。
最後は,自分しかありません。
有益な情報は英語圏で探した方が早いかもしれません。

誤変換にシビアと思われます(私もそうでした)。場合によっては,翻訳時に再修正と,割り切る事もあり得ます。
検索目的OCR派の方の意見は,余り参考にならないかもしれません。


167 :名無しさん@そうだ選挙にいこう:02/09/30 18:49
>>153
非ADFスキャナ・日本語OCR 10,000頁終了野郎より。

自分で一つ一つ検証し,確実な計画を練り,持続的に達成可能な日々のノルマを割り出す。
あとは,脇目を振らず,ひたすらコツコツ進む。何があっても,日々のノルマはこなす。

諦める人が多い。そもそも,挑戦しようと思わない。
しかし,必ずゴールはやってきます。自分を信じて,進んで下さい。
終わった暁には,後進のために,書き込んでやって下さい。

ご検討をお祈り申し上げます。


168 :名無しさん@そうだ選挙にいこう:02/09/30 19:01
上級者は,富士通製 文書OCR for Word4 も考慮した方がいいみたいです。
操作性はまだまだだが,認識精度はものすごく高いようだ。
スキャン,画像修正,等,はとソフトで行い,エンジンだけ利用する,
という手法がそろそろ出てきてもいいと思います。

169 :名無しさん@そうだ選挙にいこう:02/09/30 19:07
誤植修正版

上級者は,富士通製 文書OCR for Word4 も考慮した方がいいみたいです。
操作性はまだまだだが,認識精度はものすごく高いようだ。
スキャン,画像修正,等,は他ソフトで行い,エンジンだけ利用する,
という手法がそろそろ出てきてもいいと思います。


170 :名無しさん@そうだ選挙にいこう:02/09/30 22:48
読んdeココ8の透明文字つきPDFの画像部は、取り込み画像のままで、解像度は
変更できないのだそうだ(仕様)。
おしいなあ、e.Typist8のように変更できれば、ファイルサイズを小さくできるのに。

171 :名無しさん@そうだ選挙にいこう:02/10/01 06:40
OCR処理をするかどうかの判断は,
書籍・原稿の内容によるべきである。
書籍・原稿の書式によるべきでない。
(OCR処理可能な書式である限り),
内容で判断すべきである。
内容を伴わない書籍・原稿をOCR処理することは,
労力・時間の無駄である。

OCR処理に先立ち,
書籍・原稿の内容の評価を終了していなければならない(と思います)。

172 :名無しさん@そうだ選挙にいこう:02/10/01 11:54
>>170
環境設定→出力→画像領域の設定→画像の出力解像度
これが効かないってこと?

読んdeココ8のヘルプでは
>画像の出力解像度(R)
>認識結果を保存する場合、Word形式/HTML形式/一太郎形式/PDF形式のいずれかが
>指定されたときに、イメージ領域を指定された解像度に変更して保存します。
>解像度は、72dpi/96dpi/150dpi/200dpi/元画像の解像度から選択します。
>出力解像度を下げると、結果のファイルサイズを小さくすることができます。
となってるけど…

173 :名無しさん@そうだ選挙にいこう:02/10/01 13:20
>>172
そうだよ。部分画像の使われる「標準」でのみ有効。
元原稿のオリジナル性を保持するための処置だそうだ。

174 :名無しさん@そうだ選挙にいこう:02/10/01 22:27
>>173
「標準」てのは「透明テキスト」でない方のモードだね。
こっちは全然使わないから意味無いなぁ…。

かといってeTypistにPDF食わせると死ぬほど重いし(w

175 :名無しさん@そうだ選挙にいこう:02/10/07 00:24
200dpiに対応できるOCRを出してほしい。

176 :名無しさん@そうだ選挙にいこう:02/10/07 04:35
>>175
Docuworks

177 :名無しさん@そうだ選挙にいこう:02/10/07 19:33
>>131
悪かったね。ごめんごめん。
元気出してくださいな。


178 :名無しさん@そうだ選挙にいこう:02/10/07 20:38
最近CANONのスキャナを買って、付属の e.Typistエントリーを使ってます。
バンドルソフトとはいえ、認識率には不満はありません。
しかし、小さめの文字の原稿だとある文字とその隣の文字の偏を一緒に認識してしまって
誤認識するのがちょっと嫌です。 例:「会社」を「斜土」とか

間違って二文字ち認識したのを一文字として認識させることはできますが、
一文字と認識したのを切り分けることができません。
e.Typist v.8.0ならこういう切り分けができるのでしょうか?
また、他のソフトで認識単位を切り分けることができるソフトがありましたら
教えてください。

179 :名無しさん@そうだ選挙にいこう:02/10/07 22:06
>>178
読んdeココは、可能。
他のソフトはしらぬ。


180 :155:02/10/07 22:11
eTypist8.0も、切り分けはできないようです。
私も「場合」という語を「船」などと誤認識されまくって
ピキピキしますた。
ちなみに読んdeココではいまのところそういう目には遭っていません。


181 :178:02/10/08 00:47
>179、180
ありがd
読んdeココ Ver.8体験版をインスコしてみましたが、文字の分離機能はいい感じ。
e.Typistエントリーよりレイアウトの認識も賢く、文字認識も上回っている印象です。
早速購入決定です。ほんと情報いただいて助かりました。

182 :名無しさん@そうだ選挙にいこう:02/10/08 02:44
読取革命2002が最強

183 :178:02/10/08 13:10
読取革命2002も試してみました。
こちらでも文字の分離はできますね。

ただ、スキャン機能が私には使いにくいのと
誤認識した場合にその文字が候補にもでないことが
読んでココVer8、eTyupistエントリーより多いように感じました。
(読んでココは候補を30個だせるので一概に比較できませんが)
また読取革命2002は文字認識のスピードも倍以上遅いです。
しかし、レイアウトは読取革命2002が一番原型を保持してWordにもっていけます。

やっぱり用途によってよしあしがあるようです。
テキストにだけしたい人には、読んでココがベストかな。

184 :名無しさん@そうだ選挙にいこう:02/10/09 10:09
>eTyupistエントリー

誤認識ですか?

185 :名無しさん@そうだ選挙にいこう:02/10/10 01:29
OCRで辞書に二文字以上を登録できるソフトを教えてください。
フォントにない○の中にイを(イ)として登録し、変換させたいのです。
eTypistと読んでココではできないようです(どちらも体験版)。
よろしくお願いします。

186 :名無しさん@そうだ選挙にいこう:02/10/10 12:02
>>185
読んdeココ7だが、
置き換え機能を使うことで可能。
これを使って(イ)に変換している。


187 :185:02/10/11 01:56
>186
thnx!!

古い本には結構この手の記号が多いので困ってたんですよ。
ちゃんと製品版を買ってマニュアルを読み込むことにします。

188 :188:02/10/13 14:03
読んdeココ Ver.8体験版やe.Typistの体験版をインストール
すれば、読取革命2002の乗換え版はインストールできますか?

189 :名無しさん@そうだ選挙にいこう:02/10/13 14:36
>>188
実は、他社のOCRソフトをインストールしていなくても、
乗り換え版はインストールできる。
ノートンも同様。

190 :発表:02/10/26 02:48
http://www.panasonic.co.jp/masol/yomikaku/

191 :名無しさん@そうだ選挙にいこう:02/11/08 22:07
>>129   自己フォロー。

以下の雑誌が,OCR用の(フラットベッド)スキャナ選びの参考になるかもしれません。

「PC USER(ソフトバンクパブリッシング刊)」2002年11月24日号No.157の
 特集記事『決定版!スキャナー徹底比較』,

「デジタルフォト専科(ソフトバンクパブリッシング刊)」2002年11月号の
 特集記事『フィルム派に贈るフラットベッドスキャナ』。

前者は,大変参考になると思います。
後者は,デジカメ雑誌らしく,CCDの画素ピッチへの言及があります。
ADFスキャナの補助とする場合,重要な視点です。

単体スキャナの本格的な特集記事が組まれるのは,今期が最後かもしれません。
(来期以降は重点が複合機に移りそうです)。
一読してみるのも良いでしょう。


192 :名無しさん@そうだ選挙にいこう:02/11/09 15:38
読んdeココ8で、ファイルから画像を取り込むと、解像度変更のダイアログが出ます。

エーアイソフトのFAQによれば、消すことは出来ないということなのですが、何か手は
ないものでしょうか?
http://www.aisoft.co.jp/japanese/qasystem/showans.asp?N=1138

使っているスキャナがTWAIN対応ではないため、画像で取り込むしかないのです。

何かよい手段があったら教えてください。



193 :名無しさん@そうだ選挙にいこう:02/11/09 18:36
>>192
解像度変更のダイアログを出すファイルをつきとめて、削除せよ。

194 :名無しさん@そうだ選挙にいこう:02/11/09 20:08
>>193
全ての画像に対してこのダイアログが出ます。ファイルオープンのところで
プレビューを表示させると、水平・垂直解像度とも0dpiになります。

JPEGファイルなのですが、BMPに変換しても同じです。これは普通の現象
なのでしょうか?


195 :名無しさん@そうだ選挙にいこう:02/11/09 23:55
>>194
そのような現象は出る場合と出ない場合がある。
200dpiで取り込んだjpgファイルを取り込んだ場合、解像度変更のダイアログが出た。
300dpiで取り込んだjpgファイルやtiffファイルを取り込んだ場合、出ない。

196 :名無しさん@そうだ選挙にいこう:02/11/10 00:45
どなたかAdobeのPaper Capture Plug-in使ってませんか?
Acrobat 5.0を持ってれば2000円で買える、という点が魅力的なのですが。

ttp://www.adobe.co.jp/products/papercapture/main.html


197 :名無しさん@そうだ選挙にいこう:02/11/10 22:41
>>194
解決したか?

198 :min:02/11/12 22:07
読んでココの文字認識を外部のアプリからコントロールすることは出来ないでしょうか?
accessから読んでココを起動し、自動実行で画像を取り込んだ後、画像の文字部分をテキストに
抽出する処理をできるだけ自動化したいのです。


199 :名無しさん@そうだ選挙にいこう:02/11/22 00:40
OCRソフトの「e.Typist V.8.0」
を購入したのですが、スキャンする漢字の文字が歴史書物で難しい(古い?)ものが多く、
標準のものでは文字認識はもちろん、手動で漢字修正しても漢字が出ません。
なにか漢字認識を増やせるソフトとか?こういった場合どうしたら良いのでしょうか。
どなたかご存知の方いらっしゃいましたら宜しくお願いします。

200 :名無しさん@そうだ選挙にいこう:02/11/22 01:05
>>199
正字正仮名の文献ですか?

正直、認識率は期待しない方が良いですが・・・
お使いのソフトの場合、第2水準漢字の追加設定をしましたか?

201 :199:02/11/22 01:28
>>200
第二水準漢字は完全収録って事だったので購入したのですが、
何か設定とかするんですかね。。
正字正仮名の文献??
えっと、書道の文献で日本語で書かれた中国の歴史モノなので
訳のわからない漢字が頻繁に出てきて困ってます。。

202 :199:02/11/22 01:54
>>200
第二水準の設定しましたけど、それでも駄目でした。。

203 :名無しさん@そうだ選挙にいこう:02/11/22 02:36
中国語対応のバイリンガルOCRじゃないと無理のような・・・
繁体字対応のヤツ。

素朴な疑問なんですが、認識されないのは第1・2水準漢字なのでしょうか?


204 :199:02/11/22 03:01
ん?
第一か、第二水準漢字かは分からないのですが、
たとえば「くさかんむり」の下に「市」
って書く文字だったり
読み⇒(フツ)
「たけかんむり」の下に「移」と書く文字だったり。。
読み⇒(イ)
ご迷惑かけてすみません。わざわざ有難うございます。

205 :名無しさん@そうだ選挙にいこう:02/12/05 02:32
参考になったのでage

206 :名無しさん@そうだ選挙にいこう :02/12/07 09:06
読取革命Ver7いいですね 乗り換え版が8000円程度で買えるし
機能もいい 

207 :佐々木健介:02/12/07 09:29
>>1
     ______
    /_      |
    /. \ ̄ ̄ ̄ ̄|
  /  /  ― ― |
  |  /    -  - |
  ||| (5      > |
 | | |     ┏━┓|   / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
| | | |     ┃─┃|  < こんなサイトを見つけた
|| | | |  \ ┃  ┃/    \  正直、スマンカッタ
| || | |    ̄         \_________
http://freeweb2.kakiko.com/mona/

208 :hide:02/12/11 10:12
下線や括弧が多用されている書類を読みとりたいのですが
現在誤認識が多くて閉口しています。
これは、OCRソフトの限界ですか。それとも認識率を上げる
方法があるのでしょうか。
ちなみに、今回は400dpiで取り込んだtiffファイルを
 読んでココ体験版で認識させました。
もし少しでも認識率が上がれば、そのソフトを購入したいと思っています。
ご存じの方よろしくお願いします。

209 :名無しさん:02/12/17 06:52
>208
読んでココのバンドル版は、認識率がかなり悪い。
エーアイソフトに言わせれば、製品版を買えってことだろう。
しかし、あんなに性能の悪いソフトを掴まされると、製品版の出来が不安になる。
だから、おれはe.Typistを買った。
エプソンは読んでココと手を切ってほしいね。


210 :名無しさん@そうだ選挙にいこう:02/12/18 00:33
>>209
エプソンがエーアイソフトと手を切ることはない。
なぜなら、エーアイソフトってエプソンの子会社だから

211 :名無しさん@そうだ選挙にいこう:02/12/18 04:28
>210
そうなんだ。知らなかった。
プリンタ・スキャナ・OCRは相性や値段で密接に関わり合っているから、OCR目的の人はCANON系を
買ったほうがいいな。個人的には、プリンタ単体ならエプソンが一番良いと思っているだけに
残念。

212 ::02/12/19 00:44
エプソンスキャナ使用中なのですが、他社OCR入れても問題ないスよね?

213 :名無しさん:02/12/19 01:05
>212
ソフト会社が発表している動作確認済み機種で、確認したほうが無難だと思う。


214 :名無しさん@そうだ選挙にいこう:02/12/19 11:38
>>209
バンドル版と体験版を混同しているようだが…
体験版は製品版と基本は同じもので、認識率は飛躍的に良いぞ。

たしかにe.Typistはデフォルトでは認識率が良いけど
読んdeココも認識辞書で誤変換癖を修正していけば同等。
どれでも少なからず誤変換癖はあるから、手間は結局似たり寄ったりだよ。
軽快感や図表の認識の得手不得手など、ホントに一長一短だし。
どっちで決まりとは断言できないんで、俺は両者を場面に応じて使い分けてる。



215 :名無しさん@そうだ選挙にいこう:02/12/19 14:50
何年かぶりにe.Typistをバージョンアップしてv8.0にしました。
前のバージョンでは認識途中でセーブして後でその状態から
再開できなかったのですがそれが可能になっていて良かったです。

日本語認識は以前から悪くなかったのですが、古いプログラム
ソースを読み込ませてみて、変換精度がかなり良くなっていました。

Epson GT-7600U 400dpiで読み込ませています。

216 :209:02/12/20 04:13
>214
いちお、バンドル版と体験版の違いはわかってます。
体験版での比較をせずに、読んでココのバンドル版は質が悪い→e.Typistを買うをやったので、読んでココの製品版はどのような出来なのかは知りません。
軽快感や図表認識は、読んでココのほうが良いのですか?

217 :名無しさん@そうだ選挙にいこう:02/12/20 08:45
認識率
読取革命>読んでココ>>>>>>e.Typist

操作性
読んでココ>読取革命>>>>>>e.Typist

218 :214:02/12/20 15:27
>>216
今まで使ってみた限りでは、軽快感はダントツで読んdeココ、
図表の認識ではe.Typistの方が優秀というような印象です。
やはり体験版を比較して決めるのがいいでしょう。

219 :名無しさん@そうだ選挙にいこう:02/12/21 21:14
読んdeのムカつくところはエラーで強制終了すると(結構よくある)
そのあとツールバーとかの表示が初期状態に戻ること。
新しいスキャナ買ったらe.Typistエントリーが付いてきたので
来年はe.Typist Ver.9にしてみようかと思う。

220 :名無しさん@そうだ選挙にいこう:02/12/24 08:06
hosyu

221 :名無しさん@そうだ選挙にいこう:02/12/28 01:22
キャプチャー画像のテキスト化に強いOCRソフトあります?
WinReader6.0ではOCRできませんでした。
画面では12ポイントぐらいなんですけど。


222 :名無しさん@そうだ選挙にいこう:02/12/28 13:34
>>221
単にキャプチャー画像って言われてもなんだか判らないがな。
キャプチャーした状態で表示して12ポイントだったら普通は無理だと思うぞ。
ドットで16ドットくらいだろ? スキャン原稿換算で3ポイントにも満たないからな。



223 :221:02/12/28 23:06
そうなんです。でも、サイズが小さい代わりに、スキャンに伴う
カスレとかが一切ないのでなんとかならないかなと思いまして。

で、レスをヒントに、画像処理ソフトで2倍に拡大してみたら、
なんと半分以上認識されるようになりました。
この方向で工夫してみます。どうもありがとうございました。


224 :名無しさん@そうだ選挙にいこう:03/01/02 21:02
読んdeココ Ver.8 とエプソンGT8300UFを買いました。
数字ぎっしりの紙の表(主に財務諸表関係)をエクセル
に落としまくろうと思ったもんで。
しかし,と.をうまく判読してくれない。これじゃ全然使えないっす。
なんとかなりませぬか??


225 :224:03/01/02 21:19
そっか、substitute関数で置き換えりゃいいのか!解決っす。

226 :名無しさん@そうだ選挙にいこう:03/01/03 02:19
置き換えなら読んdeココ上でもできまっせ。
認識辞書を鍛えるのも良し。

227 :名無しさん@そうだ選挙にいこう:03/01/07 18:53
e.typist8で、「画像PDF」を「テキスト付きPDF」に変換すると、
変換後のファイルサイズが20倍近くになって困ってます。
相談窓口に相談しても解決せず。

170のいう「変更」ってどうやるんだ?
>読んdeココ8の透明文字つきPDFの画像部は、
>取り込み画像のままで、解像度は変更できないのだそうだ(仕様)。
>おしいなあ、e.Typist8のように変更できれば、
>ファイルサイズを小さくできるのに。

228 :227:03/01/07 19:19
すみません。解決しますた。。。。

229 :名無しさん@そうだ選挙にいこう:03/01/07 22:11
>228
何をどうしたら解決したのか、同じトラブルをかかえている人のためにも
記録としてココに書き込んでおいて下さい。
質問だけして逃げないように!!

230 :困ったチャン:03/01/09 21:09
あの・・・業者さんにOCR頼むと1枚あたりどれくらい取られるの?
100枚ぐらいの書類を電子化したいのです。
業者さんがソフトより高かったら自分でソフト買ってコツコツやろうかな・・・。

231 :227:03/01/11 13:03
>>229

失礼しました。

1.メニュー「その他」→「環境設定」
2.「その他」タグの「図領域出力DPI」で、解像度を変更。

ちなみに、私は
 DPI=「96」
に設定しました。
ただし、画像の解像度を失っているかもしれません。これは不明です。
変換の前後で画像サイズがあまり変わらないので、もしかすると実質的な解像度は同じかもしれません。

もっと最適な方法があるかもしれませんが、今はこの方法しか知りません。
試行錯誤でみつけました。


本来なら、
 DPI=「原稿画像DPIを保持」
という設定のままでサイズが維持されるべきだと思うのですが、
この設定のままでは、変換後のサイズが20倍近くになってしまいます。
PDF読込み時に解像度をあげ、解像度を戻さずに保存しているのかもしれません。

相談窓口のお姉さんに同じファイルで試してもらいましたが、同じ症状でした。


以上です。




232 :名無しさん@そうだ選挙にいこう:03/01/12 00:08
ありがとう。<傍観者より

これはコピペ保存するに足る情報だ。

233 :名無しさん@そうだ選挙にいこう:03/01/12 15:41
>224
 公官庁の出版している細かい数字の表を取り扱う目的で、
e.Typist8・読んde!!ココ Ver.8・読取革命2002などを
さまざま試してみました。
結局、東芝のExpress Readerが認識率・速度とも最良でした。


234 :名無しさん@そうだ選挙にいこう:03/01/12 19:34
でも¥20万じゃなー

235 :名無しさん@そうだ選挙にいこう:03/01/14 01:19
e.typstエントリーの事で質問があります。
キャノンのスキャナー(のおまけでついてきた体験版なんですけど
体験版だとテキスト編集みたいな事できないんでしょうか?
色々やってみるんですが文字化けしてしまって訳がわかりません。
サポセンに何度電話しても繋がらなくて途方に暮れてます。
バージョンアップしないと正常に動かないんでしょうか?
それともやり方が悪いんでしょうか?
ご存じの方いらっしゃったら教えてください。

236 :名無しさん@そうだ選挙にいこう:03/01/15 01:43
>235
認識結果が文字化けするんですか?
解像度はいくつくらいでスキャンしてますか?


237 :名無しさん@そうだ選挙にいこう:03/01/15 02:31
テキスト編集ができないわけないので
表示フォントが外国語になっちゃってるとか
初歩的なところを疑うのは失礼でしょうか?

あ、画像部分(もしくはロゴみたいにでっかい文字)を
強引に文字領域として認識させると製品版でも化けることある。
そのことかな?

製品版での知識でアドバイスすると(エントリー版は一度も使わぬまま
アップグレード版で上書きしたので)、認識領域を自動解析モードにするか、
怪しそうなところは手動で画像領域に指定して再度トライだ!

つーかまず素直に読めそうなところを文字領域で指定して、
すこしずつ練習してごらん。

238 :名無しさん@そうだ選挙にいこう:03/01/15 11:34
>>235
読みとり精度が良くて、カスタマイズしやすい
読んdeココか、読取革命の最新バージョンを買えば、よい。

239 :235:03/01/15 14:43
>>236>>237>>238
ご回答ありがとうございます。
それでですね、私がバカかアホかってな感じだったんです。
すいませんでした。OCRそのものをよく理解していませんでした。
ほんと申し訳ありませんでした。罫線を使ったフォームを編集したかった
んです。それで罫線が文字化けの原因って事がわかり。。。
ホント間抜けな質問してすいませんでした。
ピタットフォームというフォームの編集ができるソフトの体験版を
DLしてから回線切って首吊って逝ってきまつ・・・・



240 :山崎渉:03/01/15 16:39
(^^)

241 :名無しさん@そうだ選挙にいこう:03/01/15 23:51
そんなに恐縮しなくても(笑)。

242 :名無しさん@そうだ選挙にいこう:03/01/16 14:43
スキャナを初めて購入しようと思ってる者です。
今まで使った事ないので、変な質問かもしれませんが・・・

Fujitsu の ScanSnap! (fi-4110EOX2)
http://www.pfu.fujitsu.com/sales/snap/
これで読んdeココとかって使えますか?

243 :名無しさん@そうだ選挙にいこう:03/01/16 15:21
>>242
LECは著作権にうるさいぞ

244 :名無しさん@そうだ選挙にいこう:03/01/16 15:29
>>242
使える。
読ココはアクロバットのプラグインとしてつかるから、PDFで読み込んでそのままOCRをかけるのが吉。
スキャンスナップならば、読ココが一番使い勝手がいいと思う。

詳細が効きたければ、
http://pc3.2ch.net/test/read.cgi/hard/1039872188/l50
【ADF】スキャナで連続取り込み003.jpg【OCR】
へどうぞ。


245 :242:03/01/16 15:40
>243 >244
レスThanks! 「TWAIN規格」(?)対応のスキャナでないと言うことで
ちっと心配でした。PDFでできるのですね!

で、LECって何??

246 :名無しさん@そうだ選挙にいこう:03/01/17 18:55
読んdeココのお試し版をアクロバットのプラグインとして
使おうと思ったのですが、設定の仕方が分かりません。
読ココお試し版をインストールするだけで自動で設定されると
思ったのですが・・・。
お試し版ではプラグインとして使えないのでしょうか?
ご存じの方がいらっしゃいましたら教えて下さい。

247 :名無しさん@そうだ選挙にいこう:03/01/17 22:19
スタート→プログラム→読んdeココ→アドインの追加と削除
でAcrobatにチェック入れるとプラグインがインスコされるよ。
ちなみにアンインスコはチェック外すだけ。

248 :名無しさん@そうだ選挙にいこう:03/01/17 23:19
>>247
有り難うございます。
プラグイン出来ました。
早速使ってみます!


249 :名無しさん@そうだ選挙にいこう:03/01/20 20:26
>>243
このネタで笑える香具師は多いのか?

250 :名無しさん@そうだ選挙にいこう:03/01/20 22:50
ウヘ     ,--─i'''""        'ヽ、
     /   i,             ヽ,
    ..i     |.              i,
    /    _i-、  ___,       i,
    |   ┌'    ̄ ̄     ヽ、    l
    |    l             i,    |
    |   i ,,,,,,,,,,     ,,,,,,,,,,,,  ヾ,    i
    .|  /  _ "     __ "'   i ,--i
    .ト、.l  -=・=-    -=・=-   ト'/"i |
      .|       l :::::.   ::::::::::::::::::∂ l
      |       l  ::::::...  ...:::::::::::: -' ノ
      .|     '~-  -::::::::::::::::::::::::::::┌-'
      ヽ,  i \___/ `i:::::::::::::::::l 
       ヽ,    \/  ::::::::::::::::::ノl  
         \     ...::::::::::::::::/::ト、
          ~ト、....:::::::::::::::::::/::::/ >、
          il,  ̄ ̄ ̄ ̄::::/  /  \
        _,,-| \   ::_,--'"    /    ヽ-、
    _,,,.--'"~ |   >,-'''"       /      | ~"--,,_
  _,,.-'" /    |i  i" ヽ     //      |     ~''-,,__

251 :名無しさん@そうだ選挙にいこう:03/01/24 00:24
>>250
こっちには笑えた(w


86 KB
■ このスレッドは過去ログ倉庫に格納されています

★スマホ版★ 掲示板に戻る 全部 前100 次100 最新50

read.cgi ver 05.04.00 2017/10/04 Walang Kapalit ★
FOX ★ DSO(Dynamic Shared Object)