ocr

学会

ICDAR 2023で行われる階層的テキスト検出・認識に関するコンペ(2/2)

1.ICDAR 2023で行われる階層的テキスト検出・認識に関するコンペ(2/2)まとめ・HierTextデータセットは画像領域、テキストレイアウトが多様であり、既存データセットと比較して多くのテキストが含まれている・HierTextは画像...
学会

ICDAR 2023で行われる階層的テキスト検出・認識に関するコンペ(1/2)

1.ICDAR 2023で行われる階層的テキスト検出・認識に関するコンペ(1/2)まとめ・文書画像よりも複雑な背景を持つ自然画像にOCRを適応させる研究は場面内テキスト検出・認識や場面内テキスト位置決定と呼ぶ・場面内テキスト検出・認識と関係...
アプリケーション

Lookout:視覚に困難を抱える人のためにスマホで商品を識別(2/2)

1.Lookout:視覚に困難を抱える人のためにスマホで商品を識別(2/2)まとめ・LookoutはMediaPipe Box trackingやScaNNを使って実装されている・大規模な分類モデルであるNASNetを教師モデルとしてトレー...
入門/解説

定型書式から必要な情報を自動で抽出(1/2)

1.定型書式から必要な情報を自動で抽出(1/2)まとめ・領収書、請求書などの定型書式文書は、様々なビジネス場面において非常に一般的で大切・しかしこれらの定型書式文書は手作業で処理されるが転記ミスなどが発生する可能性がある・機械学習を用いてこ...
AI関連その他

Google LensのGoogle Goバージョン(2/2)

1.Google LensのGoogle Goバージョン(2/2)まとめ・OCRエンジンの誤読に備えて、文脈やナレッジグラフから手がかりを得て精度を上げている・翻訳した文章が元の文章のどの部分に該当するかわかるように着色を行う・カラオケのよ...
入門/解説

Google LensのGoogle Goバージョン(1/2)

1.Google LensのGoogle Goバージョン(1/2)まとめ・Google Lensは読み書きに困難を感じている世界の8億人の人々を手助けできる潜在能力がある・しかし、従来のGoogle Lensはある程度機能が高いスマートフォ...
入門/解説

カメラの時代:Google Lensの1年間(2/2)

1.カメラの時代:Google Lensの1年間(2/2)まとめ・OCRエンジンによりレシピから材料をコピーして買い物リストに貼り付ける事が可能・製品ラベルを読む訓練も行われており10億以上の製品を識別する事が可能・スタイル提案(style...