ニュース・WEB広告・ツール・事例・ノウハウまで
デジタルマーケティングの今を届けるWEBメディア

youtube
feed

サイバーエージェント、広告クリエイティブに特化した独自日本語OCR(光学文字認識)モデルを開発

時計2023.11.13

更新2023.11.13

サイバーエージェント、広告クリエイティブに特化した独自日本語OCR(光学文字認識)モデルを開発

特殊な日本語フォントなどの高精度な文字認識が可能に 「極予測シリーズ」へ導入、さらなる予測精度向上へ

株式会社サイバーエージェントは、広告クリエイティブに特化した独自の日本語OCR(Optical Character Recognition/Reader・光学文字認識)モデルを開発したことをお知らせいたします。

本モデルにより、既存のサービスでは難しかった日本語特有の縦書き表記やフォントなどの高精度な文字認識が可能となり、当社が提供する「極予測シリーズ」※1において、さらなる予測精度向上を実現します。
なお当社が提供する、AIで効果の出せるランディングページを予測・制作する「極予測LP(キワミヨソクエルピー)」においては既に導入が済んでおり、今後は他の「極予測シリーズ」への導入を順次進めてまいります。

背景

デジタル広告において高い広告効果を創出するためには、画像やキャッチコピーなどの素材を多様に組み合わせ、ユーザーの年齢や性別、興味関心などターゲットごとに効果の期待できるクリエイティブを制作することが重要です。当社が提供する「極予測シリーズ」では、これまでも広告クリエイティブの事前効果予測エンジンの精度向上に取り組んでおりましたが、より高精度な効果予測のためには、クリエイティブ内のテキストを正しく読み取ることが重要となっています。

OCR(Optical Character Recognition/Reader)は手書きや印刷された文字を読み取り、デジタル上で扱える文字データに変換する技術です。
これまでも「極予測シリーズ」においては、広告クリエイティブ内の文字を検出・解析し、クリエイティブ制作および事前効果予測のフローにOCRの技術を取り入れていましたが、クリエイティブ内の文字のフォントやレイアウトは複雑化しており、従来の外部OCRサービスでは正しく読み取ることが難しいケースも増えておりました。

概要

このような背景のもと、当社では日本語の広告クリエイティブ制作に特化した独自のOCRモデルを開発・実装いたしました。
本モデルにより、日本語特有の縦書き表記や特殊な文字フォントに対しても高精度な文字認識を実現しております。

サイバーエージェント、日本語OCR(Optical Character Recognition/Reader・光学文字認識)モデル

図1 左が今回開発したCAの独自OCR、右が既存の外部OCRサービスを利用した解析結果

CA独自OCRでは全ての文字が認識されており、グルーピングも正しくされております。本機能により広告内の高度なレイアウト理解を可能にし、効果予測精度の向上が期待できます。

今後

当社は今後も高い技術力を生かし、更なる予測精度の向上を図る研究開発を進め、AIを活用した高品質なクリエイティブの制作および新しいクリエイティブの価値提供を目指すとともに、広告主企業のみなさまの広告効果最大化に尽力してまいります。

※1 「極予測AI」「極予測TD」「極予測LP」をはじめとした、効果の高いインターネット広告クリエイティブのAIによる効果予測および生成AIを活用した広告素材の自動生成などのクリエイティブ制作支援サービス

関連リンク

株式会社サイバーエージェント
サイバーエージェント、広告クリエイティブに特化した独自日本語OCR(光学文字認識)モデルを開発

当ウェブサイトでは、サイトの利便性向上を目的に、クッキーを使用しております。
詳細はプライバシーポリシーをご覧ください。また、サイト利用を継続することにより、クッキーの使用に同意するものとします。
同意する