arrow-leftarrow-rightarrow-smallarrow-topblankclosedownloadeventfbfilehamberger-lineicon_crownicon_lighticon_noteindex-title-newindex-title-rankingmailmessagepickupreport-bannerreportsearchtimetw

報告書における“生々しさ”を画像生成AIで演出する~生成AIで挑むこれからの定性調査③

はじめに

マーケティングリサーチには、大きく分けると「定量調査」と「定性調査」の2種類があります。「定量調査」と「定性調査」は、調査方法の違いだけでなく、得られる情報も大きく異なるため、アウトプットとなる報告書に求められる内容も大きく異なります。連載第三回では定性調査の報告書の一部分として作成される「個票」の役割と、「個票」に起きているとある問題を画像生成AIで解決する試みをご紹介します。

“生々しさ”と個人情報の狭間で生まれた問題

「個票」とは、個人を理解し調査結果を正しく読み解くために、デモグラフィックデータや意識に紐づけてインタビュー結果を一人ひとり整理したものです。「定量調査」の報告書は“数値を分析する”ことが求められるのに対し、「定性調査」の報告書は“数値化できない人の気持ちを分析する”ことが求められます。しかし、まとまった文章だけでは一人ひとりの発言内容はわかりづらくなります。そこで、報告書の一部として「個票」が活用されます。
以下が「個票」の一例です。

図表1

NO.1【背景情報】

個票を読むだけでインタビューの対象者が思い浮かぶような“生々しい”=“対象者がこの世で生活している様子が現実味を帯びて想像できる”状態にします。上記の内容だけではわかりづらいと思いますので、実際のインタビューを例にしながらご説明していきます。

例えば「休日は温泉に行く」と回答した対象者が二人いたとします。その理由を聞いてみると、対象者から共通して「リフレッシュするためです」との回答が返ってきました。しかし、「リフレッシュ」できる理由を説明してもらうと、一人は「誰にも会わずに済むから」もう一人は「友人とゆっくり語り合えるから」と言うのです。ここまで聞いてようやく「対象者が温泉に入っている様子を現実に近い形」で想像できるようになります。定量調査でも欲求のレベル感や背景を押さえるように質問項目を設計しますが、このような深い背景情報まで確認できることが定性調査の特長であり、この情報を正しく理解するために必要なのが“生々しさ”を担保する個票なのです。

例として示した個票ですが、現在とある問題から実際には以下のようになっています。

図表2

NO.1【背景情報】

何が変わってしまったか、おわかりいただけたでしょうか。そう、対象者の写真がアイコンに変わってしまっているのです。現在のインテージグループでは個人情報の取り扱いをより厳重にするため、個票をはじめとした納品物には原則、顔写真を使用していません。AIが発展した結果、画像検索で個人が特定できてしまう可能性が高まってしまったからです。

この記事を読んでいただいているマーケターの皆さんの中には「顔写真がそんなに重要なのか?」と考える方もいらっしゃるかもしれませんが、生々しさを演出する手段として写真の効果は絶大です。雑誌のインタビュー記事を想像してみてください。そこには高確率でインタビューを受けた人の写真が載っているはずです。知らない人だったとしても、インタビューでその人が喋っている姿をイメージしながら記事を読めると思います。
もしインタビューに同席していたとしたら、顔を見ただけで喋り方や印象に残った発言まで思い起こされるでしょう。だからこそ、個票に使用していた顔写真がアイコンになってしまったことは問題であると認識しました。
顔写真の代用としてイラストレーターに似顔絵を描いてもらうことが真っ先に思い浮かびましたが、対象者が10人以上いる調査は珍しくないため、工数や費用の観点から持続可能な解決策になりません。
そこで注目したのが画像生成AIでした。絵が描けない人でも簡単に顔写真や似顔絵が生成できれば、専門家に依頼することなく手軽に個票の生々しさを演出できると考えたのです。次の章ではどのような画像が生成できたのか、その過程でどのような課題があったのかご説明します。

画像生成の検証結果と、検証過程で生じた課題

まず写真をイラスト化する画像生成AI(image to image)を検討しましたが、個人情報として扱う対象者の写真を学習させるわけにはいかず断念しました。その次にテキスト入力で画像を生成する画像生成AI(text to image)を検討しましたが、画像生成AI自体の課題である「学習元が不明瞭だと著作権的に問題がある可能性がある」点は払拭できません。
そこで今回は、学習元が明示されている「Adobe Firefly」で検証を行いました。プロンプトに必要な要素は何か、どのような表現をすれば意図通りに生成されるのか、意図通りに生成されない理由は何なのか。人の特徴をテキスト入力で再現できることをゴールに、プロンプトを試行錯誤しました。インテージ社員のイラストレーターに確認したところ、似顔絵の要点は「髪型・目つき・口の形・輪郭・表情・その他特徴的な要素(眼鏡やほくろなど)」とのことだったので、弊社男性社員をモデルに単語を抜き差しし、表現を変えながら最終的にたどり着いたプロンプトと生成結果は以下の通りです。

プロンプト:「30代後半の日本人男性で輪郭は丸顔、黒髪短髪で前髪がある、
少し垂れ目で眉毛は真っ直ぐで薄い、唇は薄めでにこやかな表情をしている、
四角い眼鏡をかけてホワイトシャツを着ている、バストアップのイラスト」

図表3

検証の結果

当たらずも遠からず程度にはなっているでしょうか。この結果にたどり着くまでの検証過程で生じた課題が4つありました。

課題①単語が認識されない

text to imageの画像生成AIは文字通り単語から画像を生成しているため、学習データに含まれていない単語を考慮することはできません。また「Adobe Firefly」はすべての言語を英訳してから出力しているため、訳せない単語も考慮されません。例えば、輪郭のプロンプトとして「丸顔」はある程度考慮されますが「面長」は無視されます。稀に「面長」でも特徴を生成することがありますが、それは顔のパターンとしてたまたま「面長」と言える特徴の顔を生成しただけです。どの単語が認識されないのか試行錯誤する必要がありますが、英訳できそうな単語か一度考えてプロンプトに落とし込みました。
以下は検証結果で使用したプロンプトの輪郭部分を「面長」に変更して画像生成した結果です。

図表4

「面長」は生成結果に反映されない

課題②そもそも表現が難しいビジュアルがある

これは画像生成AIの問題ではなく人間側の問題ですが、特定の単語で表せないビジュアルがあります。髪型を例とすると「オールバック」や「スキンヘッド」なら一単語で共通認識が持てますが、先ほどから例として示している弊社男性社員の髪型は「短髪」としか言えず、一単語で特徴を表現できません。入力した単語が広義であればあるほど出力結果のブレが大きくなってしまいます。これに対し「前髪がある」などの微調整を経て近しい髪型が出てくるまで出力し続けることで「まあ似てなくもないかも」程度の仕上がりに寄せることが精一杯でした。
以下は検証結果で使用したプロンプトの髪型部分「前髪がある」という文を削除した場合の画像生成結果です。

図表5

「短髪」だけでは生成結果のブレが大きい

この問題をさらに難しくしているのは「画像生成AI全般がレイヤー分けされていない1枚画を生成する」ことです。検証の過程で「あと髪型だけ替えられればかなり似せられるのに1からやり直し」ということが多々ありました。もし描画レイヤーが分かれていれば髪型だけの修正ができるようになり、結果としてクオリティの高い画像を簡単なプロセスで生成できるようになるはずです。

課題③システムが原因でプロンプトが反映されない

「Adobe Firefly」特有のシステムで「スタイル参照」というものがあります。公式サイトでは「既存の画像を使用して、生成された画像のバリエーションのルックアンドフィールを作成できます。」と説明されていますが、こちらは「既存の画像を読み込ませることで画風の指定ができる機能」だと思えば良いと思います。このスタイル参照にインテージ社員のイラストレーターが作成した似顔絵を設定して、同じ報告書内で使われる対象者画像のテイストを合わせるつもりでした。しかし、このスタイル参照の影響が非常に強いのです。そのことに気づかず、どれだけプロンプトを工夫しても参照元の青いストライプの服が生成画像に反映されたため頭を抱えていました 。
以下のように、「黒いスーツ」と指定していても青色を含むストライプで生成されてしまいます。

図表6

スタイル参照の営業が非常に強い

スタイル参照が生成画像に強い影響を与えていることに気づいた後も、プロンプトによって解決しようと試みましたが、何度やっても結果は変わりませんでした。結局、スタイル参照として利用する画像を「Adobe Firefly」に元から備わっている「色的に影響がない線画」とすることで、この課題を乗り越えました。

課題④画像生成AI特有の「奇妙な画像」が生成される

画像生成AIが生成した画像で以下のような画像を見たことがあるのではないでしょうか。

図表7

※AdobeStockより引用

一見実写のような画像ですが、物理法則が無視されています。お箸の片方に手がかかっておらず、本来であれば麺を持ち上げられないはずです。このように画像生成AIは現実と非現実が混在する奇妙な画像を生成することがあります。
今回の検証の中でも以下のように着ている服の様子がおかしかったり、なぜか背景に桜が生成されたりしたので、生々しさを追求する以前に、この現象を解明する必要が出てきました。

図表8

プロンプト:「30代後半の男性」
プロンプト:「30代後半の男性」

情報収集と検証の結果、主な原因は画像生成(text to image)のメカニズムにあることがわかりました。一部考察を含みますが画像生成(text to image)の生成プロセスをご説明します。例としてプロンプト「赤い服を着た二足歩行の猫」で画像生成する場合、以下のようになります。

図表9

画像生成(text to image)の生成プロセスイメージ

画像生成AIが生成しているものは「画像」ではなく「(画素単位の)色の配置」と言えます。画像生成AIは猫という存在を認識しているのではなく、「猫と言われた時の色の配置」を学習しているわけです。そのため画像生成AIは入力されたプロンプトの各要素を掛け合わせた色の配置を生成していると考えられます。この生成プロセスでは要素同士の整合性は考慮されないため、「お箸の片方に手がかかっていないのに、持ち上がっている麺」のような現実離れしている奇妙な画像が生成されてしまうのだと結論づけました。この奇妙さへの対策として、状況的な違和感の原因となる背景を削除し、非現実的な画像が生成されても違和感が少なくなるように写真ではなくイラストで生成するように検証を進めました。

画像生成AIが生成する画像は“生々しさ”を演出できるか

今回の検証で生成した画像を個票に落とし込むとこうなります。

図表10

アイコンに比べれば個人を想像しやすく、生々しさを演出できているのではないでしょうか。一方で今回検証した通り、現状では個票に使える画像を出力するためには、「意図しない生成結果が出た際に修正できるほどの画像生成AIに対する理解力」と「適切なプロンプトを作成し指示する技術」が要求され、誰でも簡単に思い通りの画像が生成できるわけではなさそうです。

連載第三回では、生々しさを大切にする定性調査において、調査結果を正しく読み解くために作成される「個票」の役割と、生々しさを演出する顔写真が個人情報保護の観点から利用できなくなった問題を画像生成AIで解決する試みをご紹介しました。対象者の顔写真が使用できない中でも、より生々しい個票をこれまでの納期通りに作成できるのではないかと思い、画像生成AIの可能性を検証しましたが、現状では事前に思い描いていたほど手軽に対象者に似た画像を生成することはできません。しかし、画像生成AIの発展も目覚ましく進んでいることも確かです。近い将来に個人のプライバシーも尊重しながら、大きなコストをかけず定性調査報告書の生々しさを演出できる画像生成、もしくはそれを上回った調査結果をさらにわかりやすくするようなビジュアルが生成できるようになることを期待し、今後も情報収集と検証を続けます。

著者プロフィール

白井 光(シライ ヒカル)プロフィール画像
白井 光(シライ ヒカル)
株式会社インテージ エクスペリエンス・デザイン本部 リサーチ事業推進部
F2Fアナリシスグループ リサーチャー

BtoB調査会社、市場調査会社を経て、2024年にインテージ(旧インテージクオリス)入社。人の言葉選びに興味を持ち、対象者一人ひとりの話を聞くことができる定性調査に従事。現在はクルマ業界の案件を中心に対応。

株式会社インテージ エクスペリエンス・デザイン本部 リサーチ事業推進部
F2Fアナリシスグループ リサーチャー

BtoB調査会社、市場調査会社を経て、2024年にインテージ(旧インテージクオリス)入社。人の言葉選びに興味を持ち、対象者一人ひとりの話を聞くことができる定性調査に従事。現在はクルマ業界の案件を中心に対応。

転載・引用について

◆本レポートの著作権は、株式会社インテージが保有します。
下記の禁止事項・注意点を確認の上、転載・引用の際は出典を明記ください 。
「出典:インテージ「知るギャラリー」●年●月●日公開記事」

◆禁止事項:
・内容の一部または全部の改変
・内容の一部または全部の販売・出版
・公序良俗に反する利用や違法行為につながる利用
・企業・商品・サービスの宣伝・販促を目的としたパネルデータ(*)の転載・引用
(*パネルデータ:「SRI+」「SCI」「SLI」「キッチンダイアリー」「Car-kit」「MAT-kit」「Media Gauge」「i-SSP」など)

◆その他注意点:
・本レポートを利用することにより生じたいかなるトラブル、損失、損害等について、当社は一切の責任を負いません
・この利用ルールは、著作権法上認められている引用などの利用について、制限するものではありません

◆転載・引用についてのお問い合わせはこちら