「さくらみこ」のファン研究者が、画像の「くっきりさ」を数値化することに成功 / Credit:San To Chan(OIST)_絵文字と物理学 画像の「くっきりさ」を数値化する手法を開発(2024)

ファンや絵師にとって「推し」の画像はできるだけ鮮明であってほしいものです。

そんな熱烈な思いが、新たな物理学の研究を生み出しました。

沖縄科学技術大学院大学(OIST)に所属するサント・チャン氏は、VTuber「さくらみこ」のファンでもあります。

そんな彼は、絵師たちの習慣から着想を得て、デジタル画像の「視覚的な鮮明さ」を定量的(物事を数値や数量で表現すること)に評価する新たな手法を開発しました。

これにより、芸術作品の鮮明さが客観的かつ数値的に評価できるようになり、より品質の高い作品を生み出すのに役立つかもしれません。

研究の詳細は、2024年12月13日付の学術誌『米国科学アカデミー紀要(PNAS)』に掲載されました。

目次

35P研究者の「さくらみこ」への推し事をきっかけに論文が執筆される「元の画像」と「ぼかし画像」の情報量を比較し、鮮明さを定量化する手法

35P研究者の「さくらみこ」への推し事をきっかけに論文が執筆される

近年、YouTubeなどで動画投稿やライブ配信を中心に活動するバーチャルYouTuber(VTuber)が、日本だけでなく海外でも高い人気を集めています。

VTuberグループ「ホロライブ」のメンバーである「さくらみこ」氏もその1人です。

彼女のファンは「35P(みこぴー)」と呼ばれており、さくらみこ氏は多くの35Pから熱烈な支持を得ています。

沖縄科学技術大学院大学(OIST)に所属するサント・チャン氏も35Pの1人であり、過去に35Pの仲間たちとアニメーションの作成や展示を行ったこともあるようです。


「さくらみこ」氏のファンであり、研究者でもあるサント・チャン氏 / Credit:San To Chan(OIST)_絵文字と物理学 画像の「くっきりさ」を数値化する手法を開発(2024)

彼は研究以外では、絵師(絵描き)としても活動しており、ホロライブを題材にしたインディーズゲームの開発にも携わっています。

そして、ゲームの開発者がチャン氏にいくつかの絵文字を依頼したことがきっかけで、今回の研究が始まりました。

35P兼、絵師兼、研究者であるチャン氏が、絵文字の作成をきっかけに始めた研究とは、いったいどのような内容なのでしょうか。

それは、「デジタル画像の鮮明さを数値で定義する」というものです。

画像を作成する時、そして見る時、「鮮明さ」は非常に重要です。

モザイクが掛かったようにぼんやりとした画像ではなく、「画像全体がくっきりと見える」方が人々の評価は高まります。


鮮明な画像とぼやけた画像 / Credit:San To Chan(OIST)_絵文字と物理学 画像の「くっきりさ」を数値化する手法を開発(2024)

例えば、上の画像のどちらを自分のアイコンに用いたいか考えると、「鮮明さ」の重要性が理解できますね。

しかし、芸術作品に対する「鮮明さ」や「構造的な完成度」などの評価項目は、私たちの主観に頼りがちです。

では、これら曖昧な評価項目を、客観的なデータとして数値で表すことができるでしょうか。

チャン氏ら研究チームは、新たな方法を開発し、画像の「くっきりさ」の定量化に成功しました。

(広告の後にも続きます)

「元の画像」と「ぼかし画像」の情報量を比較し、鮮明さを定量化する手法

チャン氏ら研究チームは、画像の鮮明さを評価する手法を開発する上で、次のように述べています。

「『鮮明さ』をぼかしに対する抵抗力と定義しました。

絵師たちが、作品がどれだけはっきり見えるかを評価するために、キャンパスをズームアウトして全体像を確認する技法から着想を得ました。

数学的には、鮮明度は色のコントラストやその空間的分布で表現できます」

チャン氏が鮮明さを定量化するために用いた手法とは、「元の画像」と、「意図的にぼかした画像」を比較することで、元の画像がどれだけ鮮明だったかを測るというものです。


鮮明度の低下の例:ぼかしと色コントラストの影響。上段は、コントラストを一定に保ったまま、ぼかしが鮮明度に与える影響を示している。下段は、色の配置を固定したまま、コントラストの低下が鮮明度に与える影響を示している / Credit:San To Chan(OIST)_絵文字と物理学 画像の「くっきりさ」を数値化する手法を開発(2024)

具体的には、用意された元の画像において、隣り合うピクセル(デジタル画像の最小単位)をランダムに入れ替えることで、その画像を段階的にぼかしていきます。

そしてそれらぼかした画像と、元の画像を比較し、「どれだけの情報量が失われたか」調べます。

実際、元の画像が鮮明であればあるほど、その画像をぼかすと、元の画像とは大きく異なる作品になります。

つまり劣化が大きくなるのです。

一方で、元の画像があまり鮮明でない場合、その画像をぼかしたところで、元の画像との差はそこまで生じません。

元々持っていた情報量が少ないため、劣化も小さいのです

身近な例で考えてみましょう。


鮮明な絵ほど、手を加えた時に失われる情報量が多い / Credit:Canva

例えば、鮮明な絵(細かい模様や線がたくさんある)を消しゴムでこすると、絵はかなり変わります。

一方、最初からぼやけた絵(ふんわりとした色だけの絵)をこすっても、たいして変化はありません。

つまりこの研究では、意図的なぼかし操作で「変化が大きければ鮮明」と定義することで、鮮明さを数値化することに成功したのです。

さらにこの研究では、色の多様性を示す「シャノンエントロピー」という物理学的な指標も併用し、画像の鮮明さと情報量を同時に分析できるようにしました。

つまり画像の鮮明さ(構造的安定性)を、物理学でよく使われる「エネルギー」や「エントロピー」と類似した概念で表現しているのです。

具体的には、画像のピクセルをランダムに入れ替える過程を「構造のエネルギーを増加させる操作」として捉えています。

物理学では、システムの安定性や変化をエネルギーの観点から解析することが一般的です。

今回の研究では、画像のぼかしを「物理的な構造が壊れていくプロセス」に見立て、エネルギーの変化を数値的に測定しています。


8つの異なる次元のエモートについて、RGB空間内で最も頻繁に使用される50色の分布を視覚化する3次元散布図 / Credit:San To Chan and Eliot Fried . PNAS (2024)

絵師の作成した絵画に物理学的なエントロピーとエネルギーの概念まで持ち込み、その分析から新発見に辿り着いた著者の熱意には驚くばかりです。

ちなみに、研究の題材に選ばれたのは、さくらみこ氏を描いた画像であり、今回の手法により、さくらみこ氏の画像の鮮明さを客観的に示すことが可能なりました。

これは35Pたちにとって嬉しいことでしょう。

チャン氏は、今回の研究が始まったきっかけを振り返り、「『押し事』への情熱を『お仕事』に注いだ結果、今回の論文が生まれました」と述べています。

(※推しへの熱意が学術的発見につながった貴重な例ともなるでしょう)


元論文を是非読んでみてください。 / Credit:San To Chan and Eliot Fried . PNAS (2024)

彼が開発した手法は、視覚的な特性を客観的かつ数値的に評価するための新たな可能性を開きます。

将来的には、映画やアニメの解析、デザインの最適化、AI生成画像の解析に至るまで、様々な分野の芸術作品を評価し、品質を向上させることに役立つかもしれません。

(※本記事には論文リンクが張られていますが、論文には多くのキャラクターたちの二次元画像が実際の分析資料として用いられています)

参考文献

絵文字と物理学 画像の「くっきりさ」を数値化する手法を開発
https://www.oist.jp/ja/news-center/news/2024/12/13/physics-and-emote-design-quantifying-clarity-digital-images

元論文

Structural stability and thermodynamics of artistic composition
https://doi.org/10.1073/pnas.2406735121

ライター

大倉康弘: 得意なジャンルはテクノロジー系。機械構造・生物構造・社会構造など構造を把握するのが好き。科学的で不思議なおもちゃにも目がない。趣味は読書で、読み始めたら朝になってるタイプ。

編集者

ナゾロジー 編集部