Google Translate
Google Translate

UECで究める

研究室紹介冊子OPAL‐RING 庄野 研究室

深層学習による画像解析と視覚の仕組みの解明

掲載情報は2025年2月現在

所属 大学院情報理工学研究科
総合情報学専攻
庄野 逸
Hayaru SHOUNO 
メンバー 庄野 逸 教授
所属学会 電子情報通信学会、情報処理学会、日本神経回路学会、日本物理学会、米電気電子学会(IEEE)
研究室HP https://sites.google.com/view/shounolab/
印刷用PDF

キーワード

機械学習、深層学習、画像処理、医用画像解析

人や動物はものをどのように見ているのでしょうか。「視覚」に関する脳の情報処理のメカニズムは、実はまだよく分かっていません。一方で、人工知能(AI)による画像認識などに欠かせない、深層学習の一つである「畳み込みニューラルネットワーク」(CNN)は、脳の初期の視覚野の階層構造をまねて作られています。つまり、CNNは生物の視覚進化の過程で獲得した画像表現であるとも言えるのです。
では、CNNをはじめとする深層学習と、脳の画像表現はどれくらい似ているのでしょう。視覚の情報処理をベースに、画像処理や神経回路モデル、深層学習などの機械学習について研究する庄野逸教授は、脳内における画像表現と、深層学習とを比較する手法を模索しています。「深層学習や機械学習のモデルを“ブラックボックス”ととらえ、その機能を単に利用するだけでなく、脳の画像表現と結びつけることで、深層学習をより深く知ることができれば、新たなモデルの構築にもつなげられる」(庄野教授)と考えているからです。

近年の研究概要
「匠の眼」を知る

その手法の一つとして、現在取り組んでいるのが、計測画像などによくみられる模様のような画像パターン(テクスチャ)の識別です。人の視覚は、対象物の概形は形(シェイプ)で認識しても、質感などはテクスチャで判断することが多いことが分かっています。例えば、訓練を受けた技術者や医師らは、ある問題に特化したテクスチャから対象物の性質を推測する能力にたけています。
一例として、ハードディスクなどに用いる磁性薄膜のテクスチャ(磁区パターン)解析を行いました。磁性薄膜の表面を計測した画像において、黒色と白色の部分はそれぞれ磁石のN極とS極を示しています。庄野教授は、磁石でこすった鉄が磁石に変わっていく際の、島構造から迷路構造に至る磁性テクスチャの変化をシミュレーションで表し、CNNのような中間表現を使ってマッピングすることで、磁性テクスチャを支配する方程式の物性パラメータを算出しました。
これにより、島構造と迷路構造の中間の状態も定量的に評価できるようになり、「画像から物理、すなわち物性値を推定できるようになった」と庄野教授はとらえています。材料科学の研究者らは、磁性テクスチャから画像が示す性質を日々、見極めていますが、なぜそのような推測に至ったのかについては、説明できないことも多いでしょう。だからこそ、「こうした『匠の眼』を知ることには大きな意味がある」(庄野教授)のです。

磁区パターンの変化①
磁区パターンの変化②
画像診断により構造材料の評価も

最近は、金属表面のテクスチャ解析にも着手しています。火力発電所をはじめとする発電プラントや輸送用機器、橋梁などに用いる金属製の構造材料は、経年変化に伴う材質の劣化により、損傷や破断などが生じる恐れがあります。現在では、高温環境下での変形などによって金属表面に現れる析出物の光学顕微鏡画像から、熟練の技術者が目視で材料の状態を評価しています。
庄野教授は、機械学習の一つで、少数のデータから全体像を把握する「スパース(疎性)モデリング」を使い、金属の破断面における光学顕微鏡画像のテクスチャのわずかな特徴量から、実際の温度に対してプラスマイナス10℃程度の誤差で、金属の曝露温度を推定することに成功しました。内部の計測が難しい運転中の発電プラントなどであっても、画像から温度を精度良く推測できれば、将来、人の目よりも正確に、構造材料の劣化診断や寿命予測が可能になるかもしれません。

「匠の眼」を造る

さらに、これらの知見を生かしたアプリケーションとして、「匠の眼」を造る技術にも広げています。例えば、医療画像から疾患を見つけ出す、機械学習を用いたコンピュータ支援診断(CAD)として、呼吸器疾患の中でも診断に高い専門性が要求される、新型コロナウイルス感染症などにもみられる「びまん性肺疾患」の画像診断の精度を高めました。
これもスパースモデリングを使っており、因果関係が把握しやすいことから、診断に至った理由なども分析しやすくなります。こうしたCADの高度化により、画像のわずかな兆候をとらえることができれば、疾患の早期発見や進行の抑止にもつながるでしょう。

さまざまな計測画像のテクスチャを解析
機械学習モデルから脳を明らかに

科学や医療などの先端分野では、匠の人材が常に不足しており、そうした専門家をサポートするためにも、「さまざまな領域に機械学習を導入し、アプリケーションを作り込んでいくことが大切だ」と庄野教授は指摘します。最新の研究では、人の脳と深層学習との違いを明らかにしつつあり、庄野教授は「計算機モデルを造ることによって、脳の仕組みの解明へとさらに迫りたい」と考えています。

【取材・文=藤木信穂】