イベント企画
コンピュータビジョン・イメージメディア・パターン認識・メディア理解
2025/9/3(水) 15:30-17:30
第1イベント会場
【企画概要】本企画では、データ取得と学習制約を克服しつつ環境保全・コンテンツ産業・社会基盤を支える画像認識技術を総覧します。講演1では高価で希少な動物画像から個体識別・行動解析・3D再構成を実現する少数データ学習を紹介し、講演2では著作権やデータ不足に悩むイラスト・漫画領域でのゼロ/少ショット認識を紹介し、講演3ではRGBに縛られない波長・視点・時間拡張による入力設計を紹介します。これらの講演を通して、モデル頑健化・省エネ推論・データ倫理などの共通課題を俯瞰し、実フィールド応用と分野横断連携に向けた新たな方向性を探っていきます。また、研究と社会実装のギャップを縮める足掛かりを議論していきます。
15:30-16:10 講演 動物理解のためのコンピュータビジョン
篠田 理沙(大阪大学大学院 情報科学研究科 特任助教)
【概要】生態系調査は生物多様性保護に欠かせない活動ですが、従来の調査手法は動物に大きな負荷をかける場合がありました。近年、個体識別や種分類、行動解析、3D再構成など、画像を用いた動物理解に注目が集まっています。本公演では、データ収集コストが高い動物というドメインにおいて、いかに高品質なデータを収集・整備し、また限られたデータの中で精度の高いモデルを学習・応用してきたか、最新の研究事例とともに紹介します。
【略歴】2025年3月京都大学にて農学博士取得。在学中は産業技術総合研究所やオムロンサイニックエックス社でインターンを行う。2025年4月より、大阪大学情報科学研究科に特任助教として着任。画像認識の動植物への応用、視覚言語モデルの研究に従事。
16:10-16:50 講演 非自然画像における効率的な認識モデルの学習
古田 諒佑(東京大学 生産技術研究所 助教)
【概要】近年の機械学習モデルの大規模化に伴い、様々な画像認識タスクで大規模な正解アノテーション付きのデータセットが作成・公開されています。しかしながら、一般的な自然画像(写真)とは異なり、イラストや漫画、クリップアート等の非自然画像ではそもそものデータ数の少なさや著作権等の問題もあり、機械学習モデルの学習に使えるデータセットは限られています。本公演では、そういった非自然画像において少量の学習用データのみで、もしくは学習用データを全く用いることなく頑健に動作するモデルの獲得に向けた取り組みについて紹介します。
【略歴】2019年東京大学にて情報理工学博士課程修了。2020年まで東京理科大学にて助教。2020年より東京大学生産技術研究所に助教として着任。漫画の画像処理・画像認識を始めとしたマルチメディア・コンピュータビジョンの研究に従事。
16:50-17:30 講演 コンピュータヴィジョンにおける入力画像の再考
小篠 裕子(東京電機大学 システムデザイン工学部情報システム工学科 准教授)
【概要】画像中に映る物体や人の認識・検出といったコンピュータビジョン研究は,大規模なRGB画像データセットを用いた深層学習によって大幅に進化した.一方で、多くの研究では,データセットとして与えられたRGB画像を慣習的に用いている.本講演では,コンピュータビジョンタスクにおける入力画像のあり方について再考する.本当に人の眼を模したRGBでよいのか,まだ活用できていない波長域の情報はないのか,いくつかの事例とともに議論する.
【略歴】2015年神戸大学にて工学博士号取得.同年産業技術研究所で特別研究員,2016-20年慶應義塾大学にて特任助教,2020-22年東京電機大学にて助教,2023年より現職(准教授).2024年より学習院大学非常勤講師も兼任.現在は,画像認識,ハイパースペクトルセンシングに従事.