プログラム
format_list_bulleted情報・システムソサイエティ
一般セッション
- この目次は,インターネット講演申込登録のデータを元に作成されています。
- また,講演者を○,◎印で示し, ◎印は本会「学術奨励賞受賞候補者」の資格対象であることを示します。
- ○,◎の後ろに△がある場合はキャリアエクスプローラーの掲載を希望しています。
D-1. コンピュテーション
3月17日 13:00〜16:15 Meeting 37 座長 金 鎔煥(名工大)
D-1-1 |
Schellingの分居モデル
◎松浦凜花・塩谷 勇(法政大) |
D-1-2 |
PSOに揺らぎを導入した経路探索
◎澤幡真希・塩谷 勇(法政大) |
D-1-3 |
時間遅れと揺らぎを考慮したAxelrodの流布モデル
◎有賀舞乃・塩谷 勇(法政大) |
D-1-4 |
集団形成の実験的考察
◎北山智輝・塩谷 勇(法政大) |
D-1-5 |
Covid-19禍でのテレワーク実施率予測モデルの提案
○篠塚真智子・外間正浩・張 暁曦・川田 碧・原 美永子(NTT) |
D-1-6 |
局所探索を用いたフードバンクにおける食品分配最適化手法の基本的特性評価
○柴田紘希・北越大輔・鈴木雅人(東京高専) |
Schellingの分居モデルとは人間社会で人種ごとに分かれて住み、交じり合おうとしない分居という現象の仕組みについて考察するために考案されたモデルである。本研究では格子状に赤と緑の家、空き家をランダムに配置し、各家の色が8近傍の家の色が3以上(閾値)ならばその場所に住みたいと考える。3未満の場合はランダムに空き家を選択し、引っ越し、すべての家が満足する状態になるまで繰り返す。本報告では、引っ越し先を見つけて、家を建築中のような状態を時間遅れとして実装した実験と、引っ越しする時の閾値3に固定するのでなく、閾値を正規分布の平均値3にして、標準偏差0.2刻みで変化させた場合の実験について、結果を報告する。
本研究では集団で行動する中で、さらに効率を上げるための1つの方法を示すことが目的である。そのため「揺らぎ」と呼ばれる要素を導入した。揺らぎとは人の気分のような不確定な要素である。今回この揺らぎを2つの実験において、パラメーターに導入し、導入前後の結果を比較することで揺らぎの有効性を示す。今回実験は2つ行った。1つ目は「迷路のゴールの経路探索」、2つ目は「PSOモデルへの導入」である。それぞれにおいて揺らぎを導入することで導入していないものと比較して効率が良くなったことが確認できた。
Axelrod の流布モデルとは 1997 年にアメリカの政治学者であるロバート・アクセルロッドが発表した文化の広がりを表すモデルである。本研究では文化が根付くためには時間がかかると考えて文化の流布モデルの実験を行ったので報告する。また、文化の流布が起こる確率にゆらぎを加えた実験も行った。実験の結果、時間遅れが避けられない場合、文化の数を最小にする時間遅れがあることが示された。
本研究ではマルチエージェントモデルの集団形成について考える。各エージェントは多次元の特徴ベクトルを持ち、特徴ベクトルが一様分布、半正規分布、Levy分布、べき分布の特性を持つ状態で集団形成を行う。またエージェント同士が自由空間上で出会い、取引を複数回行い各エージェントの特徴ベクトルに偏りがある状態で集団形成を行う。
集団形成は自由空間上で異なる2つのグループが出会ったとき、グループの相性が良く特定の閾値よりも高くなれば2つのグループは1つのグループに統合される。
本研究では閾値を変動させ、特定の閾値におけるグループの満足度より特徴ベクトルの特性における集団形成の差異を考察する。
社会事象による人々の行動変化のモデル化の端緒として,エージェントベースモデルを用いたCovid-19拡大後のテレワーク実施率の予測モデルを提案する.モデルでの算定結果と実測値を比較することでより長期の予測への適用にあたっての課題を考察する.
フードバンクは,様々な理由で販売できない食品を安価/無料で受け取り,様々な理由で食品を必要とする人に提供する施設である。フードバンクでは企業から受け取った食品を他の施設に対して分配する事があるが,そのような施設の多くでは現在手動で食品分配計画を決定している.分配計画の自動化を行う事で,食品ロスや分配コストの削減を見込む事ができる.フードバンクにおける食品分配計画は複雑であるため,既存手法の単純な適用では実用的なシステム設計は難しい.本研究では,局所探索アルゴリズムを用いた食品分配最適化手法を提案し,実環境に近い内容の実験を通してさらなる改善や性能評価を行う事を目指す.
休 憩(14:45 再開) 座長 塩谷 勇(法政大)
D-1-7 |
ペアボットモデルによる洞窟あり物体充填被覆アルゴリズムついて
◎笠原朋哉・金 鎔煥・片山喜章(名工大) |
D-1-8 |
仮想グリッドネットワークにおける1故障状況の経路最適化分散アルゴリズムについて
◎小柳祐輔・金 鎔煥・片山喜章(名工大) |
D-1-9 |
方向感覚を持たない3組のペアボットで一定の方向に直進させ続けるアルゴリズムについて
◎加藤 奏・Yonghwan Kim・片山喜章(名工大) |
D-1-10 |
Modified VNS for Solving QUBO Problem
○Dhidhi Pambudi・Masaki Kawamura(Yamaguchi Univ.) |
D-1-11 |
輪番詰込の密度閾値について
○河村彰星(京大) |
D-1-12 |
Finding a Shortest Solution for Single-Player Chinese Checkers is NP-complete
Yuya Nakamura・○Yasuhiko Takenaga(The Univ. of Electro-Communications) |
自律分散ロボットシステムとは, 多数の移動可能な計算端末(以下,ロボット)で構成された分散システムである.このシステムは,各ロボットが与えられたアルゴリズムに従って互いに協調しながら動作することで,与えられた目標を達成する.ペアボットモデルは,予め決められた2 台のロボットがひとつのペアとなって動作する自律分散ロボットシステムのひとつのモデルである.本研究では,既存の物体被覆問題を拡張した洞窟あり物体の充填被覆問題を解決するアルゴリズムを提案する.既存研究では被覆対象の障害物に幅1の洞窟が存在する場合それを避けて物体被覆を行うが,本研究ではその洞窟内部もロボットで充填しつつ物体被覆を行う.
仮想グリッドネットワークとは,無線ネットワークを一定領域(セル)ごとに区切り,各領域でひとつの代表ノード(ルータ)を決定し,隣接する領域のルータ同士を連結させた仮想的な格子状のネットワークである.仮想グリッドネットワーク上でのノード間の通信は複数のルータを介して行われる.仮想グリッドネットワークでは,ターゲット(宛先のノード)が異なるセルに移動した場合,現在の通信経路を井田応先のセルまで延長することで容易にターゲットまでの経路を維持できるが,このような延長を繰り返すと経路が冗長になる可能性がある.本研究ではこの冗長な経路を,ネットワーク上の特定のひとつのルータが利用不可である場合でも接続性を保持したまま最適化できるアルゴリズムを紹介する.
本研究では,視野1のペアボットモデルを用いて,方向感覚を持たない場合でもその形状から方向に合意を持たせることで一定の方向に直進させる手法を考える.方向感覚を持たないロボットを一定の方向に移動させる問題は,終了探索問題,無限探索問題,巡回問題などの解決における最も基本的な課題である.本研究の成果として,2組のペアボットでの不可能性を示し,3組のペアボットでのアルゴリズム,つまりペアボットの数の点で最適なアルゴリズムを提案する.
Since QUBO problems are categorized as NP-hard, metaheuristic algorithms such as VNS are often chosen to solve them. However, the basic VNS algorithm takes a long time. Therefore, the neighborhood structure using the Binomial distribution is proposed. Several QUBO and max-cut problems were used to investigate the impact of changing neighborhood structure on the number of local searches. The results show that the proposed method reduced the number of local searches while preserving the solution quality. Moreover, as the number of local searches is proportional to time, the proposed method can be an alternative to speed up the computation time.
幾つかの仕事があり、各仕事について○○日に一度以上は行うべしという日数が指定されている。毎日いずれか一つだけ仕事をして、これを満し続けたい。これができるためには、指定された日数の逆数の和が1以下である必要があることは明らかである。逆に十分条件として、この逆数和が6分の5以下であれば必ずできる、と陳・錢(1992)は予想していた。この予想が示されたので報告する。有限個の場合のみを調べれば良いことを証明し、その有限個について計算機で調べ尽した。
Chinese Checkers is a strategy board game played by at most six players on a hexagram-shaped game board. Chinese Checkers with slightly different rules is called Diamond Game. In this paper, we consider a single-player version of Chinese Checkers played on arbitrary graphs. We prove that it is NP-complete to find the shortest solution of the game.
D-2. ニューロコンピューティング
3月18日 9:00〜9:45 Meeting 28 座長 西田知史(NICT)
D-2-1 |
ランダムノイズ蒸留法によるCNNモデルの高精度化
○平田大貴(岡山県工技セ) |
D-2-2 |
テーマパークにおけるRNNによる待ち時間予測と訪問経路生成
◎日高 潤・平出蓮太郎・臼杵 潤(神奈川工科大) |
D-2-3 |
カオスニューラルネットワークリザバーにおけるオンライン学習則の評価
◎石井 豪・堀尾喜彦(東北大) |
蒸留とは、規模の大きい高精度モデル(教師モデル)の出力を用いて、規模の小さなモデル(生徒モデル)を学習させる手法である。この学習法を適用することで、学習にデータのみを用いる従来の手法に比べ、生徒モデルの推定精度が向上することが知られている。
本稿では、ランダムノイズを用いた蒸留により、CNNの推定精度を向上させる手法を提案する。これにより、生徒モデルの推定精度が従来の蒸留法で学習させたものより高くなることを示す。
近年,スマートフォンなどの携帯端末の高性能化とともに,イベント会場やテーマパークなどと連携可能な各種サービスが展開している.そして,施設の混雑予想や現在待ち時間情報の提示などは利用者の行動計画支援にも繋がっている.このような中,深層学習による時系列予測研究が進んでいる点にも着目し,本研究ではRecurrent Neural Networkによるテーマパークの施設待ち時間予測と,これを活かした複数施設の最短訪問経路生成について検討する.
我々は,忘却を軽減するオンライン学習則[1]を複数提案し,カオスニューラルネットワークリザバー(CNNR)に適用している.本稿では,提案した学習率更新法を用いたCNNRによる離散単語認識のシミュレーション実験により,提案則の有効性を評価する.
D-3. ソフトウェアサイエンス
3月15日 13:00〜14:00 Meeting 39 座長 林 晋平(東工大)
D-3-1 |
C言語ソフトウェア資産を活用したRust言語への変換及びリファクタリング手法
○都築将仁・川嶋大樹(三菱重工) |
D-3-2 |
プログラミング教育支援のための汎用プログラミング言語サブセットの作成手法の検討
◎長谷健汰・佐々木 晃(法政大) |
D-3-3 |
エージェントシミュレーションのためのノードベースビジュアルプログラミング環境の試作
◎村井菜那子・佐々木 晃(法政大) |
D-3-4 |
リファクタリング可視化ツールの提案および実装
◎吉 祥・篠埜 功(芝浦工大) |
近年、メモリ安全性を確保し脆弱性混入を防ぐプログラミング言語が注目されており、IT企業のアプリ開発や国内研究機関のシステムでRust言語の利用が始まっている。しかし、Rust言語でのスクラッチ開発は開発コストがかかるため、既存プログラム資産を生かした効率的な開発手段をとることが望ましい。
そこで本研究では、C言語コードをRust言語コードへ変換するオープンソースC2Rustを利用して、既存C言語コードの変換後コードに対し、よりセキュアなコードとなるためのリファクタリング手法を追加した開発方法を提案した。提案した手法を制御システムソフトウェアへ適用した結果と今後の課題について報告する。
プログラミング初学者が,汎用言語の知識を習得する際には,その言語処理系を用いて学習を進める.しかし処理系は,学習者が誤ったプログラムを記述した際に,未学習の内容に関連したメッセージの表示や処理を行うことがあり,学習者にとってはそれらの解釈が難しい場合がある.そこで,学習内容に合わせて使用できる機能を制限することで,未学習の内容に関する間違いを防ぐことができ,初学者の学習支援に有効であると考えられる.先行研究では,学習内容の例題をもとに言語サブセットを自動生成するアルゴリズムを開発し,Pythonを用いた支援ツールを開発した.本研究では,先行研究の適用範囲に加えて,オブジェクト指向機構を学習する際に必要となる言語サブセットの作成を目標とする. 先行研究の方法に加え,使用できる言語機能の制限を指定する方法を検討し実装を行った.
現在,コロナ禍の影響などにより感染症シミュレーションが活発に行われている。このような社会状況をシミュレートする方法の一つに,エージェントシミュレーション(Agent Based Simulation以下ABS)がある。ABS構築環境はこれまでにも開発されているが、既存ツールの多くがテキストベースによるプログラミングが必要となるため学習コストが高い。シミュレーションを行う専門家の多くは非プログラマーであるため既存ツールより容易にABSを行える環境が必要である.
本研究ではABSのソースコードを理解や学習が容易なノードベースビジュアル言語を用いて記述できる環境のプロトタイプを開発し、その基本性能を確認した。今後はプログラミングの視認性や容易さの改善について研究を行う必要がある。
ソフトウェア開発において、ソースコードの変更、機能の追加やバグの修正などを行う時など、コードレビューは頻繁に行われる。しかし、特にプログラミングの初心者にとって、コードレビューは時間がかかる。
Githubはソースコードの変更履歴を保存したり、追跡したりすることができるウェブサイトである。しかし、Gitのdiffを利用するとき、Githubの画面は2つに分かれる。左側は変更前のソースコードを表示し、右側は変更後のソースコードを表示する。この画面において、削除された部分は赤、追加された部分は緑で表示される。ソースコードには削除と追加以外に移動もある。本研究では、移動部分にも色を付ける可視化ツールを提案する。提案したツールは言語に依存しない。
D-4. データ工学
3月15日 13:00〜16:00 Meeting 43 座長 吉田尚史(駒澤大)
D-4-1 |
ニューラルネットワークを適応した著作権の例外部分文章の抽出
○江口航野・横山昌平(東京都立大) |
D-4-2 |
データ分析方法の自動生成比較による分析効率の向上方法
○山本太三・角田 愛・森谷高明・西尾 学・三好 優(NTT) |
D-4-3 |
スポットにおけるアーティストの話題性抽出による多様な曲推薦
◎△林 伸宇・河合由起子・栗 達(京産大) |
D-4-4 |
他言語学習におけるフレーズの多様なニュアンス抽出手法の提案
◎△中辻佑弥・栗 達・中島伸介・河合由起子(京産大) |
D-4-5 |
論文タイトル作成支援のための重要文抽出手法の提案
◎松本 陸・木村昌臣(芝浦工大) |
近年、ビックデータの一部としてニュース記事は様々な分野で活用されている。しかし、これらニュース記事は著作権法によって保護され、公開されているケースは極めて少ない。
そこで、本研究では著作権法第10条2項に注目し、例外として著作権が及ばない「実の伝達にすぎない雑報及び時事の報道」部分を、ニューラルネットワーク(NN)によるモデルを用いて抽出する手法を提案する。原文の日本語での特徴量に加えて、自動翻訳によって取得した英語翻訳文を特徴量とすることで、学習データが少なくとも高い精度での著作権の適応外である部分文章の抽出できるモデルを作ることを可能とした。これにより、報道で得られた情報の利用可能性を高める。
現在は価値観が多様化し,あるデータから導き出される意味が他の人にとっては別の意味となることがある.本稿では複数の観点の分析方法を自動的に生成し比較することで,人によって判断が分かれるような難しいデータを優先的に抽出し,分析の効率を向上させる分析技術を検討した.
本研究は、自分の好みの曲ばかり聴くことによるフィルターバブル現象を防止するために、ユーザに新たな曲を推薦するシステムを提案する。推薦する曲は、ユーザが興味を持ちそうな曲で普段聞かない曲、現在地で話題となっているアーティストの曲、状況に合った曲これら三つの要素を含んだ曲である。提案手法として、ユーザには目的地を選択してもらい、サーバ側は経由スポットと経由スポットで話題となっているアーティスト抽出する。その後、ユーザプロファイルから好みのアーティストを抽出し、学習モデルを生成する。最後に話題のアーティストの曲と好みのアーティストの特徴の類似度を求め類似度の高い楽曲を推薦する。
グローバル化は益々進んでおり,ビジネスパーソンにとって重要な知識やスキルについて回答企業の8割が英語を選択しているが,日本人の他言語能力は他国に比べ非常に低く,他言語学習は重要な課題である.
本研究では他言語にない表現や,内容によって意味の選択が難しいフレーズをニュアンスを含むフレーズとして抽出する手法を提案する.ニュアンス変換されているフレーズを提供することで,他言語表現変換の学習効果が期待できる.
今後,候補となるフレーズを見つける際に含まれるノイズの除去方法の検討および本手法による学習効果の検証を行う.
論文執筆の経験がない人にとってタイトルをつけることは難しい.執筆経験が浅いと自分の行った研究内容をタイトルとしてどのように適切に表現すべきかわからないからである.適切なタイトルをつけるには自分の研究を端的にまとめる必要があり,そのためには最初の段階として,研究目的や用いた手法などの要素を同定する必要がある.文章から文を抽出する手法として Rada Mihalceaはグラフ構造を用いた教師なし学習を提案している.しかし,この手法ではタイトル作成に重要な文が残せるとは限らない.そこで,本研究では論文タイトルの作成の支援のため,概要から重要な文を抽出する手法を提案する.
休 憩(14:30 再開) 座長 鷹野孝典(神奈川工科大)
D-4-6 |
一般化逆ガウス分布の十分統計量を用いた降水種判別可能性
◎河合美樹・椎名 徹(富山高専)・太田 守(金沢大) |
D-4-7 |
射出成形機における間欠不良の発生原因の解明
◎高田雄介・三木良雄(工学院大) |
D-4-8 |
目次の分散表現による類似図書推定手法の一検討
○関 亜紀子(日大) |
D-4-9 |
発話動作特徴と音声情報を用いたマルチモーダル話者認識手法の提案
◎土屋ゆり・木村昌臣(芝浦工大) |
D-4-10 |
Random Walk の非同期処理における Random Early Detection を用いた自律的輻輳制御機構
◎滝沢 駿・金子晋丈(慶大) |
D-4-11 |
ハイパーグラフにおける追加エッジのサイズがグラフの調和中心性に与える影響の評価
○藤井洸太朗・金子晋丈(慶大) |
降水粒子はその粒子種によって含水量, 質量密度, 抗力係数などといったパラメータが大きく異なることから,粒径と終端落下速度の観測頻度分布をもとに降水種を分類できる可能性がある. 本研究では, 粒径-落下速度分布の十分統計量を用いて降水粒子種判別を試みた.
現在普及されているプラスティック製品の多くは主に射出成形機で作成されている.射出成形機とは,プラスティック素材を熱で溶かして,金型に高圧で流し込み,急冷することにより製品を整形する機械である.この射出成形機が量産段階に入り,良品が多発している中に,時々不良品が混ざるという間欠性のある不良品が発生することがあり問題となっている.本研究では,射出成形機における間欠性の不良品の原因を特定することである.そこで,構造方程式モデリングというデータ分析手法を用いて,考えられる仮説からパス図を作成し,不良品発生の因果関係を推察した.その結果,プラスティック素材の乾燥度合いが影響していることが明らかとなった.
図書館のOPACなどでの資料検索においては、目的の図書が明確にある場合はタイトルやISBNなどで容易に検索することができる.一方、漠然としたテーマでの資料検索などにおいては、適切な検索語を想起し、これらの機能を有効に活用することが難しい.そこで、対話形式による検索支援を想定した検索結果の絞り込みを支援するための関連語の抽出手法と、類似図書の推定手法を検討している.ここでは、BOOKデータベースで提供される目次データに着目し、その分散表現と検索での活用方法を考察する.
マルチモーダル話者認識⼿法では,視覚情報として発話動作の中で特に明確なものである唇の動きが利⽤されることが多いが,話者が背を向けているときなど必ず得られる情報である保証はない.⾸の動きや⾝振り⼿振りなどの体の動きは,その⼈物がどのような向きであれ,映っていれば得られると共に話者認識可能な視覚的情報であると考える.そこで,本研究は人間の発話動作映像と発話音声の同期によるマルチモーダル話者認識手法の提案を行うことを目的とする.
ある頂点近傍のグラフ解析において, 開始頂点を指定した Random Walk (RW) は有用である. グラフが複数サーバで分散管理された環境において, 任意個の開始頂点からそれぞれ任意のタイミングで RW を実行することを想定し, 非同期型のシステムを選択した場合, 開始頂点毎のバースト的な Random Walker (RWer) 生成による輻輳と破棄が発生し, 追加実行による実行時間の増加が課題になる. そこで本稿では, RW の非同期処理において, 各サーバが RWer の流量を自律的に調整する機構として, 自律的輻輳制御機構を提案する. 本機構は サーバでの RWer キュー管理, 輻輳検知, RWer 生成速度調整を組み合わせ, 輻輳を初期段階のうちに検知する. 評価の結果, 本機構の導入により, 実行時間の短縮, 低 RWer 廃棄数が達成されることがわかった.
ハイパーグラフのオープンな利活用が実現される環境下では,各利用者が1つのハイパーグラフに対して自由にハイパーエッジを追加する状況が想定される.しかし,サイズの大きいハイパーエッジが追加されてしまうと,中心的なノードの特徴量が失われてしまう可能性がある.そこで,本研究では実世界ハイパーグラフに対して,擬似的に様々なサイズのハイパーエッジを追加し,追加した前後の調和中心性の値を比較することで,エッジサイズの大きさがどの程度特徴量の変化をもたらすのかを検証した.調和中心性はどのノードからも距離が近いと高くなり,中心的なノードの特徴量を測るのに適している.評価結果として,エッジサイズの増加に伴い,中心的なノードの特徴量は変化することが明らかとなった.
D-5. 言語理解とコミュニケーション
3月17日 13:00〜15:30 Meeting 43 座長 嶋田和孝(九工大)
D-5-1 |
言語モデルを用いた帳票文書からの情報抽出の改良
○馮 思萌(東芝デジタルソリューションズ) |
D-5-2 |
GiNZAを用いた詐欺文書からの重要部分の抽出
老川雄貴・○△八槇博史(東京電機大) |
D-5-3 |
グラフ畳み込みネットワークを用いた推理小説の犯人推定
○勝島修平・穴田 一(東京都市大) |
D-5-4 |
Transformers型システムのモデル種別による文書生成精度の比較
○△老川雄貴・八槇博史(東京電機大) |
近年、言語モデルを用いて請求書のような帳票文書から必要な情報を自動抽出する技術が注目を集めている。しかし、帳票文書には番号や金額などのそれ自身に言語的意味を持たないフレーズが多数含まれている、氏名や会社名など似た意味を持つフレーズが複数出現する、などの課題があり、言語特徴のみでは適切な抽出を行うことが難しい。本稿では、記号列に特殊な変換を加えることでより適切な言語特徴を取得する手法や、言語特徴の他に位置特徴を利用して帳票文書から情報を抽出する手法を提案し効果を検証する。
日本語の自然言語処理技術の中でも文書判別は高精度である. しかし, 詐欺などの特殊文書の判別は不得意である. その原因の一つとしてコンピュータが詐欺と判断する基準が不明であることが挙げられる.
本研究では文章中の重要度を算出し, 重要度が高い文章の抽出を行うことでコンピュータが文書を判別する基準を探り, 考察を行う.
近年, 機械学習への社会的な期待が高まっている一方, 専門家でも推論過程に対して説明を与えられない解釈可能性が問題となっている. 既存研究では, 単語の意味を学習するために埋め込みに基づいた手法が提案されているが, 小説上の場所, 時間, 対象物などの同時性を考慮できていない. そこで本研究では, トリプルごとの学習を行う手法ではなく, GCNを用いてグラフの構造関係をそのまま学習し, 重要となるグラフの関係をLRPによって明らかにすることによって犯人推定を行う手法を提案する. 実験の結果, 追加知識とLRPによる貢献度の伝播によって対象となる小説の, 犯人推定までの過程を終えることを確認した.
日本語の自然言語処理技術は大きな発展を見せている. 言語モデルの種類も増加し, 個人が選択して使用することができるようになった. 高精度な文章生成を行うには, 使用する目的に応じた言語モデルの選択が重要となる. しかし, 異なる言語モデルの生成文を比較し, 考察しているものは少ない.
本研究では文章生成に適した言語モデルの検討のために, 抽出型モデルと抽象型モデルで文章生成の精度を比較して考察を行う.
休 憩(14:15 再開)
D-5-5 |
オンラインショッピング支援を目的としたレビュー動画特徴量分析手法の提案
◎山口史弥(京産大)・上田真由美(流通科学大)・中島伸介(京産大) |
D-5-6 |
レビュー分析に基づく学生向けモバイルアプリケーションデザイン
◎大久保汐音・中島 誠(大分大) |
D-5-7 |
Dementia Detection Using Two Perplexities Methods with Part-of-Speech Tags
◎Chuheng Zheng・Mondher Bouazizi・Tomoaki Ohtsuki(Keio Univ.) |
D-5-8 |
健診データにおける検査値の予測手法に関する一検討
○森田裕也・中野絢平・山崎 恭(北九州市大) |
D-5-9 |
Twitterにおけるオンラインゲームの民度推定に関する一検討
◎浅沼龍太(工学院大)・藤井陽平(MIT Sloan)・坂野遼平(工学院大) |
近年,オンラインショッピングの利用者が増えている.しかし,オンラインサイトでは実店舗と異なり,商品を手に取って確認することができないというデメリットがある.そこで,商品を購入したユーザが投稿するレビューを参考にすることが一般的である.また最近では,レビュー動画の投稿数も増えており,従来のレビューよりも使用感をより的確に把握できることから,これを参考にするユーザも増えている.そこで我々は,オンラインショッピング支援を目的とし,ユーザがどのレビュー動画を閲覧すべきかを把握しやすくするためのレビュー動画推薦システムの開発に取り組んでおり,本稿ではオンラインショッピング支援を目的としたレビュー動画特徴量分析手法の提案を行う.
オンライン配信されるアプリケーションに関して寄せられるレビューは,ユーザからの貴重な要求情報を含んでいる.本研究では,レビュー分析の結果を実際のアプリケーションのデザインと照合しながら成功要因を分析・勘案し,新しいデザインを構築する手法の確立を目指している.本発表では,複数の大学が導入している,学生向けモバイルアプリケーションに対するレビューを対象に手法を適用し,学生がアプリケーションに要求するデザインや機能の新たな指標の作成に寄与することを示す.
Alzheimer’s disease is a kind of dementia that causes problems with memory, thinking, and behavior. Using automated computational methods to detect dementia is receiving attention for its affordable cost, fast screening, and non-invasive process. Conventional two perplexities methods utilize language models and their perplexity difference to detect dementia. Previous work confirmed that two perplexities methods detect dementia by evaluating the lexical frequency of the vocabulary in patients’ speech. However, human speech is composed of both vocabulary and grammar/sentence patterns. Our work proposes to incorporate part-of-speech (PoS) tags in the two perplexities methods to eliminate the influence of lexical frequency and show that grammar/sentence patterns help distinguish dementia patients from healthy subjects in the two perplexities methods.
近年,超高齢社会における平均寿命と健康寿命の差(寿命ギャップ)が,憂慮すべき深刻な問題となっている [1].健康寿命を延ばすには,健康を損なう前に対策を講じる必要があるが,現在,個人の健康状態に関する最も基本的なデータである健康診断データ(以下,健診データ)を活用し,将来の健康状態を予測して病気の発症前に対処しようとする動きが活発化している.そこで,本研究では長期的かつ大規模な健診データを解析して個人の将来の健康状態を予測することを目的とし,複数のアプローチに基づき健診データにおける検査値の予測を試みた結果について報告する.
ゲームの利用者のモラルには差があり,健全なゲームを選ぶために「民度」という概念には需要がある.よってTwitterのオンラインゲームに関するツイートから民度を推定することを目的とした機械学習を用いた民度推定手法を提案する.ハッシュタグ付きツイートを,TwitterAPIを用いて収集し,クラウドソーシングを用いて正解データを作成,RNNによるテキスト分類を行った.評価は混合行列の適合率,再現率,F1を用いて行った.
D-6. コンピュータシステム
3月17日 13:00〜16:00 Meeting 42 座長 井口 寧(北陸先端大)
D-6-1 |
PC-FPGA共有ネットワークにおけるプロセスマイグレーションの実装
◎△高野恵輔・尾崎 亮・上嶋 明・小畑正貴(岡山理科大) |
D-6-2 |
オープンソース高位合成ツールの調査と評価
◎小倉幹也・市川周一(豊橋技科大) |
D-6-3 |
気象データとLFSRによる乱数生成手法の検討
◎千葉歩武・市川周一(豊橋技科大) |
D-6-4 |
ストカスティック数複製器の回路構成に関する検討
◎東海林拓人・市川周一(豊橋技科大) |
D-6-5 |
ソフトプロセッサComet における専用命令拡張方法の検討
◎板東伸彦・市川周一(豊橋技科大) |
D-6-6 |
命令レジスタファイルによる RISC-V セキュアプロセッサの検討
◎米澤颯真・藤枝直輝(愛知工業大) |
システムタスクの増加に伴い、システム毎の適切なプロセス分散やマイグレーションが求められている。
ソフトウェアマイグレーション手法については盛んに研究が行われているが、ハードウェアに対してマイグレーションを行う研究事例は少ない。
そこで、FPGAなどのデバイスに対してマイグレーションを行うハードウェアマイグレーション手法を提案する。
これまでに我々は、リングネットワークを形成したFPGA による分散処理、マイグレーションを実現している。
本研究では、Ethernetを経由したFPGA プロセスマイグレーションを実現するために、PC における通信シーケンスを実装する。
山田らは,LLVMベースの難読化ツールoLLVMで難読化したLLVMベースの中間言語を,LLVMベースの高位合成ツールであるLegUpに入力し,難読化されたハードウェアの生成に成功した.しかしLegUpは買収され研究用途で利用できなくなった.本研究では,2021年現在利用可能なオープンソース高位合成ツールを調査し,今後の研究に使用可能なツールを選定した.評価の結果, LegUpの置き換えとしてBambu0.9.6とVitis HLS 2021.2が有望であることが分かった.
真性乱数 (TRN) の生成には物理現象等のエントロピー源を必要とする.本研究では,気象観測データをもとに乱数の生成を試みる.風向データから乱数を生成する際,データ量や乱数性の不足を補うため,鴨狩らの手法を組み合わせて用いた.具体的には,LFSRのサンプリング間隔を風向データにより変えることで,乱数列を生成した.簡単なハッシュ関数も併用することで,得られた乱数列はDiehardテストとNISTテストを通過した.
ストカスティックコンピューティング(SC)では,ストカスティック数(SN)を用いて計算を行う. 本研究では,回路面積を抑えるために, 1つの線形帰還シフトレジスタ(LFSR)を複数のストカスティック数生成器(SNG)で共有する際,ランダムビット列を循環シフトさせるより, 上位下位を反転する方がSCCの平均が小さくなることが分かった(10ビットの場合約25%になる).また, 一般的なコンパレータとminimum probability conversion circuit (MPCC) を比較すると,コンパレータよりMPCCのほうがSCCの平均が小さくなる(10 ビットの場合約73%になる).
坂本らはMIPSの命令セットシミュレータであるSPIM-likeを自作して,CHStoneベンチマークの一部の関数をソフトプロセッサの専用命令として実装した.しかし商用アーキテクチャでは,研究上の使用に制約が生じる.そこでオープン標準であるRISC-VアーキテクチャのソフトプロセッサCometに専用命令を追加し,SPIM-like の代わりにComet を評価基盤として使用できるか確認した.実装の結果,論理規模は同程度で,レイテンシは増大したが,先行研究と同じく専用命令をComet に実装することに成功し,SPIM-likeの代わりにCometを評価基盤として使用できる目途が立った.
本研究では,命令レジスタファイルを用いた命令難読化における,RISC-Vに適した実装方法について検討する.
先行研究で対象としてきた固定長命令のアーキテクチャとは異なり,RISC-Vは圧縮命令セットをもち,32ビット通常命令と16ビット圧縮命令がプログラム中で混在可能である.
そのため本研究では,圧縮命令を含む場合の命令の出現頻度の調査と,圧縮命令に対応した命令レジスタファイルの試作を行った.
その結果,固定長命令のアーキテクチャの場合と少なくとも同程度の効率で命令難読化が実現できる見込みが得られた.
休 憩(14:45 再開) 座長 藤枝直輝(愛知工業大)
D-6-7 |
モデル分散深層学習へのApproximate Computing適用に向けた初期評価
○菅 真樹・中村 太(リトルウイング) |
D-6-8 |
汎用神経回路シミュレータNESTのGPUによる高速化の検討
○寺西勇裕・置田真生・伊野文彦(阪大) |
D-6-9 |
監視プログラムのデバッグレジスタ利用をAPから隠蔽する手法の比較評価
◎仲村亮祐・山内利宏(岡山大)・佐藤将也(岡山県立大)・谷口秀夫(岡山大) |
D-6-10 |
I/O処理効率を向上する分離型SDS向けメタデータ管理方式の提案
◎江原寛人・大平良徳・斎藤秀雄(日立) |
D-6-11 |
シングルボードコンピュータ上でのSAS認証方式の計算時間の評価
◎荻田高史郎・甲斐 博・王 森レイ・高橋 寛(愛媛大)・清水明宏(高知工科大) |
深層学習では、自然言語タスクなど大規模モデルの学習処理が課題になっている。大規模モデルの学習を行う ためには、単一の計算機や GPU などのアクセラレータ の演算性能やメモリ容量が限られているため、複数の計 算機・アクセラレータを利用した分散深層学習が行われ ている。分散深層学習を実現する方法としては、データ 並列やモデル並列処理が挙げられるが、大規模モデルを 学習するためにはモデル分散処理が必要とされている。
本稿では大規模モデルの学習や推論の高速・省電力化のため、Approximate コンピューティングを用いたモデル 分散処理の提案を行う。その第一歩として、Approximate コンピューティングの例として、NW転送部 分に誤差を許容する Approximate ネットワーク を適用した際の学習精度への影響や学習処理時 間について初期評価を行う。
本研究は,スパイキングニューロン網シミュレータNESTを対象に,GPU実装による高速化の可能性を検討する.提案手法は,NESTのボトルネックであるシナプス可塑性計算のみをGPUにオフロードする.高速化の課題は,GPUとホスト間とのデータ転送である.提案手法は,転送するデータにおける重複の回避およびデータ構造の変換により,データ転送量および回数を削減する.GPUを用いた提案手法は,従来手法のCPU 1スレッドを用いた実行と比較して,可塑性計算において最大10.5倍,シミュレーションにおいて1.7倍の速度向上を達成した.
仮想計算機(VM)上の応用プログラム(AP)を仮想計算機モニタ(VMM)により監視する手法において,VM上のプログラムからの監視手法の検知や無効化を防止する必要がある.そこで,監視プログラムのデバッグレジスタ利用をAPから隠蔽する手法(隠蔽手法)である置き換え方式を提案した.本稿では,置き換え方式と既存の隠蔽手法である代理実行方式において,処理時間を比較評価した結果を述べる.
NVMe over Fabricsを活用したSoftware Defined Storage (SDS)としてストレージコントローラとストレージデバイスを分離した分離型SDSが提案されている。分離型SDSでは、ストレージデバイスを保持するエンクロージャにメタデータを格納し、ストレージコントローラが動作するサーバ間で共有することで迅速に負荷分散できるが、I/O処理時の通信が多いのが課題である。本稿では、サーバ上でメタデータを管理してサーバとエンクロージャ間の通信回数を削減し、I/O処理効率を向上する方式を提案する。提案方式は、通信をReadで4回から1回に、Writeで6回から3回に削減できる。
IoT機器とサーバ間のデータ通信においても改ざんや盗聴などの悪意をもつ第3者からの攻撃に備えることが必要不可欠になっている.本研究では,軽量なワンタイムパスワード認証方式SAS-2 の演算コストをさらに削減したSAS-L1やSAS-L2のシングルボードコンピュータ上での実装を行い,システムの実現可能性評価のための予備実験を行った.予備実験結果から,SAS-L2においては.目標通りエッジデバイス側の処理の軽減が実現できることを示した.
D-7. MEとバイオサイバネティックス
3月17日 13:00〜15:00 Meeting 28 座長 奥野竜平(摂南大)
D-7-1 |
遠隔支援型8K硬性内視鏡手術システムの開発-システム構成-
○太刀野順一・伊藤崇之・金次保明・山崎順一・比留間伸行・住吉英樹・亀田勝人・関 智春(NHK-ES) |
D-7-2 |
遠隔支援型8K硬性内視鏡手術システムの開発~5Gを利用した伝送実験~
○関 智春・伊藤崇之・金次保明・太刀野順一・山崎順一・比留間伸行・住吉英樹・亀田勝人(NHK-ES) |
D-7-3 |
膜電位波形に着目した心臓数理モデルの修正
◎阿部健登・北島博之・矢澤 徹(香川大) |
D-7-4 |
サーカディアンリズムに着目した心臓数理モデルの解析
◎山本悠貴・北島博之(香川大) |
D-7-5 |
色彩効果によるμリズムを用いたBCIの意思判読精度の検討
○大西真央・島田尊正(東京電機大) |
D-7-6 |
外傾インソールの装着が歩行時の足底運動に及ぼす影響
◎高橋栄一・嶌田 聡(日大) |
D-7-7 |
3次元歩行データからの上半身の動作特徴解析
◎横澤幸成・水野秀之(諏訪東京理科大)・北野哲彦・下里直子・翁 拓也・花岡健一(長野県工技総セ) |
D-7-8 |
歯科治療音の音質評価と心理調査
◎菅原亜純・今村 孝・中島 努(新潟大) |
ハイビジョンに比べて16倍の解像度を持つ8Kスーパーハイビジョン技術(8K技術)を医療に応用する取り組みを進めてきた。
開腹手術に比べて硬性内視鏡システムによる手術は患者への負担が少ないことから、そのニーズが高まってきている。一方で、映像を見ながら行う手術のため、手術の質が映像システムの解像度や画質の影響を受けやすいなどの課題がある。また、質の高い内視鏡手術を行える外科医師の地域的な偏在も課題となっている。これらの問題の解決に遠隔支援型8K内視鏡システムが寄与する可能性がある。
本稿では8K硬性内視鏡を使用した遠隔手術支援システムとその伝送実験について報告する。
超高精細映像システムである8Kスーパーハイビジョンは、放送のみならず医療分野など多様な分野での応用が期待されている。本稿では、8K内視鏡映像を第5世代移動通信システム(5G)網経由で遠隔地にリアルタイム伝送し、遠隔地からのアドバイスを受けながら手術を行う8K遠隔手術支援システムの有効性を動物実験で確認したので報告する。
現在用いられている心臓数理モデルは実際の動物から測定された膜電位波形とは明らかに異なっている箇所が見られる。
誤ったままのモデルでの解析では誤った結果を誘導しかねない。そのため本研究ではモデルの修正を行いより本来の膜電位波形に近づけ従来の解析結果との差があるか検証を行う。
近年、サーカディアンリズムと呼ばれる24時間周期のリズムと心疾患の関連性が示されている。本研究では心疾患の中でも不整脈について解析していき、ヒト心室筋細胞モデルを用いてサーカディアンリズムと不整脈の関係性を調査する。
人間にとってコミュニケーションは生活の中で必要不可欠である.
しかし,脊椎損傷や,ALSにより体が動かせず,コミュニケーションが困難になる場合がある.
現在,四肢を動かすことなく脳波等の生体信号を利用して機器等の制御を行う,BCIと呼ばれる技術に関心が寄せられている.
BCIに用いられる脳波波形の1つであるμリズムは運動イメージによって安静時と比べて抑制される.
過去の研究ではオドボール課題の刺激画像に特定の色彩を用いることでP300の検出精度が向上することが報告されている.
本研究では運動イメージを指示する画像の背景の色彩の効果を検証した.
その結果,緑色の背景でμリズムが他の色彩に比べ強く抑制されることが示され,BCIにおける意思分類の精度向上に有効である可能性が示された.
歩行や走行,および各種スポーツでの重心移動を伴う動作において,足底や下肢の機能の活用を向上させたり,負荷を低減させたりすることは運動のパフォーマンス向上や怪我の予防の点から重要なテーマである.これらを実現する方法として,オーダーメイドのインソールなどが開発・発売されている.外側に傾いているインソール(以下,外傾インソール)を装着することで片足接地時に生じる足関節のねじれを抑制できることから,著者らは外傾インソールを靴に装着する事に着目している.本稿では,外傾インソールを装着する事で生じる影響を検証するために,歩行動作を対象として,足底の圧力分布に及ぼす影響について分析する.
これまでの研究から,加齢が歩幅などの歩行特徴に影響を与えることが明らかにされている.加齢にともなう様々な症状も歩行特徴から判定できる可能性が高いことが推測されるが,これまで歩行特徴の取得に用いられているデバイスは高精度だが設置型で取り扱いも難しい.本研究では診療現場での利用も考慮し,可搬型のMicrosoft Azure Kinect DK(以下Kinect)を用いた歩行特徴の取得の検討を行った.脚部におけるKinectの歩行特徴の精度は既に先行研究で確認されているため,本研究では上半身の歩行特徴の算出方法を提案しViconを用いた場合と比較することでKinectの精度の評価を行った.結果として歩行特徴によって精度に大きな差があることが確認できた.
歯科恐怖症とは,歯科治療に強い不安や恐怖心を抱くことを指しており,全国で500万人の患者が推定されている.恐怖症患者の身体的・経済的負担を軽減する歯科治療方法の検討は重要であるが,患者間の症状の程度に合わせた治療を行うことの困難性や,臨床的な定義実態が不明確である.そのため,歯科治療方法や恐怖症自体の治療方法に関する研究は進められていない.本報では,恐怖症の発生要因の一つである「機械(切削)音」に着目し,歯科治療音への不安感や不快感の要因調査を目的として,周波数解析と心理音響評価量による客観評価を行った.また,機械音聴取に対する印象評価実験を行い,客観評価結果と主観評価との関連性を調査する.
D-8. 人工知能と知識処理
3月15日 13:00〜16:00 Meeting 32 座長 清 雄一(電通大)
D-8-1 |
Contrastive-learning による敵対的ドメイン適応
◎吾妻千織・下馬場朋禄・伊藤智義(千葉大) |
D-8-2 |
深層学習による連結車両の自動後退駐車能力の獲得
◎伊尾拓真・吉田章浩(成蹊大)・風間恵介(日大)・小方博之(成蹊大) |
D-8-3 |
ビールゲームにおける深層強化学習手法SRDQNの複数学習エージェント系への適用の検討
◎堀 真彰・松井俊浩(名工大) |
D-8-4 |
強化学習を用いた不完全情報ゲームにおける戦略分析
◎△阿部慎太郎・竹川高志(工学院大) |
D-8-5 |
ルール抽出による説明可能なファジィ決定木モデルの構築
◎阿部有希・長尾智晴(横浜国大) |
近年,ラベル情報を必要としない事前学習の方法として,Contrastive learning が注目を集めている.
大量のラベル付きデータを必要とする深層学習において,ラベル付けは大きなコストを要するため,
Contrastive learning は非常に魅力的な技術である.
また,既存の学習済みモデルを,別ドメインで得られたデータを用いて動作させたい場合がある.
一般的には,学習とテスト時のデータ分布が異なるため性能が低下してしまう.
この対策としてドメイン適応が使用される.
本稿では敵対的学習を利用して,Contrastive learning をドメイン適応のスキームに組み込む新たな仕組みを提案する.
連結車両は高度な運転スキルを要する。特に連結車両の後退駐車などでは普通自動車の駐車と異なるハンドル操作を要求され、経験の少ないドライバにとってハードルが高い。本研究では深層学習によるアプローチで連結車両の自動後退駐車能力を獲得できるか検証した。人間の操作データがある場合と、ない場合を想定し、それぞれで深層学習により能力の獲得を目指した。人間の操作データがある場合には、生成モデルの一種の敵対的生成ネットワーク (GAN)で学習し、人間の操作に近い自動後退駐車能力を獲得できた。人間の操作データがない場合には、深層強化学習手法の一種のDeep Deterministic Policy Gradient (DDPG)で学習し、GANには劣るものの一定の自動後退駐車能力を獲得できた。DDPGでの学習は報酬関数のさらなる改善の余地がある。
人工知能の研究分野の一つであるマルチエージェントシステムは,エージェントと呼ばれる自律的に意思決定する複数の行動主体から成る系を扱う.本研究では,各エージェントが周囲の状況に応じて試行錯誤的に環境への適応を目指すマルチエージェント強化学習の応用先として,サプライチェーンマネジメントに着目した.サプライチェーンマネジメントの例題として,ビールゲームを使用する.従来研究において,ビールゲームを解くために,深層強化学習手法のDQNを拡張したデータ駆動型のアルゴリズムであるSRDQN(Shaped Reward DQN)が提案された.従来研究では,4体のエージェントが行動するビールゲームにおいて1体のエージェントがSRDQNを用いた場合のみ評価されており,4体全てがSRDQNを用いた系については評価されていない.本研究では,SRDQNを拡張し,ビールゲームを複数の強化学習エージェントでプレイさせる系の制御を検討する.
プレイヤーに与えられる情報が部分的である不完全情報ゲームは,ゲームの複雑さとともに,隠された情報に確率が含まれるため,対戦相手の次の行動により適切な行動が変化する.ゆえに,対戦相手の行動を予測し意思決定を行う必要があるため,完全情報ゲーム以上に強いゲームAIの構築が難しい.本研究では,不完全情報ゲームの1つである「ハゲタカのえじき」を題材にし,強いゲームAIの構築を目指す.カードの枚数を5枚とする簡易化した環境において,強化学習を用いて特定の対戦相手に勝つことのできる戦略を学習することを繰り返すことで,ゲームの構造を理解し,戦略の優劣について考察を行う
ニューラルネットワークなどのブラックボックスな機械学習モデルは高精度であるが,判断根拠の解釈が困難な場合がある.そのため,医療や交通,金融など,意思決定に責任が伴う分野に機械学習を用いる場合,人間がその判断根拠を解釈できるような,「説明可能なAI (Explainable AI; XAI)」の研究が行われている.
一方で,専門的な分野における経験則知識や,感性情報に内包される曖昧な情報を定量的に扱う学問としてファジィ推論があり,決定木にファジィ推論を適用させたファジィ決定木の研究が行われている.本研究では,ファジィ決定木のアンサンブルモデルから重要なルールのみを抽出することで,従来のファジィ決定木より高精度かつ説明可能なモデルを構築することを目指す.
休 憩(14:30 再開) 座長 大囿忠親(名工大)
D-8-6 |
空間メモリを用いたマーカレス乳幼児行動評価システム
◎原 和江・Prasetia Utama Putra・坂田茉実・島 圭介(横浜国大)・島谷康司(県立広島大) |
D-8-7 |
6脚歩行ロボットによるボルダリング壁の登攀
◎鈴木利哉・長坂保典(中部大) |
D-8-8 |
遺伝的アルゴリズムによる消費エネルギーを考慮した移動ロボットの複数回通過を指定可能なオフライン経路生成方式の提案および実装
◎菊池敬裕・篠埜 功(芝浦工大) |
D-8-9 |
異なる神話間における神格同士の対応付け手法の提案
○西村達哉・荒川達也(群馬高専) |
D-8-10 |
双腕ロボットアームによる異種形状物体の効率的な箱詰め
◎小川一樹・長坂保典(中部大) |
D-8-11 |
双腕ロボットアームによる異種形状物体の認識と仕分け
○中野友裕・長坂保典(中部大) |
ADHDやASDは乳幼児から成人まで幅広くみられる発達障害であり,早期治療およびハビリテーションが重要である.発達障害の診断には質問票を用いた行動観察評価が主であるが回答者により結果が異なることが懸念され,児の客観的な行動評価が求められる.そこで本研究では,我々がこれまで提案してきた動画像解析による乳幼児行動評価法を発展させ,児の遊び状態に応じて刺激を与えた際の児の行動変容を評価する新しいシステムを提案する.発達障害児3名,定型発達児3名を対象に行った計測実験から音による刺激をフィードバックした際の行動変容に各群で違いがみられ,この違いが乳幼児の発達評価における重要な指標となる可能性が示唆された.
6 脚ロボットは高い走破性と安定性を持つロボットである。本研究では 6 脚歩行ロボットの不整地での移動や行動の幅を広げるために、シミュレーション上でボルダリング形式の壁の登攀動作を実現することを目的とする。
ロボットの家庭内利用は増加しているが,家事ロボットのバッテリー容量は限りがあり,消費エネルギー削減は大きな課題である。また掃除ロボットの場合,全ての場所を複数回通過することが要求される場合もある。遺伝的アルゴリズムを利用して,消費エネルギーを考慮した経路を生成することに関する研究が過去にいくつか提案されている。ただし,これらの研究では複数回通過を考慮していない。そこで本研究では,環境情報を持っている状況で,複数回通過に対応した経路生成を行う遺伝的アルゴリズムを提案する。提案手法に基づき,経路生成プログラムおよび生成された経路に従いRoomba643を動作させるプログラムを実装した。
本研究では歴史的変遷や地域的伝播など各種神話現象の数理モデルを用いた解析とシミュレーションを目標としている.今回はその第一歩として,異なる神話に属する神々(神格)の間の同一視(対応付け)を数理的に推測する方法を提案する.具体的には2つの神格の間に距離を定義し,距離の総和が最小になるように対応付けられると推定する.距離は,手動で作成したいくつかの対応付けを教師データとする遺伝的アルゴリズムにより求める.試作システムによりギリシャ神話とエジプト神話の8柱中3柱を正しく(=手動による対応づけと一致)対応づけることができた.今後は教師データを増やすなどして,対応づけの精度を上げていくことが課題である.
双腕ロボットアームの連携による物体の認識、把持、操作に取り組む。操作対象の形状を認識し、箱の空白が少なくなるように効率的に箱詰めする処理を実現する。
本研究では、双腕ロボットであるNEXTAGEに複数の紙パックに見立てた物体を把持させ、操作する動作を行わせることに取り組む。対象の物体は紙パックに見立てた剛体とし、箱の中に置かれている状態から箱の外へ移動させる動作を実現する。
D-9. ライフインテリジェンスとオフィス情報システム
3月17日 13:00〜15:45 Meeting 19 座長 小林 透(長崎大)
D-9-1 |
深度カメラを用いた見守りシステムの提案
○力武夏紀・佐当百合野・嶋田英樹(佐世保高専) |
D-9-2 |
SHAP based factors contribution order review in various classification models
○Pei Jiang・Takashi Obi(Tokyo Tech) |
D-9-3 |
欠席届申請システムの開発と申請データ可視化の取り組み
◎矢谷鷹将・山田 哲(香川大)・浅木森浩樹(リコー)・八重樫理人(香川大) |
D-9-4 |
スマートフォンで掲示板情報を整理するためのインターフェースデザイン
◎佐藤理子・中島 誠・佐藤慶三(大分大) |
D-9-5 |
動画像処理を用いたデータセンタ自動監視システムの開発
○Misheel Enkhbaatar・山﨑達也(新潟大) |
近年, 高齢化が進み介護施設利用者の増加と介護士の不足を受け, 高齢者の安全の確保と介護士の負担軽減を目的とした見守りシステムが多数提案されている. また, 見守りシステムを導入する場合には高齢者のプライバシーの保護, ストレスを軽減するためにも暮らしの質(QOL)を維持する必要がある.
以上より, 本研究では深度カメラを用いたQOLを維持する見守り方式を提案し, 画像の判別には学習モデルであるVGG16を用いた. また, その有効性を示すために深度情報のみでベッドでの寝姿, 着座, 腰掛け, 起立の計4つを判別し, 適合率の評価を行った. この結果, 本提案方式は高い適合率を達成し,有効性を示した.
Artificial Intelligence (AI) made a huge contribution to our daily life. However, the AI model is a black box, even though it has a good performance. Recently, explainable AI (XAI) research help us to understand the AI model. However, whether XAI really explains the model correctly is still unclear. Therefore, SHAP was used to explain 8 classification models in our study. The analysis results show that factors contribution order in different classification methods are different, while some factors which make the top or low contributions in all classification models were also found.
With/Afterコロナの社会構造変化に対応するデジタル変革(DX)が求められている.香川大学は2021年5月にDX推進戦略「デジタルONE戦略」を策定した.「デジタルONE戦略」は,「『リアル世界がデジタル世界に包含される(Online Merges with Offline)状況を香川大学が実現すること』で,教職員学生の協同によりデジタル化をこれまでにないレベルにあげ,教育,研究,運営の質的向上に加え,それぞれの業務の効率化を進めること」を目指している.香川大学はEUC(End User Computing)で注目されているMicrosoft Power Platform を用いて業務システムの内製開発に取り組んだ.本論文では,香川大学で内製開発され運用が開始されている欠席届申請システムの開発と,申請データ可視化の取り組みについて述べる.
大学が運用する情報システムの中で,多数の学生に必要な情報を発信する掲示板ツールの重要度は高く,学生の利用者も多い.ただし,学生のほとんどが利用するスマートフォン上で,掲示板情報が時系列順にリストアップされ,新しい情報が積み重なると,ユーザ(学生)が重要と感じた過去の情報を容易に確認することが難しいという問題がある.また,スマートフォンユーザの約50%が片手操作を行っていることから,片手での操作のしやすさも求められている.本研究では,片手で容易に操作できる,掲示板情報を整理するためのスマートフォン用インタフェースデザインを提案する.
データセンタ目視監視とは,データセンタで常駐するオペレータが電子機器のLED (Light-Emitting Diode)を目視により検査し,機器の正常な動作を確保するものである.オペレータは電子機器のLEDの色変化と点滅の頻度により,異常発生を検知する.本稿では,デジタルカメラや計算機などで構成される監視システムを提案する.提案するシステムの概要と,実際にデータセンタで行ったシステムの動作検証について報告する.
休 憩(14:30 再開) 座長 岡本 基(情報・システム研究機構)
D-9-6 |
科学研究費問い合わせチャットボットの開発とその効果
○椎木卓巳・山田 哲(香川大)・浅木森浩樹(リコー)・八重樫理人(香川大) |
D-9-7 |
5Gを用いた遠隔作業支援システムの評価
○山崎航史・大野千代・松田孝弘・池田直仁(日立) |
D-9-8 |
賃貸物件に関する周辺環境を考慮したPersonalized Scoring方式の提案
○須山瑠万・栗 達・河合由起子・中島伸介(京産大) |
D-9-9 |
聴講者の能動的参加を容易にするコメント管理システム
◎上田 拓・中島 誠(大分大) |
D-9-10 |
SDGsを目的とするメタバースにおけるフリーライダー問題
○清家彰敏(ハリウッド大学院大/富山大)・清家大嗣・清家由加里(東大) |
科学研究費の公募時期には,担当する部署へ科学研究費の公募に関する問い合わせが多数寄せられる.本研究では,科学研究費問い合わせ対応チャットボットを開発する.科学研究費問い合わせ対応チャットボットは,問い合わせに対して蓄積したナレッジをもとに回答するだけではなく,対応を記録することで担当者の引継ぎ業務の負荷を軽減する.本研究では科学研究費問い合わせ対応チャットボットの概要について述べるとともに,香川大学で運用した結果からその有効性について述べる.
世界に先駆けて人口減少・少子高齢化が急激に進行している日本では,労働力人口の減少,熟練者不足といった課題があり,生産性向上と共に非労働力人口の積極活用,熟練者の効率的な活用が求められている.日立はこれらの社会課題の解決と新たな価値提供に向け,現場と遠隔をつなぐリモートソリューションとして,遠隔作業支援システムを開発している.本報告では,超高速・大容量のデータ通信が可能な5G通信を用いた遠隔作業支援システムについて報告する.
賃貸物件探しをする際,多くのユーザが不動産・住宅情報サイトを利用している.従来の不動産・住宅情報サイトでは,賃料・広さ・築年数・間取り・駅までの距離等の条件に基づいた物件の検索が可能である.しかし,周辺の治安やバリアフリー環境といったニッチなニーズについては指定することができない.本研究では,ユーザの年齢・性別を含む家族構成や各々の趣味嗜好を考慮すると共に,周辺地域の環境を考慮することに基づく賃貸物件に対するPersonalized Scoring方式の提案を行う.
プレゼンテーションツールを使った学会やゼミ等での発表では,聴講者は発表スライドの見返しができないだけでなく,該当するスライドページに細かなメモや発表者への意見(フィードバック)などのコメントを直接記録することはできない.本研究では,このような聴講者側の不自由を軽減し,聴講者が「見るだけ,聞くだけ」にならずにより能動的に参加できるようにすることを目的として構築した発表スライド用コメント管理システム,コメントサポートについて述べる.
バーチャルリアリティは閉じた仮想空間で一人が体験するが、メタバースでは複数の仮想空間をネットワークし、複数のユーザーが異なる場所で利活用する。多数のユーザーの構想、企画、アイデアによってメタバースは素晴らしくもなり、利用されなくもなる。建築業界はセンサーや各種インフラ設備を連結、SDGsに適応した仮想空間をインターネット内にメタバースとして構築する。ネット上の他者の企画を借用するフリーライダー(free rider)が急増。SDGs化とAIの急増の未来におけるフリーライドの拡大はメタバース内において、検証困難なフリーライド企画が無数に登場する。メタバースにおけるSDGs企画の混乱の解決策としてブロックチェーンを提案した。
D-11. 画像工学
3月15日 9:00〜11:45 Meeting 38 座長 浜田百合(青学大)
D-11-1 |
物体検出システムによる被災箇所特定のための訓練データ拡張方法
宮部由衣・○岡部正幸(県立広島大) |
D-11-2 |
背景画像の改善によるアラゲキクラゲの認識精度の向上
◎西山凌央・松村 遼・北風裕教・田口 創(大島商船高専) |
D-11-3 |
光回折ニューラルネットワークを用いたDDHOE設計の検討
◎星 郁雄・涌波光喜・市橋保之・大井隆太朗(NICT) |
D-11-4 |
機械学習に基づくCPTM画像マッチングのための最適画素数推定手法の提案
◎澤木勇哉・江場さくら・中林尚也・秋月秀一・橋本 学(中京大) |
D-11-5 |
滞在時間測定のための時空間画像の色情報を用いた人物照合の検討
◎鈴木健永・香取照臣・泉 隆(日大) |
本研究では,災害発生時に撮影した画像から被災箇所,特に水害に被災した建物および車両の自動検出を深層学習ベースの物体検知システムを用いて行うことを目的とし,学習時に不足する訓練データを拡張するための方法について提案する.提案方法は,学習状態に応じてデータを増加させる選択的コピーやラベリング箇所をランダムに移動させるものなど6つの方法からなり,実験によりそれらの有効性を検証する.
近年,農業従事者の減少,高齢化が深刻な問題である.この問題を解決するため,我々の研究グループではアラゲキクラゲの自動収穫システムの開発を行っている.キクラゲの認識部は深層学習によって開発しており,3DCGを用いたData Augmentationにて生成した画像を学習させているが,CG画像のみだと認識率は低い.本研究ではCG画像と実写画像を併用した学習による認識率の向上を図りつつ,CG画像の背景情報の違いによる認識率の変動を調査した.結果,実写画像とCG画像の併用かつ,背景画像を3DCGで作成したCG画像を学習に用いた場合,認識率94%と非常に高い認識率を達成した.
光の干渉,回折を利用して物体から伝搬する物体光の複素振幅分布を記録・再生できるホログラフィと呼ばれる技術がある.DDHOE(Digitally designed holographic optical element)はホログラフィを利用した,任意の位相変調を実現する回折光学素子である.任意の位相変調を実現する位相分布を持つホログラムを記録することで作製できる.
DDHOEに記録する位相分布はこれまで所望の機能を持つ光学素子の物体光を光学設計ソフトなどで求めていた.本研究ではこの位相分布を機械学習により求める手法を提案する.基礎検討として,機械学習で求めた位相分布を空間光変調器に表示し実際に光学系を構築することで提案手法の有効性を確認した.
CPTM法はユニークな画素のみを用いる画素選択型のテンプレートマッチング手法であり,高速かつ高信頼なマッチングを実現している.
CPTM法における高速性は画素の削減率に比例し,高信頼性は選択画素数によって変化する.そこでさまざまな対象画像に対し,選択画素数と認識性能の関係を調査した結果,認識性能の上昇には一定の法則があることがわかった.本研究では実験から得られた法則性を基に最適画素数を定義し,さまざまな対象画像に対して最適画素数を推定する手法を提案した.
実験より,3種類の対象物に対して提案手法における最適画素数の推定成功率を求めた結果,40%~50%の確率で推定可能であった.
様々な施設などでマーケティング分析には個人の滞在時間の把握は重要な指標の一つである.滞在時間の測定方法には多くの施設に設置してある防犯カメラに着目し,得られる動画像を用い滞在時間の計測を行うことを考えている.
本研究は時空間画像を用いて少ないデータ容量で処理を行い,色情報のヒストグラムを用い入退室する同一人物の対応付けの方法を検討し,他手法との性能比較を行った.
本手法は他手法よりも高い精度で照合を行うことができたが、滞在時間の異常値への対応など今後はより高精度での照合手法の検討を行っていく.
休 憩(10:30 再開) 座長 秋月秀一(中京大)
D-11-6 |
Dilated ConvolutionとOctave Convolutionを組み合わせたセマンティックセグメンテーション
○古嶋拓斗・荒井秀一(東京都市大) |
D-11-7 |
深層学習によるトマトの病害検出に関する検討
◎小林亮太・菅原貫太(東京農工大)・初谷恵美子(東京農工大/横河電機)・清水郁子(東京農工大) |
D-11-8 |
単眼ワンショットカメラで撮影された画像中の人物の身長推定法の基礎検討
○武田利明・坂東幸浩・北原正樹(NTT) |
D-11-9 |
重合格子法を用いた全天球画像ビット深度強調
○森 勇介・井上光平・小野直樹・原 健二(九大) |
D-11-10 |
RGB 画像に基づく多階層型高次元分光画像推定システムの構築
◎茂木直人・浜田百合・栗原陽介・佐藤遼史(青学大) |
大小さまざまな大きさや形状の物体が混在しているシーン中から正しくセマンティックセグメンテーションの認識を行えるようにDilated ConvolutionとOctave Convolution を組み合わせ,マルチスケールの特徴を抽出できるアーキテクチャーを提案した.Deeplab V3+のモデルをベースとして提案手法を評価した.Octave Convolutionにより計算コストを削減した分チャンネル数を増やして実験を行い,この提案手法により得られた分類結果から,精度の向上が確認できた.
トマトの尻腐れ病が発生しやすい栽培条件を特定するために,ハウス内で撮影された画像からトマトの実を検出し,尻腐れ病にかかっているかどうかを自動検出する手法について検討する.
トマトの実の検出はYOLOv5の転移学習により行う.
このとき,尻腐れ病かどうかを区別せずに1クラスで検出してから検出されたトマトを分類する方法,YOLOv5での検出の際に尻腐れ病にかかっているトマトとかかっていないトマトの2クラスで検出する方法の2つについて比較する.
尻腐れ病かどうかを区別せずにトマトの実を検出した場合には,検出された領域をInceptionV3の転移学習により尻腐れ病かどうかを判別する.
単眼ワンショットカメラ画像中の人物近くの物体からスケールを参照して,身長推定と背骨の湾曲の課題を検討した結果を報告する.
本稿では,任意の既存のCNN画質改善手法を拡張して全天球画像への適用が可能なCNN画質改善手法を開発することを目的として,画質改善としてビット深度強調を例に既存のCNNベース画質改善手法を全天球画像の入力に拡張する手法を提案する.正距円筒表現された全天球画像の解像度の空間不均一性と極における特異性,既存CNNの入出力層の形状を考慮し,全天球画像を2つの重合格子に分割再配置した正方画像をCNNへの入力とし,コード修正と再学習を要しない手法を提案する.
従来の手法であるニューラルネットワークを用いてRGB画像からハイパースペクトル画像を一度で推定する手法では、端側の波長の推定精度が低くなってしまう傾向があった。そのため提案手法として、隣りあう波長同士は似ているという性質を利用し、まず462波長あるハイパースペクトル画像のうち推定精度が高い中央付近の波長を推定し、それら推定された波長の両端の波長を用いてそれぞれ別のニューラルネットワークに入力し,それより端側の波長を推定し、また得られた端側の波長を入力してそれ以降の端側の波長を推定した。結果として、ニューラルネットワークを用いてRGB画像から一度に462波長を推定した結果と比較して、高い推定精度を示した。
3月15日 13:00〜16:15 Meeting 38 座長 根本慎平(NHK)
D-11-11 |
Quantizing Learned Image Compression with Channel Splitting
◎Heming Sun(JST)・Jiro Katto(Waseda Univ.) |
D-11-12 |
デジタル展示用画像の三刺激値による画質評価
○田村 徹(東京工芸大) |
D-11-13 |
隣接子ノードの占有状態を利用したイントラ予測による点群圧縮
◎齋藤雄太・松﨑康平・海野恭平・河村 圭(KDDI総合研究所) |
D-11-14 |
多角形注目領域を抽出するAIによる高効率映像圧縮手法
○豊田重治・岳 麗・前田直樹(住友電工) |
D-11-15 |
イントラ予測モード情報に基づくエッジ画像学習を用いた画像認識
◎荒井裕太・笹沢俊介・板谷英志・八島由幸(千葉工大) |
D-11-16 |
CCLMを用いたCNN中間層特徴マップの圧縮特性
◎笹沢俊介・八島由幸(千葉工大) |
This paper presents an activation quantization for learned image compression. By splitting the channels, the quantization error can be reduced. To keep the number of overall channels as origin, several channels will be pruned. By using the proposal, in the case of 8-bit quantization, coding gain can be improved by at most 3.26%.
本学写大ギャラリーには10000点を超える貴重な写真プリント作品が所蔵されている。それらの作品の公開では、一度に公開可能な点数の上限や公開による写真プリントの劣化等の問題がある。そこで、モニタを用いたデジタル展示が公開手段として期待される。デジタル展示では、本来の写真プリントが持つ色合いを忠実に再現することが極めて重要であり、筆者らは、その手法について検討している。
本研究では写真プリントの反射特性を測定した際に生じるノイズ処理に伴う画質の劣化についてPSNR、SSIMを指標として検討したので報告する。
MPEGにて開発されている点群圧縮方式G-PCCにて,点群の空間的な相関を利用したイントラ予測(以下,従来手法)が提案されている.従来手法では符号化対象のノードの8つの子ノードの占有状態を,符号化対象のノードの近傍に位置する同じ階層の他ノードの占有状態を利用して推定することで圧縮性能を改善している.しかしながら従来手法では,LiDARデータのような疎な点群データに対して適用した場合,圧縮性能が劣化することが知られている.本研究では,符号化対象のノードの子ノードと同じ階層の近傍の子ノードを推定に用いる,疎な点群データに対するイントラ予測手法を提案する.実験により提案手法の有効性が確認された.
深層学習技術の飛躍的な進歩により、AIによる映像のヒト・モノ・コト解析が幅広い分野に浸透しつつあるが、以下の課題があるため、カメラ映像の高解像度化を生かすには至っていない。
①対象映像データを保管するストレージコストが高い。
②対象映像データを伝送する通信コストが高い。
③AI処理の負荷が高い。
これら課題を解決する映像圧縮手法として、注目領域抽出AIと領域別圧縮とからなるAVP圧縮手法を開発した。注目領域抽出AIは、計算量が物体検出AIの1/79と軽量である。またAVP圧縮は、当社工場映像データに対して、通常の映像圧縮と比較して、データ量を1/14に骨格認識AIの計算量を1/3に低減できた。
圧縮符号化データを直接深層学習に用いて画像認識を行う手法がいくつか提案されているが,本稿では,HEVCイントラ符号化ビットストリームに含まれる予測モード情報のみを用いて生成したエッジ画像を深層学習の入力に用いて認識を行う手法を検討する.データセットCIFAR-10およびCIFAR-100に対して,VGG16およびResNet56を用いた実験により,完全復号画像を用いる場合と比べると認識率が若干劣るものの,圧縮データを部分復号して得られるわずかな情報からも相応の画像認識が可能であることを示す.
演算処理をエッジとクラウドの間で分散して行うエッジクラウド型CNNでは,CNNの中間層出力である特徴マップの効率的な圧縮手法が重要になる.本論文では,H.266/VVCでも採用されている色成分間予測(CCLM)と通常のイントラ予測を適応的に適用する手法を提案し,CNNの中間出力層ごとにその圧縮特性を考察する.
休 憩(14:45 再開) 座長 海野恭平(KDDI総合研究所)
D-11-17 |
画像の可逆符号化に用いる確率モデルにおけるテーブル参照の検討
◎重富耀介・喜多泰代・松田一朗・伊東 晋(東京理科大)・亀田裕介(上智大)・海野恭平・河村 圭(KDDI総合研究所) |
D-11-18 |
HDR画像の2段階可逆符号化における残差予測と確率モデルの同時最適化
○野口悠希・喜多泰代・松田一朗・伊東 晋(東京理科大)・亀田裕介(上智大) |
D-11-19 |
VVC空間スケーラブル符号化における発生情報量
◎近藤雄一・市ヶ谷敦郎(NHK) |
D-11-20 |
VVCにおける8K映像の所要ビットレートの検討
○根本慎平・岩村俊輔・市ヶ谷敦郎(NHK) |
D-11-21 |
ボリュメトリック映像の射影面に応じた品質可変型符号化方法の一検討
◎若原裕磨・青木秀一・瀧口吉郎(NHK) |
D-11-22 |
低遅延でインタラクティブなゼロレイテンシー映像・Somatic統合ネットワーク -映像情報とSomatic情報の未来予測と統合技術-
○勝山 裕・文 鄭・金井謙治・孫 鶴鳴・魏 博・甲藤二郎(早大) |
筆者らは,画像信号の生起確率を画素ごとにモデル化し,算術符号を用いて可逆符号化する方式を開発している.この方式は発生符号量が最小になるように確率モデルのパラメータを最適化することで高圧縮率を達成するが,多くの演算量を要することが課題であった.本稿では,確率計算にテーブル参照を導入することで演算量の削減と確率モデルの自由度の向上を図る.
筆者らは,高ダイナミックレンジ(HDR)画像の2段階可逆符号化において符号量の削減を行っている.HDR画像を可逆符号化する場合,標準ダイナミックレンジ(SDR)に変換された画像を符号化後,HDRとSDRの残差成分を追加のビットストリームとする2段階符号化によって従来の表示装置との互換性を維持することが可能である.また,画像信号の予測符号化において,予測器の設計と予測誤差信号の確率分布のモデル化は独立または交互に行われるのが一般的である.本稿では,HDR画像の2段階可逆符号化を前提とし,後段の符号化に用いる予測器と確率モデルのパラメータを共通の目的関数の下で最適化する手法により,符号量の削減を図る.
空間スケーラブル符号化とは,異なる解像度の映像を効率的に符号化する方法で,低解像度映像をベースレイヤ(BL),高解像度映像をエンハンスメントレイヤ(EL)とし,BLのローカルデコード映像をELの符号化において予測に用いることで効率的に符号化する技術である.最新の符号化方式である VVCではスケーラブル機能を実現するMultilayer Main 10プロファイルが第1版から規定されており,スケーラブル符号化の利用が期待されている.著者らは,スケーラブル符号化の放送利用に向けて, BLとELの適切な符号量割り当てを明らかにするために,精細感を再現するEL信号の発生情報量を調査した.
映像符号化方式VVC(Versatile Video Coding)の第一版が2020年7月に承認された.著者らは,放送におけるVVCを用いた8K映像の所要ビットレートを明らかにするために,主観評価実験を実施した.実験ではVVCソフトウェアコーデックであるVVenCを用いてVVC符号化映像を作成した.本エンコーダは画質と処理量のバランスに応じたエンコード設定を可能としており,本実験では初期のVVCハードウェアエンコーダの符号化性能を想定した設定,および符号化効率を重視した設定の2通りを用いた.実験の結果,放送品質を満たす所要ビットレートは,初期のVVCハードウェアエンコーダの符号化性能を想定した設定では50Mbps以上,符号化性能を重視した設定では40Mbps以上であることが確認された.
筆者らは、映像空間内を移動し自由な視点からの全方位映像を楽しむことができるイマーシブメディアを様々な端末で表示するためのシステムの開発を行っている。ここで用いるボリュメトリック映像は、視聴者の視点・視線に応じて表示される面と表示されない面があるため、圧縮符号化においてその射影面の品質を制御することで、主観品質を向上できる可能性がある。そこで、ボリュメトリック映像の射影面ごとに異なる符号量を持つよう符号化する方法を検討した。本稿では、この検討に基づき筆者らが検討した射影面ごとに品質を制御する符号化方法を報告する。
本プロジェクトでは、Beyond 5G に求められる超臨場感技術に関し、映像情報とSomatic情報の未来予測統合技術、ネットワーク上の低遅延伝送通信技術を開発し、統合実証試験も行う計画である。映像情報とSomatic情報の未来予測と統合技術では、伝送路中のネットワークスライス上で予測情報を作成し、全体の遅延を実質的になくすことを目指している。また、映像、触覚情報のタイムスタンプ情報も同時に伝送することで、受信側で映像・触覚の統合を行うことも目指している。映像と操作情報および触覚情報を統合することにより、ゼロレイテンシー映像に対して、品質としてMOS値4.0以上とすることを目標とする。
3月16日 9:00〜11:45 Meeting 38 座長 河村 圭(KDDI総合研究所)
D-11-23 |
Unityにおける実影の画像認識に基づくAR仮想物体の影付け
◎岸本佳樹・高井昌彰・飯田勝吉(北大)・高井那美(北海道情報大) |
D-11-24 |
深度カメラを用いたリライティングの画質向上
◎田中滉大・高井昌彰・飯田勝吉(北大)・高井那美(北海道情報大) |
D-11-25 |
情報に紐づく液体の注ぎ移し動作による情報操作の実現
◎小林健太・高井昌彰・飯田勝吉(北大)・高井那美(北海道情報大) |
D-11-26 |
合わせ鏡の映り込みを表現するARシステムのUnityでの実現
○安達正規・高井昌彰・飯田勝吉(北大)・高井那美(北海道情報大) |
D-11-27 |
レンダリングされた3Dオブジェクトと2D実写映像の解像感比較評価
○三浦菊佳・若原裕磨・林田哲哉・瀧口吉郎(NHK) |
拡張現実(AR)における光学的整合性とは,ある光源環境に置かれた実物体と矛盾しない仮想物体の陰影付けを意味し,ARで表現される仮想物体の視覚的な存在感やリアリティに大きな影響を及ぼす要因である. ARにおいては,現実世界の光源環境をカメラ画像からリアルタイムで把握し,これを仮想物体に直ちに反映させ,光源位置等の動的変化に追従した描画を行う必要がある.
我々はUnity/Vuforiaをプラットフォームとして,既知物体の影画像の認識による光源位置推定のもと,実物体とAR表示される仮想物体のそれぞれの影の整合性のある描画を行うARシステムを開発している.本稿ではそのシステム構築と動作結果の概要について述べる.
近年では、オンライン会議を行うことが多くなりました。オンライン会議では個人の照明環境の違いにより統一感が薄れてしまいます。リライティングと呼ばれる手法は、仮想の光源による影響を撮影画像に反映させることで実際の光源とは異なる照明環境を構築することが可能です。この手法には深層学習を利用した手法や深度カメラを利用した手法がありますが、処理を高速化できれば複数の参加者の照明環境を統合・共有し、全体として光学的整合性の取れたオンライン会議室を実現することも可能になると考えています。本研究ではオンライン会議などで複数の参加者の照明環境を統合・共有した仮想会議室を実現するシステムの開発を目的にしています。
拡張現実(AR)における認識対象(AR ターゲット)は形状や模様の定まった固体物が一般的であるが,不定形な液体を認識対象とし,そこに様々な情報を紐づけることができれば,仮想的な化学実験の学習支援など,液体としての特徴を利用したARコンテンツの新展開が期待される.本稿では液体をARターゲットとして用い,コップ等の容器に入れられた液体の注ぎ移し動作によって,液体に紐づけられた情報を操作することを考え,その一例として注ぎ移しによる図形記号列処理を行うシステムについて述べる.
拡張現実(AR)において,鏡などの反射を生じる物体が配置されている場合では,表示される仮想オブジェクトの鏡面への映り込みを表現することで光学的整合性を保つ必要がある[1].また鏡に遮蔽物となる物体が映り込んでいる場合には,遮蔽物と仮想オブジェクトの鏡に対する位置関係に応じたオクルージョン処理を行う必要がある.
我々は,合わせ鏡で多重の反射が生じる実空間における仮想オブジェクトの光学的整合性の実現を目的に,仮想オブジェクトの遮蔽物によるオクルージョンも考慮した鏡面への映り込みを表現するARシステムをゲームエンジンUnityで実装している[2]. 本稿では,合わせ鏡による多重の映り込みのAR描画について述べる.
NHKでは、次世代の放送サービスに向けて、2Dの全天周映像と3Dのオブジェクトを合成し、様々な端末で異なる表示を実現する、イマーシブメディアの研究を始めている。異なるフォーマットの映像を合成する際、合成後の映像が高精細に自然に見えることが求められる。そこで、本稿では、2D表示した3Dポイントクラウドオブジェクトがどれくらいの解像感に見えるか、2D実写映像と比較した主観評価実験を実施した。8Kディスプレイに表示したときの専門家による実験結果から解像度指標を得たので、その結果について報告する。
休 憩(10:30 再開) 座長 福嶋慶繁(名工大)
D-11-28 |
複素絶対値近似計算によるSAR画像復元
○Zuxuan Zhang・児玉侑也・村松正吾・山田寛喜(新潟大) |
D-11-29 |
属性情報を組み込んだ超解像処理
○村川達哉・小野直樹・井上光平・原 健二(九大) |
D-11-30 |
左右反転顔画像の融合による対称性の向上
◎曾 琪・井上光平・小野直樹・原 健二(九大) |
D-11-31 |
カラー画像を用いたグラフ信号処理による深度画像の超解像手法の提案
○伊藤海理・窪田 司・雨車和憲(工学院大) |
D-11-32 |
勾配ブースティングを用いたL1回帰の反復解法
◎奥野智貴・小原秀介・福間慎治・森 眞一郎(福井大) |
本稿では,複素FISTA と複素絶対値近似計算による複素画像の復元手法を提案する.合成開口レーダ(SAR)画像の応用の一つに物体検出がある.SAR 画像は可視光画像と同様にブラーやノイズなど観測過程において品質がしばしば劣化する.この改善には,高性能な画像復元手法が求められる.一方,SAR 画像は複素値のため実数用アルゴリズムよりも多くの演算を必要とする.組み込みに適した実装を求められる場面も多い.そこで本研究では,複素絶対値の近似計算法を複素FISTA(CFISTA) と共に採用することを提案する.処理時間や画質の比較を通して,提案法の有効性を確認する.
画像の鮮鋭化処理の方法として局所射影明度による方法が提案されている.画像全体で使用されている輝度や色情報をもとにした大域的な画像の情報ではなく,局所的な画素値の情報に基づいて画像を鮮鋭化する方法である.この処理には彩度の強調と明度のアンシャープマスキングによる鮮鋭化処理とが含まれ,それぞれの処理パラメータの与え方によって処理結果も変わる.本研究では,局所射影明度を用いた画像の鮮鋭化処理における適切なパラメータの与え方について考察し,見た目に自然でかつ鮮明な画像を生成する方法を提案する.
左右対称性の高い顔は魅力的だといわれている。本稿では、正面顔画像とその反転画像を融合して左右対称性の高い顔画像を生成する方法を提案する。
近年,自動車やロボット,スマートフォンなど身近なものにRGBセンサと共に深度センサが搭載されている.しかし一般的に,深度センサはRGBセンサに比べ解像度が低いため,深度画像の超解像に関する研究がなされている.一方,グレースケール画像と一部の色情報から自動でカラー画像を生成するカラリゼーションの研究がされている.先行研究ではグラフ信号処理を用いたカラリゼーションが提案されており,色情報をグラフ信号値とみなして自然なカラー画像を生成することができる.本研究では深度値をグラフ信号とみなし,低解像の深度画像と高解像度のカラー画像から高解像度の深度画像を復元するアルゴリズムを提案する.数値実験により提案手法の有効性を示す.
回帰により回帰係数を求めるときの目的関数は一般に
残差ノルムが利用される.目的関数を残差 L2 ノルムと
する場合回帰係数は正規方程式の解として陽に得られる.
これを L1 ノルムとする場合 (LAD 回帰),線形計画法で
解くことができる.しかし,線形計画法は問題サイズに
よっては実行時間が長く,さらに計算途中で途中解を求
めることができない場合が多い.そこで本研究では単回
帰を反復する boosting を用いた L1 ノルム回帰の反復解
法を検討する.回帰係数は重み付きメジアンである
ことから,行列演算が不要であり,組み込みプロセッサ
やハードウェアでの実装に向いている.
3月16日 13:00〜16:15 Meeting 38 座長 雨車和憲(工学院大)
D-11-33 |
アニメ制作効率向上のための原画位置合わせWebアプリケーションKeyframe Refinerの開発
◎中村太紀・呉 道峰・福元伸也・鹿嶋雅之・渡邊 睦(鹿児島大) |
D-11-34 |
遠赤外線カメラを用いた円筒型金属表面温度推定のための基礎検討
◎加藤 翔・宮城茂幸・酒井 道(滋賀県立大) |
D-11-35 |
テンプレートマッチングを用いた植物標本画像のラベル自動マスキング方法の検討
○ボロル ソドオチ・張 徳鵬・檜垣泰彦(千葉大) |
D-11-36 |
阿蘇地域草原の植生分類に対するドローン空撮画像と衛星画像との連携
○岩崎洋一郎(東海大)・野島明博(メガテック)・天野弘基(東海大) |
D-11-37 |
仮想空間バスケットボールの跳躍感覚に関する研究
◎小谷亮太・岩見祐里・賈 卓凡・井ノ上寛人・鉄谷信二(東京電機大) |
D-11-38 |
樹木画像を用いた立体視上での奥行き知覚の強さに関する要因分析
◎瀧澤海斗・岩見祐里・鉄谷信二・井ノ上寛人(東京電機大) |
アニメ制作の効率化のための原画位置合わせWebアプリケーションを開発した.原画をデジタル化する場合にずれてスキャンされてしまう問題がある.現在,そのずれは人が修正している.そこで,本研究ではユーザビリティが高く,自動でずれを修正するWebアプリケーションKeyframe Refinerを開発した.入力画像を二値化によって前処理を施す.位置合わせの指標となるタップ穴またはフレームを多角形検出によって検出する.最後に基準画像に沿ってアフィン変換で補正する.また,他アプリケーションには無いフレームで位置合わせをする機能がある.他アプリケーションと比べて高性能であることから本システムの有用性を確認した.
ある種の生産設備では100℃程度の温度を保持しつつ稼働する円筒型金属部品がある.
その部品の表面温度が製造品質に影響を与えることがあり,その温度分布の監視が必要とされている.
一般に金属は放射率が低いため鏡面反射の影響が大きく,遠赤外線カメラを用いた非接触温度分布計測は難しい.
そこで円筒型金属部品の表面処理と観測画像の領域制限を組み合わせた手法を検討してきた.
黒体塗料は剥離が発生しやすいことから,本報告では金属表面に耐熱黒色塗料を塗布し常温下で計測を行った.
金属表面の中心が画像中心となるよう配置したとき,画像中心から水平角20度付近の領域のデータを用いることにより,安定して温度推定できる可能性を示すことができた.
故萩庭氏らが収集した萩庭植物標本は,収録数・標本の採集地の両面において国内最大規模である。その中には絶滅危惧種も含まれており,標本画像を公開するにあたっては,資源保護の観点からラベルの採集地部分をマスキングする必要がある。今回の対象画像は低画像度であり,ラベル表記は活字と手書き文字が混在しているため,輪郭サーチ,文字認識,超解像などの技術の活用は困難である。そこで本稿では,標本画像中に記載された採集地の部分を自動的に検出・マスキングする方法としてオープンソースの画像処理ライブラリOpenCVに含まれるmatchTemplate関数の利用を検討した。その結果、95.42%の正答率が得られた。誤検出の原因はラベルの一部欠損や手書きラベルである。
阿蘇地域では,地下水保全のために浸透能力の高い草原の維持が重要であると言われている.阿蘇地域草原の主な植生であるネザサとススキは,蒸発散量が異なることから両者を区分した土地被覆分類が可能となれば,浸透能力さらには地下水涵養量の高精度な推定が期待できる.我々は,ドローンを用いた高解像度空撮画像から計算されるNDVI(正規化植生指標)により,ネザサ,ススキの領域を正確に区分できることを確認し,次に,ドローンの画像分類結果をグラウンドトゥルースデータとしてSPOT 7衛星画像から計算されたNDVIと比較した.その結果,6mの空間分解能の衛星画像でも概ねドローンのNDVI強弱分布傾向に近いことを確認した.
バーチャルリアリティ(VR)体験において没入感を向上させる手法として,実空間での歩行や跳躍動作と,仮想空間での移動を対応付けることが提案されている.また,跳躍VR体験を実現するため,体験者に跳躍しているように錯覚させる研究も行われている.しかし,跳躍運動についてアプリケーションに依存して違和感や恐怖感についての検討はされていない.
本研究は,仮想空間バスケットボールでの跳躍量の倍率を変化させたときの違和感・恐怖感・迫力感の評価を行い,VR体験において適切な跳躍量の倍率の指標を示すことを目的とする.
人は両眼があることで,日常的に奥行きを知覚している.その奥行きを知覚する要素として,両眼視差,輻輳作用などが挙げられる.先行研究では視覚的効果として大きさの効果と視野内の情報量について定量化が行われた.また逆視画像(左右の画像を入れ替えて提示)を手段とすることでコンテンツの奥行きの強さと違和感の関係性が示された.
本研究ではさらに要因を特定して奥行き知覚の強弱について求めることを目的とする.この目的のため物体(樹木)の配置や背景の違いを含む正視画像と逆視画像を用いて評価実験を行った.
休 憩(14:45 再開) 座長 福嶋慶繁(名工大)
D-11-39 |
PredNetによるマルチステップフレーム予測とその評価に関する検討
○△西村洋輝・亀山 渉・関口俊一(早大) |
D-11-40 |
視力低下とコントラストに関する研究
◎岩見祐里・鉄谷信二(東京電機大) |
D-11-41 |
コレスポンデンス分析に基づく広告の視覚効果差
○原 龍悟・塩谷 勇(法政大) |
D-11-42 |
Plane-based Hand-eye calibration method between measuring arm and linear structured light 3D camera
○Dayong Tai・Zhixiong Wu・Ying Yang・Cunwei Lu(Fukuoka Inst. of Tech.) |
D-11-43 |
Pseudorandom Coding And Decoding Method For Single Pattern Projection 3D Image Measurement
○Zhixiong Wu・Dayong Tai・Ying Yang・Cunwei Lu(Fukuoka Inst. of Tech.) |
D-11-44 |
Color projection 3D image measurement system based on Gold sequence codding
○Jinbing Li・Zhixiong Wu・Ying Yang・Cunwei Lu(Fukuoka Inst. of Tech.) |
PredNetを双方向に適用することでフレーム予測精度向上の可能性を示した。映像符号化の双方向予測では未来のフレームを先行して符号化しておく必要があり、過去の直前の符号化済みフレームをPredNetの入力として利用できないケースが発生する。そこで、符号化済みフレームから数フレーム先のフレームをPredNetにより予測するマルチステップ(MS)フレーム予測を提案する。また、損失関数の改善で予測精度を高めるため、予測フレームの画質をMSE、SSIM、LPIPS、LVGGの4つの評価指標で比較した結果を報告した。
本研究に関する先行研究として, エッジにぼかし領域がある場合に, エッジの両側の領域全体に対して, 濃度の濃い側の濃度が下がり, 濃度の薄い側の濃度が上がることでコントラストの低下を生じさせる視覚現象が報告されている. 本研究では, 視力が低下してエッジがボケて見えることが, このエッジボケに関する視覚現象と同様のコントラストの低下を生じさせると予想し, 評価実験を行った.その結果をもとに, 視力と濃度に関して定量化を図ることを目的とする.
コレスポンデンス分析を用いて、ネット広告の表現方法を分析する。
The determination of the hand-eye relationship between the measuring arm and the line
structured light camera is a key problem in the laser scanning measuring arm system. Aiming
at the working characteristics of the line structured light 3D camera, this paper proposes a
method to determine the hand-eye calibration of the line structured light camera and the
measuring arm based on a fixed plane. The measuring arm measures the plane to obtain the
equation of the plane, this equation is used as a constraint base, and the measuring arm with
the camera measures the plane with different attitudes. The relationship between the camera
and the measuring arm is established based on the coplanar plane. The measurement accuracy
of 0.05mm can be achieved by this method, and the experimental results verify the
effectiveness of this method.
Image pattern projection usually uses phase shift method, which needs to project many patterns, so it's hard to measure moving objects. The optimal image pattern projection requires multiple grayscale levels, this method is complex. To solve these problems, the pseudo-random coding and decoding method is proposed in this paper. First generate an n-bit pseudorandom number, it is used to generate patterns. Secondly, a decoding window with N+M bit is set to decode the fringe and identify the missing fringe. Finally, the 3D information of the object is obtained. By this method, the decoding rate can reach more than 95%.
When measuring color objects with color-coded structured light, the color of the fringe projected on the surface of the object will be affected by the inherent color of the object the light source and the external environment, finally result in color distortion. In order to solve the problem of color distortion, a color projection 3D image measurement system based on gold sequence codding and a new color correction method were proposed. The color-coded figure in this study only consists of three colors of white, red, and green to establish a color database. The color of the pixel to be measured was compared with the database to restore the color before distortion. The result shows that the color correction method can solve the color distortion problem.
D-12. パターン認識・メディア理解A(パターンメディアの認識・理解・生成)
3月16日 9:00〜11:45 Meeting 39 座長 長尾智晴(横浜国大)
D-12-1 |
手術映像中の人物姿勢に基づく手術状況の分類
○△林 貴大・角所 考(関西学院大)・北橋忠宏(阪大)・菅野修也・松本隆志(Medi Plus) |
D-12-2 |
車載カメラ動画像シミュレータを用いて抽出された運転手注視点予測用動的顕著性マップ構築法の改善点への対応
◎△水野倫太郎・中田洋平(明大) |
D-12-3 |
7人制ラグビーにおけるキックパス時のオフサイドルールを考慮した選手到達可能領域の検討
◎△龍崎伸太朗・八代航太朗・中田洋平(明大) |
D-12-4 |
タクシーの軌跡データから見る地図グリッド間の社会的特性の類似性について
◎何 澤華・藤野 巌(東海大) |
D-12-5 |
オノマトペによる害鳥の表面質感の感性評価
◎吉兼大智・松村 遼・北風裕教(大島商船高専) |
近年,人間工学や観察工学等の分野において,共同作業を継続的に観測し,作業効率の向上に役立てることを目指した研究が行われているが,どのような作業状況が起こるかは作業内容に依存する場合も多い.このような共同作業の一つとして医療分野での手術があるが,手術室内の各人物は,作業状況毎に決まった持ち場があることから,これに着目することで作業状況を自動分類できる可能性が期待される.そこで本研究では,手術室内の撮影映像を対象に,各人物の位置や姿勢の類似性に基づいたクラスタリングを行うことで,実際に生じている作業状況を分類することを試み,実際の手術室内の映像を用いた実験により, その可能性を確認した.
近年,運転支援技術は著しい発展を見せており,自動車製造会社のみならず,様々な企業や機関で研究開発がなされてきている.このような背景の下,著者らは,運転時における人の目の行きやすさを数量化する動的顕著性マップの構築法と,同構築法の検証に用いるための3DCGによる車載カメラ動画像シミュレータに関する研究を進めてきた.また,同シミュレータにより再現した幾つかの運転状況の車載カメラ動画像によって,同構築法の検証を進め,その改善点の抽出もしてきた.本稿では,そのように抽出された2つの改善点を元に同構築法の改良し,その改良に対する評価実験について報告する.また,その結果から,実施した改良の有効性を考察する.
近年,ラグビーへの注目度が増しており,試合放映時においては,試合の流れなどを理解しやすくする付加情報の提示が,ますます重要になってきている.そのような背景の下,著者らは,これまで7人制ラグビーを対象として,最適キックパスプレー算出法の研究を進めてきた.しかし,この算出法で用いられている選手到達可能領域は,キックパス時のオフサイドルールを適切に考慮していないものであったため,そのままでは,キックパス前のランプレーを取り扱うことはできなかった.そこで,本発表では,オフサイドルールの影響を適切に考慮した選手到達可能領域の導出を行う.また,いくつかの場合における具体的な形状を示す.
近年、GPSなどの測位技術の急速な発展に伴い、都市部の移動活動から発生する様々な軌跡データを迅速に取得できるようになった。本研究では、タクシーの軌跡データのクラスタリング分析により、異なる地域に異なる時間帯にタクシーの集まるパターンを把握し、地域の社会的機能のタイプを判別し、都市交通計画や渋滞改善策を科学的に策定するために役立ちたいと考えた。本研究の提案手法はまず、初期段階の元の軌跡データをマップマッチングし、さらに詳細な説明やクリーニングを加えた。 そして、そのデータをもとに、空間的・時間的な分割を行うことで、時間による交通量のマトリックスを生成する。その後、1週間のヒートマップを生成して、各グリッドの時間番号次元のタクシー台数のベクトル間の類似度を計算して、マトリックス内のグリッドのクラスタ分析結果を用いて、グリッドの社会的機能の判別を行う。
近年,害鳥カワウの生息数が増加し,深刻な漁業被害が発生している.我々が開発している,カワウをドローンで追跡して追い払うシステムは,ドローンのカメラによってカワウを撮影し,深層学習によって認識する手法を用いている.しかし,カワウの学習用画像が極端に少なかったため,3DモデルによるDataAugumentationによって認識率向上を目指していた.だが,認識率向上のためには3Dモデリングの熟練が必要であった.本研究では,オノマトペを用いて3Dモデルの表面形状を作成者の意図する質感に変換するための感性評価を行い,形状に対するオノマトペの評価と3Dモデルを作成するパラメータとの関係が明らかにした.
休 憩(10:30 再開) 座長 中田洋平(明大)
D-12-6 |
CG学習済み意味的領域分割モデルの実環境適応のためのCG風変換アダプタ
◎河野太郎(横浜国大)・尾崎将崇(コマツ)・長尾智晴(横浜国大) |
D-12-7 |
Deep Image Matting におけるスキップ接続の有効性の検証
○三田村 周・林 貴宏(関西大) |
D-12-8 |
最長距離モデルを導入した間接照合法による類似図形検索
◎柴田悠也・林 貴宏(関西大) |
D-12-9 |
自動生成トライマップを用いた高精度画像切り抜き手法の検討
◎松浦祐樹・林 貴宏(関西大) |
D-12-10 |
前景領域手がかりのみを用いた画像切り抜き手法の検討
○中澤美結・林 貴宏(関西大) |
意味的領域分割におけるCGを用いた実環境へのドメイン適応では,CG画像のリアル風変換により疑似実環境の教師あり学習が行われるが,土木作業現場等の乱雑で色味の乏しい環境ではその変換が難しい.本研究では柔軟なCGを軸にした実画像のCG風変換によるドメイン適応を焦点とし,CG学習済みモデルをパラメータ固定のまま学習するCG風変換アダプタを提案する.CG風実画像による出力分布をCGデータの出力分布に近づける敵対的損失項と複数フレームで等しい位置の画素値の拘束項によりCG風変換の質を向上させる.実際の土木試験場のデータとCGデータを用い,提案手法により元の実画像入力に対して10%超の精度向上を確認した.
画像内の物体領域を切り抜く技術の一つにアルファマッティングがある.この技術は,輪郭が明確ではない前景領域の切り抜きに使われる.近年ではCNNを用いてアルファマップを予測する手法が開発されている.しかし正確なアルファマップの予測ができない場合がある.これは畳み込みとプーリングを繰り返すことによって局所的な情報が失われるからである.そこで本研究では,局所的な情報を補完するためにU-Netで導入されているスキップ接続を組み込み,既存手法との比較実験を行った.実験結果から,スキップ接続により正確なアルファマップを生成できることを確認した.
類似図形検索における図形間の類似度計算処理は,計算量が大きいという問題がある.これを解決するため間接照合法が提案されている.間接照合法は,事前にDBから少数のキー図形を選び,キー図形とDB内の図形との類似度を計算しておく.検索時は,クエリ図形とキー図形との類似度を計算し,事前計算しておいたキー図形とDB内の図形との類似度の関係からクエリ図形とDB図形の類似度を推定する.間接照合法は,選択したキー図形により推定精度が変化する.最適なキー図形を選択するために,本研究では,最長距離モデルと呼ばれる選択手法を間接照合法に導入する.評価実験から提案手法は,既存手法に比べ推定精度が向上することが確認された.
画像の切り抜き手法は,インタラクティブな手法と学習ベースの手法に分けられる.インタラクティブな手法は,ユーザ入力を必要とし,細部の切り抜きを行うためには,ユーザ操作量が増加する.学習ベースの手法では,ユーザ入力を必要としない一方,細部の切り抜きは難しい.そこでこれらの手法を組み合わせた手法を提案する.学習ベースの手法で取得した物体のおおまかな領域を,モルフォロジ処理によって収縮させ,その結果をインタラクティブな手法のユーザ入力の代わりとして利用する.提案手法により細部の切り抜きを可能にしつつ,ユーザ入力を自動化できることが確認された.
画像から任意の領域を切り抜く処理は,画像や映像の編集において多く用いられている.画像の切り抜き手法として,切り抜きたい領域(以後,前景領域)と不要な領域(以後,背景領域)の一部を,ユーザーがそれぞれに対して手がかり線を入力することで画像を切り抜く手法(以後,既存手法)が開発されている.本研究は,前景領域の手がかり線のみで所望の画像領域を切り抜けるようにこの手法を改良する.提案手法を複数の画像に適用し,前景領域の手がかり線のみから物体領域を決定でるきことを示した.
3月16日 13:00〜15:45 Meeting 39 座長 篠沢佳久(慶大)
D-12-11 |
カメラ画像を用いた海霧検出の一検討
○磯﨑裕臣(海上保安大)・寺重隆視(広島国際大)・山中仁昭(海上保安大) |
D-12-12 |
ヒートマップを用いたカラス画像の特徴分析
◎横山 響・松村 遼・北風裕教(大島商船高専) |
D-12-13 |
深層学習を用いた地中レーダ画像の識別精度向上法
○木本智幸・新野 稜(大分高専)・園田 潤(仙台高専) |
D-12-14 |
水中船底動画における海洋生物付着物解析
◎岩上友哉・長尾智晴(横浜国大) |
D-12-15 |
住環境火災における火災危険度推定手法の検討
◎辻村拓哉・井上勝文・吉岡理文(阪府大) |
船舶の安全な航行のためには、海上における霧は大きな障害であり、霧が原因となって衝突・沈没に至った事例も多い。海上において霧は局所的に発生することも多く、視程が良好な海域と視程が極めて不良な海域とが、明確な境界をはさんで隣接していることもある。しかし視程不良の海域を航行中の船舶は「至近距離に視程が良好な海域が存在する」という情報があれば、その海域に移動することで霧から脱することができると考えられるが、これまでそのような情報を得るすべがなかった。本研究では、海上を撮影した画像データから、機械学習を用いた海上における霧の検出手法を提案し、その有効性を明らかにする。
カラスによる日本国内の主な被害には,農作物被害をはじめ,ゴミの散乱,騒音,糞,人間への威嚇および攻撃などがあり,その被害は甚大である。
我々の研究グループでは,ドローンを使用して音や光でカラスを追払うシステムの開発を試みており,その実現には,カメラ映像において,カラスのみを高精度に認識できるシステムが必要となる。そこで本研究では,鶴・鷲・雀と,害鳥カラスの4種類の鳥に,背景画像を加えた5クラスの特徴を学習し,各認識率について検討を行った。学習にはConvolutional Neural Networkを用いた。また,Grad-CAMを用いてカラスと各クラスの特徴部位について比較したので報告する。
社会インフラの検査は地中レーダで地中内の電波反射画像を撮り,熟練技術者が目で見て判断しているが,空洞等の危険因子を高精度かつ高速に行うことは困難である.この対策として,FDTD法によるシミュレーションで大量の地中レーダ画像を生成し,これをAI(CNN等)に学習させることで埋設物の識別が高精度かつ高速にできる手法が開発されている.本発表では,高精度な識別ができるFDTDシミュレーション画像を高速かつ低コストで生成する方法を提案する.
船舶は海洋生物が付着すると,陸に上げてクリーニングを行う必要がある.その必要性の判断には,水中で撮影された動画を専門家が解析することによって行われているが,長時間の動画を確認する必要がある.そのため,自動的に付着物を解析する手法のニーズが存在している.本研究では,深層学習を用いて少ない教師データから疑似教師データを作成し,水中船底動画から海洋生物に関してセグメンテーションする手法を提案する.実験から,提案手法は比較手法よりセグメンテーション精度が向上していることを確認した.
火災要因の約半分を占める住宅火災の削減ために,住環境の火災危険度(以後,危険度) を推定し,予防を促すシステムが求められている.これの実現には,カメラで撮影した画像から,住環境を正確に把握し,危険度を自動で推定する必要がある.本研究では,これの実現可能性を調査するために,深層学習モデルによって求めた物体の位置関係とそれらの種類に応じて危険度を判定するルールベース型手法と,CNN によるCNN 型手法を用いる.本稿では,これらの手法を用いて危険度推定した結果より実現可能性について検討する.
休 憩(14:30 再開) 座長 島田伸敬(立命館大)
D-12-16 |
インスタグラム画像からのハッシュタグ付けにおける教師なし学習方法の提案
◎左 暖・篠沢佳久(慶大) |
D-12-17 |
深層学習による光源推定時のノイズ位置の影響
○竹中陽登・箕浦弘人(鈴鹿高専) |
D-12-18 |
Self-Attentionによる非局所構造の利用状況解析
◎大峠仁輝・内田誠一(九大) |
D-12-19 |
継続学習における破局的忘却の軽減手法の提案
◎平山明香里・木村昌臣(芝浦工大) |
D-12-20 |
ピクセルごとの摂動による敵対的サンプル生成手法の提案
◎亀川朋生・木村昌臣(芝浦工大) |
近年,画像を投稿するInstagramなどのSNSで,より多くの人に閲覧されるようにするため,検索に関わるハッシュタグを付けることが重要である.しかし,現時点でハッシュタグは人手によって付与されており,ユーザエクスペリエンスが低いことが問題になっている.本研究においては,教師なし学習法でInstagram画像からハッシュタグを付与することを考案した.具体的には,学習済みの6種類のCNNモデルを用いて画像の特徴量を抽出し,次にその特徴量を用いてk-means法でクラスタリングを行う.そして,クラスタ内の画像群に付与されているハッシュタグを元に,未知画像に対しては①最も類似する画像のハッシュタグ,②クラスタ全画像のハッシュタグを頻度順にソートして上位のハッシュタグを付与するという二つの手法を提案する.そして評価実験によりそれぞれの有効性を検証する.
CGと実写画像を合成するためには光源の整合性が求められる.一つの研究では,ノイズを含んだ画像を用いた光源位置の推定が評価されていた.本研究では深層学習を用いてノイズの位置,割合が光源推定に及ぼす影響を評価した.その結果,ノイズの面積が増加する方向によって推定の損失が異なり,画像の中心から遠い位置にあるノイズは推定の損失が大きいことが分かった.画像の中心から遠い位置にあるノイズが強く影響すると考えられる.また,画像にノイズがない場合は損失が小さく,次に全体的にノイズを加えた方が小さい.ノイズが半分程度ある場合が一番損失が大きくなると考えられる.
本研究は,Vision Transformer(ViT)が内蔵しているSelf-Attention の挙動解析を行う.ViT とは画像をパッチ単位に分解し,それらをTransformerと呼ばれるニューラルネットワークに入力する識別モデルである.Self-AttentionはTransformer内部の機能であり,離れたパッチを含めて全パッチ間の相互関係を利用した特徴への重み付けを行う.その挙動解析により,ViTの判断根拠を解明でき,さらには対象画像の重要箇所の理解にもつながる.本研究は,解析に適した題材として,多フォント文字に関する二つの認識タスクを用いる.それは文字クラス認識と文字スタイル認識である.これらの認識タスクでは,両者で着目すべき箇所が異なり,一方で離れた部分の構造も重要と予想されるので,本研究には合目的と考えた.
人間や動物は,知識や技能を継続的に習得する.知識を継続的に習得していく能力は,現実世界と相互作用し,情報を処理するために不可欠である.このような考え方に基づく継続学習の研究は,逐次的に発生するタスクを学習し,こなせるようにする研究である.しかし,多くの機械学習モデルは過去の知識を忘れることなく新しいタスクを学習することができない.この破局的忘却の問題は,継続学習における重要な課題の一つである.そこで,本研究では,継続学習において破局的忘却を克服するための新たな手法を提案する.
敵対的サンプルはNeural Networkモデルに誤分類を生じさせる特殊なデータである.画像における敵対的サンプルは,入力画像に摂動を加えることで生成される.これにより,モデルは入力画像に対して誤ったラベルを出力する.
敵対的サンプルの生成手法のひとつに,選択したピクセルに摂動を加える手法がある.しかし,あるラベルが付与された画像と誤分類先のラベルを持つ画像に大きな特徴の違いがあると,摂動を大きくする必要があり,生成する敵対的サンプルは目視でも改変が加えられていることが分かってしまう.
従って本研究では,摂動を加えるピクセルの求め方,摂動の加え方を改善し目視でも改変に気づかれにくい敵対的サンプルの生成手法を提案する.
3月17日 13:00〜15:45 Meeting 39 座長 角所 考(関西学院大)
D-12-21 |
顔特徴と発話時の唇の動きに基づく階層的生体認証
◎安永綾花・岡田祐花・園 櫻子・杉村大輔(津田塾大) |
D-12-22 |
形状を指し示すジェスチャに基づく物体画像検索システム
◎阿佐美 諒・渡邉徹也・島田伸敬・松尾直志(立命館大) |
D-12-23 |
アームバンド型センサと深層学習を用いた空中手書き数字のジェスチャ認識システムの評価
◎武井優介・猪平栄一(九工大) |
D-12-24 |
遺伝アルゴリズムを用いたソロギター向け自動編曲・運指決定システム
◎田島雅斗・荒川達也(群馬高専) |
D-12-25 |
非接触機器操作のための空書のノイズ軽減と認識率向上の研究
○臼杵里紗(中大附属高)・臼杵 潤(神奈川工科大) |
顔特徴と読唇処理に基づいた階層的生体認証システムを提案する.高精度な認証方法の一つとして知られる顔認証だが,静的特徴であるため,顔画像入力による不正な認証突破の危険性がある.動的特徴を用いた認証方式は,個々人の持つ行動パターンや癖を利用するため,静的特徴を用いた問題点を抑制することができる.このうち,音声認証を考えると,これは,環境と身体的要因に起因し,認証精度の低下が懸念される.これらの問題点の影響を抑制するために,発声が必要ない読唇処理が有効と考える.本研究では,顔特徴を用いた高精度な認証と,なりすましを防ぐ唇動作の解析による認証を組み合わせることで,より堅牢なシステムを実現する.
物体の形状や使用方法などの視覚的な情報から検索を行う場合、文字や音声のみの検索手法では細部まで説明をする必要がある。こういった日常生活の中で少ない情報から物体を説明するために、音声による説明と合わせてジェスチャを交えて説明をすることが多々ある。普段使用しているジェスチャを入力とした検索システムがあれば、よりインタラクティブに検索を行うことができると考えた。
以上を踏まえ、本研究では、ジェスチャを入力とした画像検索システムの構築を目的とし、深層距離学習による埋め込み空間を作成し最近傍探索、また一連の流れを自動で行うシステムの開発を行った。
ウェアラブルセンサを用いた空中手書き文字認識が新たな入力手法として注目されている。センサデータを文字の輪郭に変換し画像としてCNNに入力することで認識する手法が提案されている。本論文ではセンサデータを時系列データとして使用し、用いるセンサデータの種類に着目して空中手書き数字のジェスチャ認識モデルを作成することを目的とする。実験の結果、ジャイロセンサのデータが正解率の向上に寄与することを確認した。加速度とジャイロセンサを用いると被験者8人のセンサデータを使った8分割交差検証で正解率97%に達した。
従来,遺伝アルゴリズム(GA)を用いて楽曲からTAB譜を自動生成する試みがある.本研究では,GAの処理中に楽曲に対する多少の改変を行えるような拡張を試みる.楽曲に対する多少の改変は遺伝子の突然変異で実装した.評価関数は,運指のしやすさと原曲との差異を評価する2要素の重み付け和で定義した.GAの入力はメロディ・ハーモニー・ベースライン・コード進行の4要素から構成される原曲,出力はソロギター向けの編曲結果のTAB譜である.試作システムにより,演奏しやすさと音楽性をある程度両立したTAB譜を生成できることを確認した.今後評価関数の重み付けパラメータを調整することで,より品質を高めることができると期待できる.
スマホやPCなどの器機類の高性能化とともに情報入力技術が発達している.このような中,空中に文字を書く動作(以下,空書)の動画像を認識して,非接触で器機類を操作する研究に着目した.そこで,本研究では,まず手領域色の尤度によって手の動き(方向コード)を抽出する際に生じるノイズへの対処法を検討した.次に,文字を空書する際の手の動きの特徴を解析し,空書文字の認識に使用するDPマッチングの適用方法や人により異なる書き順を想定した文字判定方法を検討し提案した.そして,これらの提案手法を実装し,アルファベット大文字26文字を対象に空書の実験をしたところ,4種類のDBで認識率88.5%,最高認識率92.3%を得ることができ,一部の文字間に検討の余地が残るものの提案手法の有効性を示す結果を得ることができた.
休 憩(14:30 再開) 座長 舟橋健司(名工大)
D-12-26 |
複数のモーダル特徴および時間尺特徴の1次元CNNを用いた統合による番組動画要約
○望月貴裕・河合吉彦(NHK) |
D-12-27 |
見守りシステムのための1次元畳み込みを用いた呼吸推定
○山北捺未・佐竹純二(福岡工大) |
D-12-28 |
感情単語ベクトルと歌詞ベクトルの類似度による日本語歌詞楽曲のムード分類の検討
◎徐 馳・菅沼 睦・亀山 渉(早大) |
D-12-29 |
製造現場の実映像を利用した行為判定技術の検証
○上野鷹幸・ファン チョンフィ・山本一真(OKI) |
D-12-30 |
設備不良検出に向けたCopy-Pasteデータ拡張を用いた少量データ向け深層学習の検討
○和田雅樹・勝村玲音・野上雅教・島原広季・相原貴明(NTT東日本) |
放送局では,主に若年層の番組への接触率向上を目的として,ホームページやソーシャルメディアなどを利用して番組の要約動画を配信するサービスの必要性が高まっており,自動要約技術の実現が求められている.本発表では,ニューラルネットワーク(NN)を利用した手法として,複数のモーダル特徴および時間尺特徴を入力とし,それらを1次元CNNで統合する自動要約技術を提案する.本手法は,従来手法よりも少ない学習パラメータでの高精度な動画要約を可能にする.
近年,独居高齢者の増加に伴い,見守りシステムの需要が高まっている.先行研究として,本研究室でもKinectの距離画像を用いて人物の胸の動きから呼吸を推定する方法が提案されている.しかし,先行研究では胸の動きを観測するだけで,正確な呼吸の判定は行えていなかった.そこで,本研究ではKinectを用いて距離変動の波形データを取得し,1次元畳み込みを用いて学習を行うことで呼吸による胸の動きとそれ以外の動きを判別する方法を提案する.そして,データの切り出し方や縮小率を変更し,認識率の比較検証を行った結果を報告する.
本稿では,日本語歌詞情報に基づき,楽曲のムードを抽出して分類する手法について報告する.日本語楽曲には大規模なデータセットがなく,教師あり学習が困難である.そこで本研究では,感情単語ベクトルと歌詞ベクトルの類似度よってムード分類する手法を提案する.多種類の感情単語から感情単語リストを作成し,学習済みの日本語SBERTを利用することで,それぞれ感情単語と歌詞のベクトルを生成する.その後,両者の類似度を計算し,特徴ベクトルを作成する.作成した特徴ベクトルをk-means法でクラスタリングし,さらにRandom Forestでその結果を学習する.アンケートを用いて評価した結果,3つの感情カテゴリの中に最大0.647のF値が得られた.
近年,製造現場では,熟練作業員の減少や非正規社員の増加が進み,作業員の手作業によるモノづくり品質の低下が懸念される.作業者のスキルに頼り品質を保証しているような工程では,作業漏れ・ミスが起こる可能性がある.例えば,順序の決まった作業や清掃作業などの組付け作業でのプロセスそのものは,作業漏れ・ミスがあった場合でも後工程での不良検出は困難であり,出荷後の製品の誤作動や不具合の原因となる恐れがある.
本稿では,作業映像を入力とするTemporal Convolutional Network(TCN)を用いた行為判定技術を,工場での組み立て作業に適用した例について報告する.「行為判定」とは,一連の作業があらかじめ決められたルールに沿っているかを判定するものである.今回は,工場で実際に行われているPHSカバーの異物除去エアー吹き工程に対して検証した.
NTT東日本では保有するマンホールの点検に写真検査を導入しており、また点検の効率化に向けて撮影写真を用いた深層学習による自動劣化判定技術の検討を行っている。これまでに報告した金物錆など学習用データの収集が容易な事象もある一方、点検対象の中には発生割合が低くデータの集まりにくい事象も含まれている。本検討では、少量データに対する自動判定の適用性を確認するためCopy-pasteデータ拡張を用いた学習用データ、モデル作成および評価を行ったので報告する。
D-12. パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス)
3月18日 9:00〜11:45 Meeting 39 座長 井上勝文(阪府大)
D-12-31 |
パッシブイメージャ画像とアクティブイメージャ画像を利用した不審物検知手法の評価
◎齊藤恵里香・亀山 渉・佐藤俊雄・勝山 裕・佐藤拓朗(早大) |
D-12-32 |
視野が重ならない複数カメラに対するレーザ光線とその反射光の組合せによるキャリブレーション法
◎西村隆之(ファンクション工房) |
D-12-33 |
物体間の一体関係の推定を伴う室内空間での物体追跡
○下山逸平・角所 考(関西学院大) |
D-12-34 |
カルマンフィルタを用いた海底カメラの姿勢推定について
○田中 聡(福山大) |
D-12-35 |
オプティカルフローによる複数人のうろつき検出に関する検討
◎篠原 巧・香取照臣・泉 隆(日大) |
近年、W帯のレーダーを使用して人物の衣服の上から所持する物体を画像化するセンシングイメージング技術が確立されつつある。また、センシングイメージング技術により得られた画像を利用して不審物を検出する手法の研究開発が行われている。そこで、パッシブイメージャ画像とアクティブイメージャ画像を併用した不審物検知手法を評価し、有効性について報告する。
レーザ光と平面鏡による反射光を用いて重複視野のない2 台の固定カメラの相対位置を算出する手法を提案する.まず,レーザ光を固定した2 枚の鏡にそれぞれ反射させ校正板に戻し投射する.その校正板を1 台のカメラで観測することにより校正板の座標系におけるレーザ光を発するレーザポインタの方向と2 枚の鏡の位置の総てを一括推定する.次に,ここで使用した2 枚の鏡同士の相対位置を固定しレーザ光をそれぞれに反射させてもう一枚の校正板に投射し,それらの受信点を別カメラで撮影観測し分析する.これにより2 台のカメラ間の相対位置が算出できる.提案法は車体の前方と後方のような反対向きのカメラ同士の相対位置算出に適する.
物体追跡に関する研究の多くは防犯目的として,人や車などの追跡が行われてきた.これらの研究では,遮蔽が問題となるが、対象の運動状態が急激に変化しないことを利用して対応している.一方,室内での紛失物探し支援等を目的とした物体追跡も必要となる.これらの研究では,対象が人に把持される,鞄に入れられる等,遮蔽と同時に運動状態が変化する.従来研究では,これに対して他物体との一体関係を推定することで対応している.しかし,一体関係の変化が起きる瞬間を直接観測できない場合には対応が難しかった.本稿では,他物体との一体関係に関する複数の可能性を考慮しつつ,それぞれの場合における対象の候補位置の集合をパーティクルフィルタで表現し,対象の妥当な位置を推定することを試みる.
瀬戸内海の海底に設置して藻場の様子を動画撮影するための「海底カメラ」装置の開発を行っている。海底カメラの海中における姿勢を測定するために9軸センサ(加速度、ジャイロ、コンパス)を搭載しているが、これにカルマンフィルタを適用してセンサフュージョンによる測定結果を得た。一方、カメラを用いた画像解析による姿勢解析結果との比較を行ったところ、地磁気の影響とみられる食い違いが発生するという点と、上下の転倒時に姿勢を正しく評価できないという課題が明らかになった。
研究室に迷いながら質問に来た学生に、入室を促すことで学習機会を増加させ教育貢献することを目的とし、研究室ドア前の廊下を撮影し、入室に対する不安によるうろつき行動を画像処理によって検出し研究室内の人間に伝え、入室を促すことを検討している。
画像処理のうちオプティカルフローを用いてうろつき行動の検出を行う。オプティカルフローによって移動追跡を行い、移動軌跡を取得する。移動軌跡を用いることでうろつき行動の検出が期待できる。
従来の研究において単人のシーンにおいて86%の精度で、うろつきを検出していた。本論文では、これを複数の人物検出に拡張するために、移動追跡の開始方法を変更する方法とその結果について述べる。
休 憩(10:30 再開)
D-12-36 |
1枚の内視鏡画像からの形状と大きさの復元
○江本 峻(名工大)・岩堀祐之(中部大)・舟橋健司(名工大)・春日井邦夫(愛知医大) |
D-12-37 |
Attention機構を導入したCenterNetによる小麦の穂の検出
◎井上源太・韓 先花(山口大) |
D-12-38 |
VisionTransformerを用いた屋内画像分類
○田中駿成・西山裕之・秦野 亮(東京理科大) |
D-12-39 |
空間領域とスペクトル領域における勾配を利用した深層融合ネットワークによるハイパースペクトル画像の超解像度
○久保翔希・韓 先花(山口大) |
D-12-40 |
深層学習の学習データクラスのt-SNEを用いた浄化
○大関和夫・上條浩一(東京国際工科専門職大) |
内視鏡画像からポリープの形状や大きさを推定することは医療診断支援において重要である.これまで血管が水平になっているところを検出して形状復元に利用する方法や相対的な大きさと形状を得る方法が提案されているが,本稿では1枚の内視鏡画像から血管情報をリファレンスとしてポリープの形状と大きさを復元する手法を提案する. 本稿では血管の幅を既知と仮定し,血管が水平でない場合も反射係数Cを推定して1枚の内視鏡画像でも対象の大きさの復元が可能となった.
小麦の穂の検出は,小麦の特性を推定するための重要なタスクであり,また単位面積当たりの穂数から収量の推定ができるため,生産力検定試験では必須の調査項目である.現在穂数の計上は調査者が肉眼で行っているため,時間がかかるだけでなく検出精度も限界がある.近年,深層学習を用いた高精度な物体検出が検証された.本研究でも効率的かつ高速な物体検出を行うCenterNetを用いる.また,近年様々なコンピュータビジョンタスクで有効性を証明されたAttention機構をCenterNetと統合し,高精度な検出モデルの構築を目指す.特に本稿ではチャンネル・空間の両方の特徴を補強するCBAMを導入したモデルを提案する.
本研究ではVisionTransformerのデータサイズによる精度の変化を確認するとともに,畳み込みニューラルネットワーク(CNN)をベースとしたモデルであるVGGとの精度の比較を行うことを目的としている.結果としてVisionTransformerで79.68%,VGG-16で82.78%の正解率を出すことができた.VVisionTransformerの方が精度が低い結果となった理由としては,事前学習済みモデルで使用しているデータのサイズが小さいということが挙げられる.VisionTransformerの利点はより大きいデータサイズを学習させることができるという点であるだろうと考えられる.
ハイパースペクトル画像(HS画像)はそのスペクトル分解能の高さから、オブジェクトの認識及び分類、セグメンテーション、リモートセンシング等といった幅広い分野に応用されている。しかし、HS画像はRGB画像やマルチスペクトル画像(MS画像)と比べ空間分解能が低いという問題がある。そこで、低解像度HS画像から高解像度HS画像を再構成する超解像度の技術が注目されており、近年では深層学習を用いての研究が行われている。本研究では深層融合ネットワークを用い、勾配を利用してMS画像とHS画像が互いに補完し合える融合モジュールを組み込んだ再構成モデルを提案する。HS画像のデータセットを用いた実験では、従来の手法と比べて精度の向上が確認できた。
車両という大きいカテゴリに対し、車種という狭いクラスを設定することで、個別車種の認識率(分類精度)が向上する事があったため、CNNによる車両認識を行う場合に、車種のクラスに分割して高精度なクラスの認識器を統合することにより、最終的に車両全体の認識より高精度な認識システムができるかについて検討している。本研究では、t-SNEを参考に、クラスの統廃合の検討を行う。
t-SNEはデータの混在を示すため、学習データの統合や削除の候補として、又試行の初期値として、有効であった。
t-SNEが示す2D平面上の距離が近くても、CNNに対しては、認識に悪影響のない事例があった。
t-SNEを活用し、全探索をする前にある程度の認識率の向上が得られた。
3月18日 13:00〜16:30 Meeting 39 座長 陳 キュウ(工学院大)
D-12-41 |
画像データからの注目模様の自動抽出による初見整列直方体の認識
◎萩原大佑・矢野泰樹・木村宣隆・伊藤潔人・知原信博・伊藤誠也(日立) |
D-12-42 |
非接触に計測可能な構造物変位解析手法の比較
◎古川貴仁・迫水和仁・久保祐樹(OKI) |
D-12-43 |
FastGANにより生成したCT画像を用いたCOVID-19の罹患判定
◎横溝裕太・保坂忠明(東京理科大) |
D-12-44 |
360度カメラを用いたパレットの高精度位置姿勢推定ー水平面投影を用いたヨー角修正ー
◎藤枝佑大・喜多泰代・松田一朗・伊東 晋(東京理科大) |
D-12-45 |
身体配置を考慮した遠隔買い物支援ロボットカート
◎山口洋平・萩庭大地・小林貴訓(埼玉大) |
D-12-46 |
加速度情報による病床での動作認識に向けた深層学習のための加速度データの自動ラベル付けシステムの検討
○山本輝弥(小山高専)・野里博和・坂無英徳(産総研)・飯島洋祐(小山高専) |
物流倉庫への労働力安定供給の手段として、ロボットによる作業自動化が期待されている。物流倉庫での物品ピッキング作業では、複数の同種の直方体物品が整列して存在する容器から、物品を取り出す状況が頻繁に発生する。その操作をロボットで実現するためには、隣接する物品同士を区別して、サイズや個々の位置を知る必要があるが、密着かつ整列している物品同士の境界線を直接計測することは難しい。事前に取得した物品の模様情報を認識対象データと照合する手法もあるが、模様情報の準備コストが問題となる。本稿では、認識対象データの中で、複数の物品表面で構成される平面上の模様とその平面の頂点を手掛かりとすることで、少ない準備コストで整列直方体物品の認識を可能とする手法、及びその原理検証実験の結果を報告する。
既設構造物の健全性評価の尺度として、構造物の変位を計測することが有効である。カメラキャリブレーションと呼ばれる処理を用いることで、カメラとマーカーとの間の3次元の位置関係が取得できる。カメラキャリブレーション処理による位置算出の精度評価を行い、評価結果からカメラキャリブレーション処理とサンプリングモアレ法との比較を行う。評価においては、マーカーとカメラを固定した状態で算出された、位置の出力値の標準偏差を用いる。格子周期ベースでの精度を比較した場合、カメラキャリブレーション処理はサンプリングモアレ法に匹敵する精度で計測が可能である。今後は、実環境での運用における適切な撮影条件の調査が求められる。
本研究では, CT画像を用いたCOVID-19に対する罹患判定モデルを畳み込みニューラルネットワークにより構築することを目的とする. クラスラベルが付与された少数の画像から精度の高い罹患判定モデルを構築するため, FastGANを用いて画像を生成し訓練データの拡張を行なう. FastGANは大規模なデータセットを用いずとも, 画像に対する前処理が不要であり, かつ良質の画像を生成することが可能とされている. 生成したデータおよび実際のCT画像を用いてResNet-18のファインチューニングを行なう. 結果として, 陽性画像と陰性画像をそれぞれ2000枚ずつ生成し訓練に用いた場合に, テストデータに対して84.7%の精度を得た. これにより, 生成画像を用いないモデルと比較して3.5%の精度向上を達成した.
フォークリフトでの荷物運搬に使用されるパレットの3次元位置・姿勢の自動検出は,物流自動化の重要な一課題である.先行研究では,360度画像から数メートル先のパレットを検出し,パレット前面への投影像におけるパレットモデルとの一致度より,その位置と姿勢を推定している.しかし,ヨー角の推定精度が安定しないことが課題であった.本研究では,パレット下面水平面に投影した画像を新たに用いることにより,対象パレットのヨー角を精度高く求める手法を提案する.実画像を用いた実験では,ヨー角推定精度が安定して向上し,それに伴い位置精度の改善も見られた.
近年の高齢化に伴い,多くの高齢者が気軽に外出できず,コミュニケーションの機会が損なわれている傾向にある.この問題に対し,我々は,買い物を通じてコミュニケーション不足の軽減を図るため,スマートフォンによるテレビ電話と買い物カートに搭載した全天球カメラを用いて遠隔地から買い物に参加できる通信システムを提案している.今回は現行システムの全天球カメラ映像の見え方の改善のため,人物に自動追従するカートを用いて,人とカートと注目対象でF陣形を形成するシステムを作成した.今後は実際に注目対象の物体を認識して,より自然な振る舞いで追従とF陣形の切り替えを行うことができるシステムに発展させる予定である.
近年、深層学習モデルを用いた動画像解析による動作解析への応用が進んでいる。動画像解析は様々な分野への応用ができるが、情報量の増加やプライバシーの問題が発生する。一方で加速度情報であれば、動画像に比べて通信や処理の負荷を抑え,プライバシーの課題も低減できる.本研究では,加速度情報による病床での動作解析の実現に向け、深層学習による動画像解析を用いた病床での動作毎の加速度センサ情報を抽出,ラベル付けするシステムを提案する.これによって,動作毎の加速度情報へのラベル付け作業を自動化し、加速度センサによる動作解析に必要なデータセット生成に要する手間と時間を削減できる.
休 憩(14:45 再開) 座長 韓 先花(山口大)
D-12-47 |
手指ジェスチャ認識のためのグラフ畳み込みスパイキングニューラルネットワーク
◎三木大輔・上妻賢和(千葉工大) |
D-12-48 |
畳み込みニューラルネットワークによる樹木の健康状態判別手法
◎平川温也・野中琢登・陳 キュウ(工学院大) |
D-12-49 |
時空間特徴融合による映像からの手話翻訳
◎Te ZHANG・島田伸敬(立命館大) |
D-12-50 |
骨格情報を用いた人物間のインタラクション行動認識
◎望月浩平・佐羽内雅人・草野勝大・小平孝之(三菱電機) |
D-12-51 |
力覚強化型 SPIDAR-tablet における仮想物体の輪郭提示評価
◎野原 楓・関和誠也(東京理科大)・佐藤 誠(東工大)・原田哲也(東京理科大) |
D-12-52 |
音声感情を反映できるフォントの自動生成システムの構築
◎土屋奎太・野中琢登・陳 キュウ(工学院大) |
D-12-53 |
先行するユーザの歩行軌跡を模倣する移動ロボット
◎加藤淳志・小林貴訓(埼玉大) |
近年,生物の脳の構造に着想を得たスパイキングニューラルネットワーク(Spiking Neural Network, SNN)を用いた低消費電力なニューロモルフィックチップの開発が行われており,映像認識やジェスチャ認識への適用が期待されている.そこで本研究では,人工ニューラルネットワーク(Artificial Neural Network, ANN)を用いた人物動作解析に用いられるグラフ畳み込みネットワーク(Graph Convolutional Network, GCN)と同様の構造を持つ多層のSNN による人物動作に関する時系列データの解析手法に関する検討を行った.
近年、気候変動に伴い自然災害の被害が大きくなる傾向がみられる。これらの主な原因は、倒木による電線の切断被害や事故現場への道がふさがれてしまったものであると言われている。このような被害を防ぐために、ディープラーニングの代表的なモデルである畳み込みニューラルネットワーク(CNN)を用いて樹木の健全性を効率的かつ定量的に診断して倒木のリスクを検証できるようにすることを試みた。なお行政で行っている樹木の点検は簡易診断と健全度調査の2つである。初めに、簡易診断を対象の樹木に対して行い、その中で詳細な点検が必要と判断された樹木については健全度調査を行う流れになっている。実験結果から、簡易診断に対し、CNNを用いて樹木の健康状態を高い精度で判定することができた。
健常者が使用する言語は、翻訳アプリを使うと、各国の言語の相互通訳が簡単にできる。しかし、手話はGoogle翻訳のように自動的に翻訳することは難しい。この状況には3つの主な原因がある。一つ目の原因は、手話表現は手の動き、口の形、表情が含まれているので、手話が複雑な言語である。二つ目は、手話は継続的な動きを伴う。三つ目は、手話の単語の順序、文法が話し言葉と異なる。手話の時間と空間特徴を同時に学習し、手話翻訳の性能を向上させることを目指す。
映像に映る人物の中から人物間のインタラクション行動を認識することは、群衆行動解析や異常行動検知等の実現や,これらの技術を活用した映像監視業務の効率化や防犯強化に寄与する.本稿では,映像から抽出した骨格情報の時系列を用いて人物間のインタラクション行動の有無を認識する手法を検討し評価した結果を報告する.約20種類のインタラクション/非インタラクション行動の映像を用いた実験において,提案手法の有効性を確認した.
本研究では,力覚強化型 SPIDAR-tabletにおいて,ばねダンパモデルにおける減衰振動の提示手法を用いて,2D物体の輪郭をなぞるように触れることができる2次元力覚提示システムを開発した.そして,タブレット画面上で複数の形状の仮想物体の輪郭をなぞり,その実際のタッチ軌跡とタッチカーソルの軌跡を計測することで,デバイスの力覚提示評価実験を行なった.評価実験の結果,y軸の力覚提示の誤差が大きいことが分かった.x軸y軸の力覚提示の 違いを改善するため,今後はモータの設置位置と新フレー ムの検討を行う.
近年では広く普及しているテレビ番組や動画配信サービスにおいて,メディアが伝えたい感情を表す為にテロップなどで様々な文字が工夫されて使用されている.しかしそのような感情を含む文字を作成するには文字のフォント,デザインなどの複雑な情報を決める必要がある為,高度な専門性が求められている.そこで本研究では特に専門性が要求されると考えられるフォントの決定に注目して音声感情に合わせたフォントの形状変化で表現支援を図る.入力された音声の感情情報は反映したフォントの自動生成システムの構築を試みた.
ロボットと人の協働やロボットによる作業の代替の幅を広げていくために,人の動きを模倣する移動ロボットの研究を行っている.この実現のためには,まず,人と同じ経路をたどれることが必要である.これができるようになると,ロボットに移動経路を教えることが容易になり,ロボットの挙動を周囲に伝える方法として検討している小型ロボットによる先導の実現に近づく.そこで,本稿では,先行するユーザの歩行軌跡を模倣する移動ロボットシステムを提案する.将来的には,ユーザが向いた方向を模倣したり,自己位置推定を行える移動ロボットを使用することで,デバイスを移動ロボットに装着するもののみで行えるようにしていく予定である.
D-13. 知能ソフトウェア工学
3月15日 13:00〜14:15 Meeting 30 座長 柏 祐太郎(九大)
D-13-1 |
アプリケーション開発を想定したDockerセキュリティ演習の提案
◎上岡新平・古川貴一(東京学芸大)・山田侑樹(電通国際情報サービス)・櫨山淳雄(東京学芸大) |
D-13-2 |
ソフトウェア開発PBLで開発されたWebアプリケーションの変更要求による影響範囲の調査
◎浅野耀介・古川貴一・櫨山淳雄(東京学芸大)・鷲崎弘宜(早大) |
D-13-3 |
依存構造マトリクスを利用したマイクロサービス分割方法
○鹿糠秀行・木下崇央(日立) |
D-13-4 |
操作対象物の自動識別によるプログラミングの作業分析支援
○永塚優馬(神奈川工科大)・渡邉秀晃(コンピューターマネージメント)・臼杵 潤(神奈川工科大) |
D-13-5 |
強化学習を用いた規格外野菜の価格自動調整法の基本特性評価
◎岸岡惟蕗・北越大輔・鈴木雅人(東京高専) |
本論文ではコンテナベース仮想化の代表格であるDockerを対象に,意識すべきセキュリティ事項を原則や具体的対策と関連付けてまとめる.その上でまとめたDocker セキュリティ知識を基に,アプリケーション開発者がコンテナ環境の設計段階におけるセキュリティの基礎的な知識を身に着けることができる演習を提案する.
ソフトウェア産業界では, 変更に強いソフトウェアが求められている.しかし, 学生は保守性の高いWeb アプリケーションを開発す
るのは難しい. また,ソフトウェアを開発するにあたって,変更をしやすくするように役割ごとにレイヤーを分けるレイヤード
アーキテクチャが存在する.学生がソフトウェアを開発する上で役割を分けるという重要な慣例をどの程度意識できているのかは明らかになっていない.ソフトウェアの変更要求の実現の際に,変更範囲が局所化されているかを調査し,学生が役割を正しく分離できているか明らかにする.
既存システムの保守性向上などを狙いに,モノリシックアーキテクチャからマイクロサービスアーキテクチャ(MSA) へ移行する事例が増えている.移行のために,既存システムを元に高凝集かつ疎結合となるようにマイクロサービス(MS) の単位を定めて分割する方法がいくつか提案されているが,確立するには至っていない.本論文では,想定する移行先のMSA で必要な要素と依存関係をメタモデルとして定義し,依存関係に基づくMS分割方針を提案する.また,大規模な移行を想定した場合に,要素と依存関係が多くなりMS 分割作業の複雑化が課題となる.そこで,依存構造マトリクス(DSM)を利用し,MS 分割方針に則って分割作業を効率化するMS分割支援ツールを併せて提案する.
情報技術の発展が目覚ましくある中,開発現場での技術者の需要は増加している.しかし,ソフトウェア開発においては技術レベル評価の判断基準に曖昧な点を含み,作業を厳密に評価しにくい問題があると考える.このような中,動作分析手法であるサーブリック分析の17動素に,プログラミング作業独自の動作を追加し,ソフトウェア開発現場に適用可能な動作分析手法を提案した研究がある.しかし,分析の際に撮影動画からの操作対象物,動素の切り替わりや作業時間の識別などを手作業で行っているため分析に膨大な時間を要する問題点と,分析者に依存して分析結果が異なる可能性が残る.本研究ではこの点に着目し,動素の操作対象物を自動識別し,プログラミング作業の撮影動画と動素対象物の操作情報を自動で同期できるようにすることで,再現性ある作業分析とその時間短縮を目指す.
近年,持続可能な社会の実現に向けてフードロスの削減が叫ばれており,量販店で販売されない規格外野菜の有効活用を図る取り組みが注目を集めている.本研究では,規格外野菜を販売するWebシステムにおいて強化学習を用いた価格自動調整法を提案し,基本的特性について評価する.規格外野菜の消費促進に向けて,売れ残りを最小限に抑えたうえで売上が最大になる価格調整の方針(方策)を獲得することを目指し,商品ごとに割り当てられたエージェントが販売の成否や売上の多寡を報酬として方策を改善する.消費者の購買モデルを利用した計算機実験を実施し,固定価格での販売と比較して良好な結果が得られたことを確認した.
D-14. 音声
3月18日 10:45〜11:45 Meeting 11 座長 北岡教英(豊橋技科大)
D-14-1 |
口腔内反射音スペクトログラムの深層学習による5母音サイレント音声認識
◎川戸俊太朗・間野一則(芝浦工大) |
D-14-2 |
Russell円環モデルにもとづく日本語音声感情認識システム構築のための深層学習手法
◎米澤 晴・安藤敏彦(仙台高専) |
D-14-3 |
Sequence-to-Sequence Voice Conversionを用いた発話フィラーの除去
◎山村悠一朗(筑波大)・亀岡弘和(NTT)・安東弘泰(東北大) |
D-14-4 |
時空間分解能の複数化のためにOctave Convolutionを拡張したCNNに基づく旋律抽出法
◎石黒 凜・荒井秀一(東京都市大) |
音声によるコミュニケーションが難しい環境や障碍者のための支援を目的として, 実際の発声を行わずに,口パクや磁気センサ,筋電,脳波等に基づく発話内容を認識するサイレント音声認識(Silent Speech Recognition; SSR)が研究されている.我々は,複雑な装置を必要としない雑音入力応答に基づくSSRを検討している.本研究では,口腔に向けて放射した雑音の反射音を用いて発声内容を識別するSSR手法として,反響音のスペクトログラムの機械学習による反響音特徴の分類による識別手法を提案する.
本研究では,日本語自然対話データベースを利用したRussell円環モデル採用の音声感情認識システムの構築手法を提案する.OpenSMILEを用いて抽出した特徴ベクトルや人間の可聴音に基づいたスペクトル画像であるメルスペクトログラムを深層学習の入力に利用し,Deep Neural Network(DNN),Convolutional Neural Network(CNN)をRussell円環モデルに基づく2次元感情空間を出力値とする回帰問題に対して適用する.感情の出力値の尺度は1~7であり,実験の結果,openSMILE抽出特徴,時間方向で平均化したメルスペクトログラムをそれぞれ入力したDNN手法における評価関数平均二乗誤差(MSE)の値は双方共に0.6程度となった.一方で可変長の音声データのラウドネスの高い区間を切り出し固定長とした音声から抽出したメルスペクトログラムを入力としたCNN手法における学習結果は0.7程度であった.
会話の中に含まれるフィラーは,発話の流暢性を損なう一つの要因となる.そこで本論文では,声質変換のモデルであるS2S-VCに基づいた手法によりフィラー除去を行い、流暢な発話生成を試みた.本手法を検証するため,1話者によるフィラーを含む発話と含まない発話のペアデータを合計13時間分作成した.複数のアーキテクチャに基づくS2S-VCを利用して生成したフィラー除去音声に対して,客観評価と主観評価実験を行うことで流暢性の観点から最も適したアーキテクチャを検討した.その結果,本実験データにおいてはCNNをベースアーキテクチャとした手法が最適であることが分かった.
近年,旋律抽出の分野ではスペクトログラムを入力に用いたCNNによる手法が成果を挙げている.しかしこの手法ではSTFTの際の窓長は固定されており,これにより時空間分解能が単一になってしまうという問題点が存在する.そこで,本稿では複数の時空間分解能を同時に考慮できる旋律抽出法のために,Octave Convolutionを元にこれを拡張した,時空間解像度の異なる入力を持つ旋律抽出法を提案する.medleyDBデータセットを用いて学習し,MIREXで用いられる評価指標で性能を評価した結果,時間,周波数に関わる指標双方で従来手法よりも高い精度を示し提案手法の基本的有効性が明らかになった.
D-15. 教育工学
3月17日 13:00〜17:00 Meeting 34 座長 山守一徳(三重大)
D-15-1 |
CPU設計・シミュレータへのメモリ機能の追加
○福永哲也・池野敦哉・宮部弘暉(岐阜高専) |
D-15-2 |
多様なネットワークを組み合わせて学習する創造的ICT教育プラットフォームシステムの開発
○田中 晶(東京高専)・丸山 充(神奈川工科大)・漆谷重雄(NII)・辻井利昭(阪府大) |
D-15-3 |
xAPIのステートメントで表現したMoodleの学習履歴データの集計
○森本容介(放送大)・古川雅子(NII) |
D-15-4 |
学生の理解度や興味に応じた遠隔/対面受講推薦システム
○小山慎哉(函館高専)・河合由起子(京産大) |
D-15-5 |
コミュニケーションツール上における議論の可視化手法の提案
○篠沢佳久(慶大) |
D-15-6 |
解剖学を対象とした学習支援アプリケーションの開発 ― 書物と比較した際の有用性の検討
○上田秀治(摂南大)・林 亜遊・本岡健太郎(阪医療福祉専)・西 恵理(摂南大) |
D-15-7 |
タイピングによるプログラミング学習の利用を促す試み
○村川猛彦・堀口雄紀(和歌山大) |
D-15-8 |
社会実装教育による小学校プログラミング教育支援の試行
○鈴木雅人・吉本定伸・佐藤聖音・北越大輔(東京高専) |
CPU設計・シミュレータを改良して,メモリ機能を実現しプログラムをメモリ上に配置した.このシミュレータはExcelオンラインでも動作するためにセル関数のみで実現している.そのため,メモリ機能もセル関数のみで実現した.シミュレータのメモリ機能を確認するために,メモリ上のプログラムを書き換えて,プログラムの内容と動作が変化するプログラムを作成した.そのプログラムを動作させてメモリの値の変化を観察することで,シミュレータが正しく動作していることを確認した.また,VBA等のプログラムを使わないのでプログラム実行中のメモリ等の変化が視覚的に理解しやすく,よりCPUの動作が理解しやすいものとなっている.
人・もの・装置全てがつながるモバイル社会となり,高精細映像の普及等により情報量はますます膨大化し,グルーバル化もあいまって,GPS等を用い誰もが必要なものの場所や移動方向を把握しながら状況判断できるようになりつつある.一方,ICT技術者は2030年には約45万人が不足し,競争力ある技術者育成が強く望まれる.そこで我々は,このような状況に応え得る ICT技術者を育成する教材の開発を行ってきた.多数のネットワークプロトタイプを利用し学習者自ら新たなネットワーク機能を創生する構造で,オンライン教育高度化や初等中等教育におけるICT活用環境の整備ともリンクして汎用性を備えた教育システムの設計を目指す.
これまでの研究において,Moodleの学習履歴データを表現するExperience API(xAPI)のステートメントを設計した.本研究では,Moodleのデータベースに蓄積された学習履歴データを抽出し,xAPIのステートメントに変換するツールを開発した.また,Metabaseを用いて,格納したステートメントを集計,可視化するシステムを構築した.Moodleへの日別のログイン回数,クライアントのWebブラウザ,小テストの問題別の正答率等,9種類の集計,可視化を試行し,設計したステートメントが基本的な分析に利用できることを確認した.
遠隔参加型の授業が教育現場に広まっているが、授業内容に対する興味や理解度の高低によって、遠隔授業による学生の学習効果に影響があることが指摘されている。つまり、学生個々の学習意欲や理解度に合わせて、受講学生それぞれの授業参加形態を「遠隔」「対面」に振り分けることで、学習効果や受講満足度を高めることが可能と考えられる。本稿では、国立高専機構で運用されている「モデルコアカリキュラム」による学生の理解到達度データや、学生の興味度を推測できる各種データを用いて、当該科目への興味度を推測し、学生に対して履修すべき科目の推薦、および教員に対して各学生の推奨受講形態(対面・遠隔)を提案するシステムの開発を目指す。
現在,大学の講義においては,学生への連絡,出席管理,講義資料の閲覧,レポート管理やテスト支援などの機能を持ったe-learningシステムが普及し,活用されている.さらに近年ではSlackを始めとするコミュニケーションツールの導入も容易となり,講義内および講義外において,こうしたコミュニケーションツールを活用させることで学生の理解度の向上につながることが期待されている.しかし一方では,こうしたコミュニケーションツールの効果的な運用方法は確立されておらず,運用については教員の技量に任されているのが現状である.本研究においては,講義の補佐的な役割としてチャットシステムを導入し,チャット上で議論された内容を可視化し,教員に効果的に提示する手法の考案を試みる.
解剖学を学習する学生を対象に、教科書(書物)を用いた学習時に困難感を抱く原因についてアンケート調査を行ったところ、筋の立体的な位置関係等を想像することが難しいという意見が多く挙げられた。本研究では、筋の位置関係が立体的に理解しやすい解剖学学習支援アプリケーションを開発し、同一の学習時間における教科書(書物)と比較した際の学習効果について検証することを目的とした。学習前後において、筋の位置関係等のテストに解答させた結果、本アプリケーションは教科書(書物)と同程度の学習効果が得られた。また、本アプリケーションの使用感についてアンケートを実施した結果、機能および使用感について良い評価が得られた。
和歌山大学システム工学部1年生向けのプログラミング科目において,ブラウザを使用してC言語のソースコードの一部または全てを打ち込ませる「タイピングによるプログラミング学習」を実施している.2020年度に開発したWebアプリケーションに,タイプ時間および誤タイプ数に基づいて結果をランク付けして表示する機能を追加した.2021年度の授業実施における状況について報告する.
2020年度から小学校のプログラミング教育が必修化された.しかし各小学校では,文部科学省が示す教育のねらいを達成するための授業を既存の教諭だけで実施するのは難しく,地元教育委員会では,高等教育機関や企業と連携し,その実現を目指している.一方,著者らが所属している高専の使命は,社会で即戦力となる技術者の育成であり,4~5年次に社会実装プロジェクトという必修科目を設置し,地域社会の様々な機関と連携して,社会実装そのものを教育として行っている.本研究では,社会実装プロジェクト及び卒業研究の一環として,地元の小学校と連携したプログラミング教育を実践したので,その概要及び教育的効果を報告する.
(15:00 開始) 座長 森本容介(放送大)
D-15-9 |
リズムを鳴らしたクレペリン作業時における脳波分析
○渡邊博之(日大) |
D-15-10 |
スマートフォンを用いた読書活動データからの未知単語推定
◎東村理功・岩田 基・黄瀬浩一(阪府大) |
D-15-11 |
音読音声と視線情報を用いた漫画英訳本の理解度推定
◎高池太郎・岩田 基・黄瀬浩一(阪府大) |
D-15-12 |
腕の動きとWebカメラを用いた英語問題の確信度推定
◎△田中勢也・Andrew W. Vargo・黄瀬浩一(阪府大) |
D-15-13 |
受講者の顔画像を用いた講義映像における注目箇所の自動検出
◎川又泰介(成蹊大)・赤倉貴子(東京理科大) |
D-15-14 |
Webカメラからの顔動画を用いた学習状態における疲労の推定
◎先川原翔太・加納 徹・赤倉貴子(東京理科大) |
D-15-15 |
敵対的生成ネットワークで合成した顔画像が目視による本人確認に及ぼす影響
○吉川紘史・平良玲緒奈(成蹊大)・安田晶子(一橋大)・小方博之(成蹊大) |
D-15-16 |
登山危険予知トレーニングでのwhat-if展開のための画像加工
○阿部大弥・田母神理沙・嶌田 聡(日大) |
学習時や作業時における脳活動の部位と量を調べることは,作業量の多い学習者のメカニズム解明や効率よい学習法の解明に重要である。これまで,クレペリン作業をモデルとして脳波と回答数との関係を分析してきた。その結果,リラックスと緊張とのバランスを示す指標Cα/Cβの値が大きい学生や,左脳と右脳のバランスが良い学生は回答数が多いことを明らかにした。
本研究では,教員の授業中のテンポに学生の作業が追従できるかを検討している。このため,リズムを鳴らしながらクレペリン作業を行った場合の回答数やCα/Cβとの関係から,作業時における最適リズムを明らかにする。また,最適リズムの有無による作業量の違いを脳活動の部位とCα/Cβから解明する。
本研究ではスマートフォンのセンサデータで得られる読書活動データを用いて,学習者個人の英文読解能力を加味することで未知単語推定の精度向上を目指す.
実験の結果,実験参加者14名のうち12名に対して,読書活動データが未知単語推定に寄与することを確認した.
英語の習得には,新たな語彙の獲得が非常に重要である.そこで,英語の文章とそれを読んでいる時の読書行動から理解度推定を行い,文章中から読者の未知語を抽出することができれば語彙獲得の支援になり便利である.本研究では,漫画英訳本を用いた音読学習時を対象として,音読音声と視線情報から学習者の未知語が含まれた吹き出しを推定する理解度推定手法を提案する.被験者を10名集めて実験を行い提案手法を評価した結果,6名において提案手法のAUPRがベースラインのAUPRを0.11~0.24上回った.
問題演習を通して知識の定着を図る際,学習者は解答の正誤をもとに復習するかどうかを決定することが一般的である.近年,解答の正誤に加え,解答に対する確信の有無を復習すべき問題の判断材料として新たに導入する手法が提案されている.本研究では加速度センサから得られる腕の動きやWebカメラから得られる顔の動きを用いて,比較的手軽に確信度を推定する手法について検討する.実験の結果,腕の動きから得られる情報が筆記問題の確信度推定に有益であること,Webカメラから得られる顔の情報が不正解問題の確信度推定に有益であることを確認した.
本稿では,オンライン講義における学習行動の自動評価を行うシステムを開発するために,顔画像を用いて講義映像中における受講者の顔上げが発生する時点を自動的に特定する方法を検討する.著者らの先行研究で用いていた受講者認証用の顔画像を用い,勾配降下法を用いて講義時点における顔上げ確率を最適化した結果,先行研究で手動定義していた方法とある程度の一致していることを確認できた.
近年の情報通信技術の発展により,大学などの高等教育機関においてもe-learningが広く活用されるようになってきた.以前より,e-learningでは学習の継続性や孤独感による精神疲労・ストレスが発生するといった課題が存在する.そこで,本研究ではWebカメラを用いて学習者の疲労を推定することを目指す.学習中の様子を撮影し,疲労時に現れると考えられる顔の特徴や行動を用いて機械学習による分析を行う.実験の結果,取得した特徴量の中から,疲労と関連が強い特徴量を組み合わせることで,比較的高い精度で疲労を推定可能であることが確認できた.
試験における替え玉受験には様々な手口があるが,その一つに合成写真を利用したものがある.具体的には正規受験者と替え玉の両方の顔写真を合成したものを証明写真に使用して本人確認の突破を試みるものであり,このような合成写真が非常に精巧な場合は本人認証を突破してしまう可能性がある.本研究ではオンライン試験を想定した本人確認実験を行い,GANの一種であるStyleGAN2を使用して生成した合成写真が替え玉受験でどの程度通用するか検証した.
登山事故が増えている。危険予知トレーニングを行うが、日常で経験しない分野は想定が困難である。同じ映像で、実践知の獲得するため状況加工する方法を検討する。本稿では、霧に加工しその効果検証の結果を報告する。
画像の潜在変数を連続に変化させ霧動画を生成し、一人称視点映像と合成する。
初めにテキスト誘導し間を空け画像誘導を行い、危険ストーリーを書く。被験者は登山経験の乏しい男子大学生14人である。
画像誘導が有意に多くなった(p<0.01)。画像誘導で教材から霧と地形の情報が読み取れた。これにより、元の地形情報と誘導する状況の情報を合わせた教材を生成できた。
霧を反映した動画や画像の加工方法を提案し、その効果を検証した。
3月18日 13:00〜17:00 Meeting 34 座長 川又泰介(成蹊大)
D-15-17 |
Scratchによる野菜クイズを作成するプログラミング授業実践
○西尾茉紘・山守一徳(三重大)・瀬野宗一郎(栗真小学校) |
D-15-18 |
Scratchを用いたドラムリズム学習とプログラミング授業実践
○金児優大・山守一徳(三重大)・東山順子(一身田小学校) |
D-15-19 |
Scratchを用いた約分プログラミングの授業実践
○松本幸大・山守一徳(三重大)・三谷哲也(西が丘小学校) |
D-15-20 |
ゲーム得点の平均値を求めるプログラミング授業実践
○山岸由季・山守一徳(三重大)・大西由佳利(栗真小学校) |
D-15-21 |
Scratchを用いた鍵盤作成プログラミングの授業実践
○西山知春・山守一徳(三重大)・黒田薫子(一身田小学校) |
D-15-22 |
教員養成学部における正課外の教え合い支援によるプログラミング言語教育の試み
○野村厚志・中田 充・葛 崎偉・北本卓也・熊谷武洋(山口大) |
D-15-23 |
Processingを用いた学習向け並列プログラミング環境の改善
◎前川 翔・水谷泰治・西口敏司・橋本 渉(阪工大) |
D-15-24 |
小学校,中学校および高等学校におけるプログラミング教育に関する興味の調査・検討
◎中川航太・今村 孝(新潟大) |
対象は小学5年生であるため、パソコンの基本操作は慣れていると考え、プログラムの動きを考えさせるクイズのプログラミングに取り組んだ。野菜を根、茎、葉などの食べている部位によって分類する食育クイズを題材とし、Scratch3.0にて開発した。野菜を題材にしたのは家庭科が始まる学年であり、食材について学びながらもプログラミングやタイピングを学ぶことができると考えたからである。
近年、タブレット端末等の導入により、コンピュータを使ってリズム学習を行うことができる。ゲームセンター等でよく見かける和太鼓のリズムを教えることもできるが、体育でダンスを教えるようになり、小学生にヒップホップダンスで使われる8ビート、16ビートのリズムを教えることも役に立つと思われる。そこで、ドラム演奏の右手と左手の動きを真似させるScratchアプリを作成し、45分授業の中でビート練習させると伴に、部分的なプログラミングを体験させる授業実践を行った。
2020 年より新しい学習指導要領が小学校で全面実施となり、既存の授業の中でプログラミング的思考の育成が求められている。プログラミング教育の必修化に伴い、近隣の小学校へ学年に合わせた題材を用意し授業実践を行っている。本研究では Scratch3.0 を用いて、小学校 5 年生に分数の足し算をタブレットで演習させるだけでなく、約分するプログラムを作成させる授業実践を行ったので、その内容を報告する。
現在、小学校でタブレットの導入やネットワーク環境や教材の整備が行われ、「プログラミング的思考」を育む授業の実施が求められている。そこで、小学校6年生に対して、ゲームから得られた得点の平均値を求めるプログラムを作成し、アルゴリズムの基礎に触れ、繰り返し処理を必要とするプログラミングを体験する授業を行った。教材ツールとしてScratch3.0を用いた。
小学校3年生でもプログラミングを経験し始めており、日頃ゲームで遊ぶだけでなく、コンピュータの仕組みに興味を持たせることは、コンピュータをより適切に効果的に活用できるようになることに繋がると思われる。それにはまず、プログラムに触った時に楽しい思いをすることが重要である。そこで、Scratch3.0を用いて身近なピアノの鍵盤を、自らプログラミングをすることを通して完成させ、演奏してみるという授業を行った。
発表者らが所属する教員養成学部では、高等学校情報科の教員養成を行っている。情報科においては、プログラミング言語の履修があり、教職を目指す学生はその十分な修得が必要となっている。しかしながら、限られた授業時間の中では修得が不十分となる者もおり、全体としてのレベルアップの必要性を感じている。この発表では、発表者が所属する課程におけるカリキュラム、プログラミング言語修得に関する授業内容、令和3年度より試行の正課外活動「教え合い支援」を含めたプログラミング教育の状況を報告する。試行結果からわかってきた課題や次年度の計画についても報告する。
Processing言語を用いた学習用の並列プログラミング環境が提案されている.この環境ではマルチスレッドでプログラムを並列処理しても十分な高速化の効果が得られず,学習用途に用いるには不十分である.また,性能測定を支援する機能が不足しており,並列プログラミングの初学者にとって利用しにくいものとなっている.これらの問題に対し,本研究では描画領域の統合方法を変更することで高速化を実現した.また,並列プログラムを実行した際の実行時間の測定と結果の表示を行う機能を実現した.
学校教育における「動機づけ」では,学習者の興味が重要視されている.しかしながら,小学校,中学校,高等学校において順次必修化されているプログラミング教育に関して,生徒を対象とした意識調査を行った事例は少なく,「動機付け」に資する興味や要因等は明らかになっていない.
そこで本研究では,小学校,中学校,高等学校の生徒を対象に,アンケート調査とその分析を行い,プログラミング教育に関する生徒の興味・関心について,年齢および学校進行に伴う変化とその要因の把握を試みた.本報では,アンケート調査の回答状況と,その相関分析・重回帰分析などの結果を示し,プログラミング教育のスムーズな導入・展開への寄与を目指す.
休 憩(15:15 再開) 座長 岩田 基(阪府大)
D-15-25 |
人間関係学習を目的とした人工学級ゲームの開発の試み
◎近藤秀憲(新潟大)・谷 賢太朗・神蔵貴久(新潟医療福祉大)・穴沢幸二(ラネクシー)・田中恒彦・山﨑達也・前田義信(新潟大) |
D-15-26 |
知的財産法学習支援システムの使われ方と学習スタイルの関係
○赤倉貴子・加納 徹(東京理科大) |
D-15-27 |
PBL教育で学生のミーティング参加姿勢を評価する手法の検討
○袖 美樹子(国際高専)・伊藤隆夫・新 聖子・宮崎慶輔(金沢工大) |
D-15-28 |
教材文書の構造にもとづく基礎発展関係の抽出
○藤井翔子・阿部晋矢・小松佑人・藤津 智・西村 敏・藤沢 寛(NHK) |
D-15-29 |
チーム戦術想起のための認知促進手法に関する一検討
○竹内寛典・松浦健二(徳島大) |
D-15-30 |
中等教育を対象とした「考える力」向上のための幾何学教材の開発
○藤井研一(阪工大) |
D-15-31 |
英語空所補充問題の自動生成
◎森瀧瑞希・湯浅成章・Andrew W. Vargo・黄瀬浩一(阪府大) |
いじめは自殺の原因になるなど今日の社会問題として解決すべき課題である.本研究ではいじめ問題を解決するためのモデルをベースとして,実際の生徒がプレイヤとして参加可能な人工学級ゲームの開発を行った.
著者らは知的財産法を受講中の学生用学習支援システムを開発している.本稿では,学生特性に適応したシステムとするため,学生のシステムの使い方と学生の特性(Felderの学習スタイル利用)の関係を分析した.その結果,講義ビデオ視聴システムの利用時間が長い学生は「順序的」であり,条文学習システムの利用時間が長い学生は「アクティヴ」「全体的」であった.一方,成績上位者と成績下位者では,上位者は学習スタイル特有の使い方であり,下位者はどのシステムもあまり使っていないか,どのシステムも使っているようで実際には操作ログがほとんど変化ないなどの使い方であった.そのため,それぞれの学生の学習スタイルに適応したシステムの使い方に誘導することが望ましいと思われた.
PBL教育に於いて複数グループの同時把握には時間的な難しさがある。この問題を解決するためには視覚的、直感的に状況を把握できる仕組みが必要である.我々は,感情分析技術の適用を検討した.本稿ではその検討方法と検討結果を報告する.
教育分野では超スマート社会「Society5.0」に向けた「学校 ver.3.0」が提案され,個別最適化された学びが注目を集めている.我々は,教育コンテンツに対して関連するコンテンツを推薦する際に,コンテンツ同士の関係性を明示することが学びの個別最適化につながる可能性を示した.既存手法では,あるコンテンツに対して他のコンテンツへの関係性を人手で付与していたが,関係性を付与すべきコンテンツ数は膨大である.そこで本稿では,教育コンテンツの学習順序の関係性を自動抽出することを目指して,教材文書の構造に着目した単語間の基礎発展関係の抽出手法を提案する.
バスケットボールなどのチームスポーツでは,個々のプレイヤの基礎技能だけでなく,集団戦術の優劣や習熟度がゲームの勝敗を分ける.また,戦術が効果を発揮するためには,チームメンバによる戦術の共有だけでなく,ゲーム中に生起される動的状況に対する最適戦術の選択・実行が求められる.チームスポーツの戦術を述べる上では,そのほとんどが静的な戦術そのものの優位性や習熟度向上に終始しており,この「ゲーム中の状況に適した動き」に着目した研究はほとんど見られない.
そこで,本稿では「ゲーム状況に適したチーム戦術の選択」という課題をとりあげ,学習者個々の認知促進を支援する環境設計を述べる.
工学および情報科学分野の国際競争はますます厳しさをましており、能力を有する技術者の育成は必須のものと考えられる。このような技術者に要求されるものとして「考える力」が重要視され、学校教育においても注目されている。このような考える力の元となる論理的な思考力を身につけるために、数学学習の役割は非常に大きい。本格的な数学学習が始まる中学校における数学学習を全ての学生が効果的に学ぶことは非常に重要と考えられる。特に、中等教育における幾何学学習は厳密な論証を必要とし、論理的思考を築くために欠かせないものである。
この幾何学学習における合同等の証明問題を支援する教材をタブレット上に作成してきたが、今回は図から読み取った合同条件を明示する部分を加えることができた。これにより学習者は図に集中して考えることで合同証明ができることになる。これにより証明問題の理解に至ることが容易になるものと考えられる。
空所補充問題は英語の学習のためによく用いられる演習方法である.空所補充問題では,多くの数の問題をこなすことで,知識の完全な定着を狙うことができる.このためには,多くの空所補充問題を用意する必要がある.しかし,空所補充問題の作成における空所の作成は経験豊富な問題作成者によって行う必要があり,大量に用意するのは難しい.本研究では,空所補充問題の自動生成のために自然言語処理モデルを用いて英文の中から空所とすべき単語を決定し,空所補充問題を自動生成するシステムを提案する.実験の結果,経験豊富な問題作成者による,知識の定着や実力の確認を目的とした空所補充問題を一定の精度で再現できることがわかった.
D-16. 医用画像
3月15日 9:00〜10:30 Meeting 30 座長 中尾 恵(京大)
D-16-1 |
伸展固定肺CT画像の高精細化
◎井坂勇貴・中山良平・檜作彰良(立命館大)・永谷幸裕・北原 均・渡邉嘉之(滋賀医大) |
D-16-2 |
肺腫瘍検出における適切な画像データ拡張方法の検討
◎Cher Yen Tan・山﨑達也(新潟大)・山崎元彦(新潟大医歯学総合病院) |
D-16-3 |
Modified Skip-GANomalyによる胸部CT画像の異常検知
◎渋谷恒介・中山良平・檜作彰良(立命館大) |
D-16-4 |
教師なし学習を用いたskip VAEによる胸部CT画像の病変検知
中山良平・檜作彰良・◎Zhihui GAO(立命館大) |
D-16-5 |
早期肝細胞癌の病理診断支援-細胞核による鑑別-
◎畑仲 駿・佐々木陽祐・高橋正信(芝浦工大)・中野雅行(横浜市大) |
D-16-6 |
ベルリンブルー染色標本を学習に利用したアスベスト小体の自動検出
○張 浩達・武山彩織(東工大)・木村文一(信州大)・山口雅浩(東工大) |
本研究の目的は,高解像CT画像から,CT装置で撮影された高精細CT画像より微細構造を鮮明に描出する高精細化CT画像を生成することである.実験試料は,9症例(1症例あたり97~269スライス画像)の伸展固定肺CT画像である.提案ネットワークは,低解像画像を入力とし,入力低解像画像とその高解像画像との差分である高周波成分を推測する.そして,推測された高周波成分画像を入力低解像画像に加算することにより,高解像度化画像を生成する.提案手法のblur detectionは24767.7で,高精細CT画像(17010.4),従来手法(11364.5)より高く,ボケが少ない鮮明な生成画像が得られた.
本研究では,診断における放射線科医の補助のための肺腫瘍自動検出システムの構築を目的とする.肺腫瘍の自動検出を行うにあたり,物体の輪郭まで検出できるMask R-CNNという物体検出モデルに着目した.Mask R-CNNが物体検出において高い性能を発揮するためには大量のデータが必要であり,そのためにデータ数を増加するデータ拡張が重要である.本実験ではCT画像における肺腫瘍検出にあたっての適切な画像データ拡張方法について調査した.その結果,最も精度の高いモデルは左右反転,上下反転,リサイズの3つの拡張方法を組み合わせたモデルであることが分かった.
本研究の目的は,Feature matching損失を用いたModified Skip-GANomalyにより,CT画像上の病変を異常検知する手法を開発することである.実験試料は検診で撮影されたCT画像300例(正常260例,異常40例)である.提案ネットワークはGANomalyのGeneratorにSkip Connectionを追加した構造である.学習時,敵対損失の代わりに,Feature matching損失を用いることにより,Discriminatorの過学習を抑制する.提案手法のROC曲線下の面積は0.61で,従来手法であるSkip-GANomaly(0.57)よりも高い結果が得られた.(298/300)
本研究の目的は,VAEによる画像の再構成精度を向上させるため,skip結合を導入した2つのDecoderを持つskip VAEにより,CT画像の病変を異常検知する手法を開発することである.実験試料は検診で撮影された350例(正常280例,異常70例)の胸部CT画像である.学習時,“入力画像と生成画像間の平均二乗誤差”と“潜在変数の確率分布と正規分布の一致度を評価するカルバック・ライブラー距離”を加算した損失関数を用いた.提案手法を評価用データに適用した結果,ROC曲線下の面積は0.76で,従来手法のVAE(0.74)より高い結果が得られた.
早期肝細胞癌は構造異型や細胞異型が小さい場合が多く,特に単体の細胞や核から癌/非癌を鑑別するのは非常に困難である.本研究では細胞核1個の画像だけで早期肝癌の癌/非癌の鑑別が可能であるかを検討した.全ての標本の画像を用いて深層学習した場合は十分な精度が得られなかったが,標本をグループに分けて学習することで精度が改善され,細胞核単体で癌/非癌を鑑別できる可能性が示された.グループ化に際しては,標本ごとに学習したネットワークで評価した正解率を特徴量と捉え,特徴量の類似性を参考にした.また,顕著性マップを求めた結果,主として核の輪郭部と核小体が判定に利用されていることが分かった.
肺がん・中皮腫などの病理診断では、公的救済制度の適用可能性を確認するために、アスベスト小体の存在を確認する必要がある。しかし、H&E染色(ヘマトキシリン・エオジン)染色病理標本から目視で確認する作業には多大な時間や手間を要する。本研究はH&E染色標本の全スライド画像(WSI)から深層学習に基づいてアスべスト小体を自動検出する技術により、病理医の負担軽減を図ることを目的とする。深層学習を病理画像解析に適用する際には膨大な教師データの準備が課題となる。そこで本研究では、同一標本を異なる染色方法でデジタル画像化したデータを用いて、教師ラベル付きデータセットを半自動で作成する。また、それを元に2種類の自動検出手法の検証を行った。
D-17. ソフトウェアインタプライズモデリング
3月18日 9:00〜10:15 Meeting 24 座長 仲田知弘(第一工科大)
D-17-1 |
Word2Vector による口コミ解析に基づく企業間の類似度測定
◎山口珠々・柿本陽平・豊谷 純・大前佑斗(日大) |
D-17-2 |
重回帰分析によるサウナ店舗属性に対する顧客評価の推定
◎出川健太・豊谷 純・大前佑斗(日大) |
D-17-3 |
楽曲属性から人気度を推定するニューラルネットワークの構築
◎野呂颯汰・柿本陽平・豊谷 純・大前佑斗(日大) |
D-17-4 |
深層学習と慣性センサによるバドミントンにおけるサーブフォームのクオリティ判定
○大前佑斗(日大) |
D-17-5 |
ゲームの要素を導入した排出権取引市場のモデル化
○仲田知弘(第一工科大) |
学生が就職活動などで企業選択をする際、多くの場合、扱う技術などに注目することが多い。一方、別の視点として、特に「働きやすさ」に注目するという考え方もあるだろう。しかし、「働きやすさ」を定量的に測定することは難しい。そのため本研究では、ある会社と別の会社の「働きやすさ」が類似しているかどうか、会社に投稿された口コミ情報から測定する手法を提案する。本手法は、形態素解析と Word2Vector を利用している。
サウナの新規店舗出店や経営改善を行うには、どの属性に投資すべきかを把握しておく必要がある。このためには、サウナの店舗を特徴付ける要素(サウナの温度、水風呂の温度、駅からの距離、ロウリュの有無など)が、そのサウナへの人気にどの程度寄与しているのか、明らかにしておくことが望ましい。そのため本研究では、サウナの店舗を特徴付ける要素から、そのサウナへの人気を求める回帰モデルを、重回帰分析により構築する。本講演では、特に分析結果と考察について言及する。
近年,楽曲作成を容易にするツールが登場しており,YouTube などには多数の楽曲が登録されている.一方,需要者(音楽を聴く側)の総量に対して供給過多の側面があり,ヒットする楽曲を作り出す難易度はICTが普及する前よりも相対的に上昇していると思われる.この状況下では,実際に作曲を行う前にどのような楽曲であればヒットするのか判断できることが望ましい.そのため本研究では,楽曲属性を入力すると,ヒットするか否かを推定するモデルを構築する.構築手法として,商品の需要予測での活用事例があるニューラルネットワークを採用した.
アスリートの動作パフォーマンスを向上させるには,動作の良し悪し(クオリティ)を正確に判断できる環境があることが望ましい.そのため本研究では,加速度・角速度信号を入力とする畳み込みニューラルネットワーク(CNN)によりクオリティを判定するモデルを構築する.クオリティ判定を行う動作の対象は,バドミントンにおけるサーブフォームである.
近年,温室効果ガスによる地球温暖化が問題となり,2005年から欧州連合等が温室効果ガスの排出権取引市場を開設している.この取引市場は,各国が定めた温室効果ガスの削減目標を達成させるため,環境問題に経済学的な視点を導入した手法である.
本研究では,地球の温室効果ガスを削減するためにゲームの要素を導入した排出権取引市場のモデルを提案し,プロトタイプを製作し検証する。ゲームの要素とは,多くのゲームで用いられているポイント制度を導入することである.
D-18. リコンフィギャラブルシステム
3月18日 13:00〜14:15 Meeting 28 座長 泉 知論(立命館大)
D-18-1 |
FPGAの動的再構成を用いた災害管理エッジAIシステムの基礎検討
◎藤森颯真・伊藤智義(千葉大) |
D-18-2 |
エッジAIの実現手法の検討
○西岡 駿・中西知嘉子(阪工大)・那須 督(三菱電機) |
D-18-3 |
推論処理における畳み込み処理の回路化の検討
◎大戸彰馬・中西知嘉子(阪工大) |
D-18-4 |
Convolutional Auto Encoderモデルの組み込み機器実装における効率的なメモリ割り当て方法の検討
○川岸悠介・米田亜希子・山本 亮・小川吉大(三菱電機) |
D-18-5 |
FPGAによる固有値計算のアクセラレーション
○浦本真人・井口 寧(北陸先端大) |
災害による被害を抑えるためにIoTを用いた災害管理システムが提案されている.しかし,都市全体への普及には至っていない.そこで我々は,FPGAの動的再構成を用いて平常時と災害発生時で回路を切り替えるとともに,通信方法もサーバーに依存しないローカルなネットワークに切り替えるエッジAIシステムを提案する.このシステムにより都市に普及しているIoTデバイスを有効活用する災害管理の方法を検討している.基礎検討として,プロセッサが搭載された2台のFPGAでシステムを構築した.FPGAはサーバーとの通信断絶時を緊急時と判断し,FPGA間で直接通信を開始するとともに,機械学習の推論回路に書き換わる.推論結果はスマートフォンから閲覧可能としている.
近年,飛躍的な進化を続けるAI技術に対し,回路での対応は開発時間が重く,変化に対応しづらい.また,ソフトでの対応は機体に対する性能の要求が高くなってしまう.本論文では適応型SoCを用いる事で,解決を図る.対象としたAI技術はEfficientNetb0.使用した機体はUltra96v2である.回路化を行うのは畳み込み層であり,対象の特徴を回路設計に取り入れる事で,高速な回路の制作を行う.実機で検証を行った結果,CPUのみで動作させた場合と比べ,約5倍早くなった.また,畳み込み層のみで比較を行うと9倍の早さになり,精度の低下も見られなかった.この手法を用いれば,他のAI技術に関しても,エッジデバイスでの動作が実現できると考える.
近年,小型なエッジ端末でリアルタイムに推論処理を行うことが注目されているが,現在のエッジ端末には低性能なものが多く,リアルタイムで実行することが難しい.
そこで我々は,ディープラーニングの推論処理で最も時間のかかる畳み込み演算処理をFPGAで処理し,その他の処理をCPUで処理することでリアルタイム性を実現する手法を検討している.
本稿ではUltra96v2を使用し,RegNetとVGG16の2つのモデルで畳み込み層の1つであるConv2D層を回路化し,推論時間を測定した.結果として,2つのモデルは回路適応前と比べて回路適応後は処理時間が大幅に短縮できた.
FPGAなどの組み込み機器でConvolutional Auto Encoder(CAE)モデルによる異常検出を行うには多くの課題があり、CAEモデルの中間データを効率的にメモリに割り当てることはその課題の1つである。本稿では一般的な組み込みOSで採用されている動的割り当てよりも効率的なメモリ割り当て方法を検討して、CAEモデルの中間データの確保に必要なメモリ容量を評価した。その結果、提案手法はメモリの内部断片化の発生により動的割り当てよりもわずかに必要メモリ容量が大きいことがわかったが、提案手法に含まれる干渉グラフ生成において適切にグラフ分割できれば内部断片化を発生させず、動的割り当ての必要メモリ容量の約75%に抑えられる見込みである。
固有値計算は数値計算における重要な問題であり、大規模計算ではスーパコンピュータを用いる。しかしCPUは原理的に逐次処理である為、並列処理に限界がある。FPGAでは専用回路を柔軟に構成できHW処理効率を高くできる利点があるが設計コストが高かった。近年は高位合成技術により簡易に専用のHWを実装できるようになってきている。本研究ではXilinx社が提供するOpenCLベースのアクセラレーションプラットフォーム(SDAccel)を使用し、固有値計算専用のFPGAアクセラレーションを行った。行列の要素を512x512までスケールさせ、リソースと処理時間に
ついては設計コストに対してリーズナブルな結果が得られた。
D-19. 情報通信システムセキュリティ
3月17日 13:00〜15:30 Meeting 22 座長 佐藤将也(岡山県立大)
D-19-1 |
能動的なIDSにおけるNDP悪用攻撃の検知可否の考察
◎太田永遠・岡村真吾(奈良高専) |
D-19-2 |
深層学習を用いた予測に基づくDNSへの異常検知手法の評価
○木村知史(東京医療保健大)・稲葉宏幸(京都工繊大) |
D-19-3 |
時系列に対応した深層学習によるサイバー攻撃検知
◎湯山樹弥・八槇博史(東京電機大) |
D-19-4 |
人工知能搭載型サイバーレンジの仮想環境を用いた実装
◎西井雅人・八槇博史(東京電機大) |
D-19-5 |
正常通信への影響を考慮したURLシグネチャの自動生成および影響評価システムの設計と実装
◎藤井翔太・川口信隆・小島将耶・鈴木智也(日立)・山内利宏(岡山大) |
IPv6に用いられる近隣探索プロトコル(NDP)を悪用した攻撃への対策として,能動的なIDSにより検知する研究が行われている.
その研究には考慮されていない仮定や検知できない攻撃があるため,それらへの対策を提案する.
また,どのようなときに検知できるのか検知できないのかといった条件を明らかにする.
著者らは,DNSオープンリゾルバを探索する行為やDNSを利用したDDoS攻撃の一種であるDNS amplification攻撃を自動的に検知するために,
単位時間あたりに観測されるDNSパケット数を深層学習の一種であるLSTM へ適用し,その出力値を利用することで,予測をベースとするDNSへの異常検知手法を検討している.
これまでの検討で,攻撃検知精度が60%程度であること,実験期間が9日と限定的であり提案手法の再現性や信頼性の点に課題があった.
本稿では,複数の実験期間を用いて提案手法の予測精度と攻撃検知精度の評価を行い,提案手法の一般化可用性について評価を行う.
近年、サイバー攻撃検知技術に機械学習を用いる研究は数多く行われている。しかし、時系列を扱う機械学習技術は未だに発展途上であり、サイバー攻撃検知に使える強力な時系列モデルは知られていない。このため、既存の時系列を取り扱えるアルゴリズムでの検討を行う。Kyoto 2016 DatasetとCIC-IDS2017を対象に、Long Short Term Memory(LSTM)とGated Recurrent Unit(GRU)を用いた検証を行う。攻撃の種類で多値分類を行った結果について述べる。攻撃パケットを時間単位で分割し、一定の時間単位例えばある週の攻撃動向を元にその翌週の攻撃をどれだけの精度を以て検知できるのか実証する。
近年増加する標的型攻撃の攻撃技術の進化によって近い将来、マルウェアにAIが組み込まれた攻撃が予想される。 そこで、人工知能搭載型サイバーレンジの検討や、人工知能技術を用いた攻撃手法の自動生成と実験が行われてきた。これらを統合し、AIによる攻撃と防御を検討するために仮想ネットワークでソフトウェアの領域で攻撃できる環境が必要であると考え、攻撃を行うための仮想化サイバーレンジを構築し、防御側AI基盤の共進化シミュレーション基盤との関連について考察を行う。
悪性通信を遮断するためのシグネチャには,悪性通信を遮断することに加えて,普段の業務での良性通信は遮断しないことも要求される.このことから,シグネチャの生成は業務理解度が必要であり,属人性が高い.加えて,実運用に際しては,生成したシグネチャが良性通信を妨げないか等の影響評価テストも必要であることから,運用コストも高い.
そこで,我々は,良性通信を妨げることなく悪性通信を遮断するシグネチャを自動で生成しつつ,同シグネチャの影響評価を自動で実施するシステムの研究開発を進めている.これにより,シグネチャ生成における属人性の抑制,影響評価に係るコストの低減,およびシグネチャ適用可否判断の支援等が期待される.本稿では,同システムの設計と開発を述べるとともに,実装したプロトタイプを用いて実施した評価の結果を報告する.
休 憩(14:30 再開) 座長 山内利宏(岡山大)
D-19-6 |
Web プッシュ通知の制御による利用者保護手法の提案
○佐藤将也・渡邊 響(岡山県立大) |
D-19-7 |
医療分野における簡便かつ安全な電子的本人同意取得方法の検討
◎宇都宮大河・小尾高史・Joong-Sun Lee(東工大)・秋元孝博(NEC) |
D-19-8 |
FIDOユーザビリティと関連するセキュリティ問題について
◎大崎康太・八槇博史(東京電機大) |
D-19-9 |
認識器クローンに対する防御を目的とした信頼度改変処理の検討
○浜崎大輔(阪大)・中村和晃(東京理科大)・新田直子・馬場口 登(阪大) |
Webプッシュ通知の利用拡大に伴い,Webプッシュ通知の悪用の可能性がある.例えば,フィッシングにWebプッシュ通知が利用される可能性がある.フィッシング防止のためのURLリストが配信されているが,URLリストに含まれないWebサイトへ誘導された場合に対処できない.また,利用者の不安を煽るようなWebプッシュ通知を用いられた場合,利用者の求めていない製品の購入ページに遷移させられる可能性もある.そこで本稿では,キーワードを用いてWebプッシュ通知を制御する手法を述べる.
オンライン保険資格確認や地域医療情報連携ネットワークが制度化され、医療機関では電子カルテが普及しつつある。一方で、患者から同意取得の場面では、紙の同意書への手書き署名などが使われている。手書き署名を代替する手段として、電子文書への電子署名がある。公的な手段としてはJPKI電子署名機能があるが、これには利便性の面で課題がある。これらの課題を解決し、より利便性の高い電子的同意取得の手法を提案することがこの研究の目的である。本稿では、顔認証とJPKIを組み合わせた新しい本人確認の手法を考案した。これを登録時の本人確認に用い、署名利用時にはFIDOを用いることで、安全性を保証しつつ簡便な同意取得を実現する。
FIDO(Fast IDentity Online)は、公開鍵基盤を軸としたパスワードの代替として、FIDO Allianceに提案された認証メカニズムである。多くの企業が参画し、W3Cとの提携から普及が見込まれる。研究でもセキュリティやユーザビリティ等様々な形で行われている。しかし、それぞれの分野をまとめた論文および相互に関連付けて考察しているものは少ない。本研究では、FIDOのユーザビリティとセキュリティに関する論文や指針をまとめ関連付けることで、今後の攻撃傾向について考察していく。
ユーザから送信された入力画像を認識し,その結果を信頼度と共に返送するクラウドサービスが普及しつつある.一方で,このようなクラウド認識器に対し多数のデータを送信して認識結果を取得し,それを基に元の認識器と同等の機能を持つ「認識器クローン」を作成する攻撃の危険性が指摘されている.これに対する防御法として,認識器クローンを事後的に検出することが考えられる.クローン検出に適した特性を認識器クローンに対し能動的に付与できれば,検出精度の向上が期待できる.本稿では,そのための処理として,オリジナル認識器が信頼度を改変して返送することにより認識器クローンが特定の出力特性を持つように誘導する手法を検討する.
D-20. 情報論的学習理論と機械学習
3月16日 9:00〜11:45 Meeting 43 座長 中村和晃(東京理科大)
D-20-1 |
差分プライバシー基準による機械学習の学習データ保護
◎△小松史弥・竹川高志(工学院大) |
D-20-2 |
自己教師あり学習における事前学習手法とモデル構造の解析
◎阿部央季・長尾智晴(横浜国大) |
D-20-3 |
ドメイン適応による半教師有り学習の精度のばらつき軽減の検討
○川村聡志(OKI) |
D-20-4 |
1つの正例と線形回数の所属性質問による変数次数が定数である線形順序項木パターンの言語族に対する質問学習アルゴリズム
○松本哲志(東海大)・鈴木祐介・内田智之(広島市立大)・正代隆義(福岡工大)・宮原哲浩(広島市立大) |
D-20-5 |
球面SOMにおける木探索を用いた勝者ノード探索
○吉岡宏樹・堂薗 浩(佐賀大) |
近年データの収集と機械学習により,様々なデータ活用が可能になった.一方,データの利用機会が増加することで,機械学習モデルからのデータ侵害についても指摘されている.例えば,メールの文章を学習し電子メール作成中に入力候補を提示してくれるシステムでは,クレジットカードに関するテキストの候補として誰かのクレジットカード番号が提示されてしまう可能性がある.本研究ではデータ侵害対策として,TensorFlow Privacyで提供されている差分プライバシーを満たしたアルゴリズムにて,テキスト生成タスクに取り組んだ.ここで個人情報に見立てたデータ暴露の有無を実験した.結果データ暴露の回避が確認できた.
近年, ラベルを用いずに学習する自己教師あり学習の手法が数多く提案されているが, モデル構造に着目した研究は限られている. 本研究では自己教師あり学習で学習したモデルの特徴表現を解析する. Convolutional Neural Networks(CNN) とVision Transformer(ViT) を対象とし, 事前学習済みモデルを用いて未知画像の分類精度, 出力表現の類似度の観点から解析を行う.
その結果, 代表的なモデル構造では自己教師あり学習は教師あり学習より汎用的な表現を学習していることを確認した. さらに, 教師あり学習と自己教師あり学習の学習手法は大きく異なるにも関わらず, CNNの出力表現は類似していることが示された.
高度な画像認識を実現可能であるディープニューラルネットワーク(DNN)において,教師データの作成作業にかかるユーザの負担を軽減するため,近年様々な半教師有り学習(SSL)の手法が提案されている.しかし,SSLでは教師データの作成対象に任意性があり,それにより認識精度にばらつきが生じる可能性がある.そこで本稿では,教師無しドメイン適応(UDA)のコンセプトをSSLに応用し,精度のばらつきを軽減する効果について検証する.
計算論的学習理論において,質問学習モデルは質問を用いた学習の数学モデルである.この質問学習モデルにおいて, 線形順序項木パターン言語族が1つの正例と正例のサイズの2乗回の所属性質問を用いて質問学習可能であることが示されている.本稿では, 線形順序項木パターン言語族の部分族が, 1つの正例と正例のサイズの線形回の所属性質問を用いて質問学習可能であることを示す.
自己組織化マップ(SOM)で大量のデータを解析する場合,一般的に,ノードの数を多く設定する.しかしながら,ノードの数を多く設定すると勝者ノードの探索に時間がかかる.また,SOMの特徴として,マップの端が存在するため,勝者ノードの位置によりマップの更新領域に違いが生じる.本稿では,勝者の探索時間を短縮させつつ,勝者ノードの位置による更新領域の違いをなくすために,球面上で木探索を適用して勝者を探索するSpherical Tree Structured SOM(S-TS-SOM)を提案し,その有効性を確認する.
休 憩(10:30 再開)
D-20-6 |
エッジAIにおける高速な異常検知システムの実現
◎増井大輝・中西知嘉子(阪工大) |
D-20-7 |
LSTM-FCNを用いた時系列データの異常検知
○佐藤健太郎・田中 真(東海大) |
D-20-8 |
ラグ度に基づく損失関数
◎久島遼太・山田哲靖(諏訪東京理科大) |
D-20-9 |
時系列データの動的な視覚化
◎児玉 旭・村田 昇(早大) |
D-20-10 |
時系列予測におけるgMLPの性能評価
○土井聖也・小林亜樹(工学院大) |
近年、世の中では工場等の生産レール等において画像認識AIを用いた異常検知が注目されている。また、機材スペースや消費電力を抑える、かつ現場で使用可能なエッジ端末上での実現が求められている。本発表では、異常検知手法の一種である局所外れ値因子法 (LOF)を、エッジ端末上で高速動作させる。高速動作の手法として、LOFに学習させるデータを削減する。削減するデータを人為的に決定することは困難なため、本発表では学習させたデータの削減手法を提案する。本発表の削減手法を適用した結果、LOFの処理時間を約3倍の高速化を図ることが出来た。
宇宙機が一度宇宙に打ち上げられると,直接点検することが不可能であるため,衛星の状態を示す数千のデータから異常を素早く正確に発見する異常検知技術が求められてきた.本研究では音声認識等の時系列分類のために考案され,先行研究において高い精度を発揮したLSTM-FCNに着目した.LSTM-FCNによる特徴量抽出とLocal Outlier Factorを組み合わせることによって従来の手法よりも高精度な異常検知モデルを提案し,Yahoo! が公開している異常検知検証用データセットを用いた比較を行った.
本論文は,機械学習による時系列予測において,ラグ度に基づく損失関数(以後,LagMSE)を提案する.ここでのラグとは,直前の値がそのまま出力することである.ラグを内包する機械学習のモデルでは,その特性上適切に予測ができているとは言えない.このことから本論文では LagMSE を提案することにより,時系列予測の有用性改善を行う.
経時的に対象間の関係が変化する時系列データを距離空間に埋め込み、関係を視覚化する問題は、データ解析などで非常に重要である。既存の時系列データの確率的な埋め込み手法では、隣り合う時刻で座標が緩やかに変化するという制約を課すことで経時変化の評価が容易な視覚化を可能にしている。本稿では、埋め込んだ座標での平滑化が可能な確率的埋め込み手法を用いて同一データの異なる時刻間の座標に内分操作を加えることで、時系列データに対するアニメーションでの動的な視覚化を可能にする枠組みを提案する。
時系列予測の分野はRNNからLSTM,Transformerという流れで発展している.そこでgMLP はこれまで最も性能が高いとされていた Transformer と同等の性能を誇ると示されていた.上記の論文内では画像処理と自然言語処理での検証が行われていた.自然言語処理が行えるのであれば時系列データの処理にも適用できると考えられる.そこで本研究ではgMLPを利用した時系列予測システムを作成し,既存手法を利用して時系列予測を行うシステムと比較することで評価を行った.
3月16日 13:00〜15:15 Meeting 43 座長 新田直子(阪大)
D-20-11 |
健康異常検知における不均一なデータへの連合学習の個別化
○寺井広大・江 易翰・林 海(阪府大) |
D-20-12 |
深層強化学習による機会損失を考慮した金融取引戦略の構築
○井上修一・穴田 一(東京都市大) |
D-20-13 |
COVID-19下でのウェアラブルセンサデータに基づく長期ストレス推定
○岡﨑裕子・杉本千佳(横浜国大) |
D-20-14 |
リンゴの部位間の関係を考慮した深層学習に基づく成熟度推定
◎田中奨真・馬淵浩司(岩手県立大)・渡邉 学(岩手大)・小嶋和徳(岩手県立大) |
D-20-15 |
人工熊画像に基づく軽量な熊領域提案モデルの実現
◎岩松海斗・富岡洋一・齋藤 寛・小平行秀(会津大) |
近年のエッジコンピューティング技術の進歩は、ウェアラブルセンサーなどのエッジデバイスを用いて人々の健康情報を収集し、脳卒中やうつ病などの異常な健康状態を早期に警告する健康異常検知(AHD)に新たな機会をもたらしている。その中でも連合学習(FL)はデータをエッジデバイス(エッジノード)に残したまま精度の高いAHDモデルを学習できるため、注目を集めている。しかし、エッジノードに分散しているデータの分布が不均衡の場合、連合学習の基本アルゴリズムFederated Averaging(FedAvg)の収束が難しくなる。本研究では、不均衡な分布を持つデータに焦点を当て、それに対応する個別化されたFLを開発する。
近年,機械学習を用いた金融取引の分野に関する研究が精力的に行われている.中でも,深層強化学習を用いて金融取引戦略を構築する研究が精力的に行われている.これらは,金融商品の売買数の最適化や複利計算を考慮したもの,入力にチャート画像を用いるなど様々なアプローチを用いている.しかし,これらの研究ではエージェントの行動により発生する機会損失を考慮できていない.そこで本研究では,各行動に対する機会損失を深層強化学習での報酬に組み込み,株式投資において利益を上げるための最適な買いや売りのタイミングを学習するモデルを構築し,その有効性を示す.
LSTMを用いて、約1か月の期間の連続的な生体データからcovid-19禍でのストレス状況の推定を行った。LSTMモデルへの入力に用いた生体データの主な特徴量としては、安静時心拍数,心拍変動指標,皮膚温度,睡眠レベル・時間,活動量(歩数)とそれらの統計量,平日休日,短期ストレス因子有無などを用いた。出力には一日につき一つ60~90の値が算出される、ストレススコアを用いた。データはそれぞれ変動値を求めることにより正規化を行った。2人の被験者のデータから学習と推定を行った結果、平均絶対誤差がそれぞれ9.96、4.95となり、平均絶対パーセント誤差は13.5%、6.42%となった。
日本における農業は,農業就業人口の減少や就農者の高齢化が問題である.特に果樹園では,人手による生育・成熟度管理が行われ,農作業の機械化が困難な現状にある.従って,果樹園における農作業の効率化や省力化が重要な課題である.本研究では,農学的な観点から,リンゴの部位間の関係を考慮した深層学習に基づく果実成熟度分類手法について検討する.提案手法によって果実の成熟度を画像から推定できれば,機械化・自動化によって,広大な果樹園の収穫場所を順次把握でき,収穫作業の効率化・省力化が期待できる.実験では約7000枚を用いた学習と約600枚を用いたリンゴの成熟度評価を行い,高精度で成熟度推定が可能であることを示す.
毎年多くの熊の目撃情報, 熊による被害が報告されている. このような被害を削減するため, 私達は熊を迅速に検出し住民へ通知する熊警報装置の実現を目指している. 近年, 畳み込みニューラルネットワーク(CNN)を用いた高精度な物体検出が注目されているが, 物体検出を人感センサー等の補助センサーが作動した場合に限定しても撮影画像中に熊が存在する頻度は少ないため, 物体検出モデルを用いた熊検出は計算効率が悪い. そこで, 低解像度の領域提案CNNと画像分類CNNを組み合わせた, より計算コストが低い2段階熊検出手法が提案されている. 本稿では, 領域提案モデル学習のため, 学習用熊画像とクラスラベルを人工的に生成する手法を提案する.
休 憩(14:30 再開)
D-20-16 |
テキスト情報とグラフ情報を考慮した埋め込み
◎井上智裕・村田 昇(早大) |
D-20-17 |
リンク情報を付加した文書分散表現
◎田中義規・竹川高志(工学院大) |
D-20-18 |
深層学習と能動学習を用いた攻撃的なツイートの分類
○及川正樹・井上 潮(東京電機大) |
本研究では,画像や文書等のデータ集合の元に対し,固定長のベクトルを割り当てる問題として埋め込みを扱う.ここでの埋め込みとは,対象同士の意味的な類似性を埋め込み先の空間での距離関係に反映するように対象集合に対する写像を構成する問題を指す.この意味的な類似性の捉え方はデータの特徴や構造により様々であるが,ある一つの側面からデータの特徴や構造を捉える埋め込みに関する研究が盛んに行われてきた.一方,実際のデータ構造には複数の側面を併せ持つものがある.本研究では,文書グラフを題材として,異なる情報を統合的に扱う埋め込みでより正確にデータの意味構造を捉える方法を検討し,複数の情報を同時に用いるモデル探索について考察する.
ユーザにとって,目的とする情報にどれだけ容易に辿り着くことができるかは重大な問題である.ゆえに,Webサイトをその情報を多く含んだ数値ベクトルで表現することは有用である.本研究では,Wikipediaの記事を対象に,文書が持つ単語やトピックの情報に加えてリンクの情報を含んだ分散表現を得ることを目指した.従来手法をもとに,GAEおよびVGAEを利用することでこれを実現した.新たに得た表現は,関連のある記事ベクトルのcos類似度が,関連のない記事ベクトルのcos類似度よりも大きくなるよう改善されていた.また,同じカテゴリの記事ベクトルのcos類似度も,従来手法より大きい傾向にあった.
Twitterは有用なコミュニケーションツールである一方, 他者を攻撃するツイートのように, 閲覧者を不快にする投稿も存在する. 本研究では, このような攻撃的なツイートを, 深層学習モデルであるLSTM(長短期記憶)を使用して分類を行う.
しかし, このような教師あり学習を行う上で, ラベル付けされた攻撃的なツイートを大量に使用する事が困難であるという問題がある. 本研究では, 分類器の予測に基づいてラベル付けするデータを選択する, 能動学習を用いる事で, 学習データの不足を改善し,モデルの精度向上を図る.
D-22. クラウドネットワークロボット
3月17日 13:00〜14:45 Meeting 41 座長 神原誠之(奈良先端大)
D-22-1 |
ダイナミックマップを用いた複数台UAVの倉庫内飛行に関する研究
○中村綾佑・板谷一輝・臼杵 潤(神奈川工科大) |
D-22-2 |
教示再生走行ロボットのための遠隔走行の検討
○川畑尚也・代田康貴・小田高広(OKI) |
D-22-3 |
ARマーカーを用いた自律移動教示の方式検証
○室井喜果・岩瀬慶子・小田高広(OKI) |
D-22-4 |
車両群との協調に基づく仮想信号機を用いた交通整理
○新井義和・齊藤義仰・柴田義孝(岩手県立大) |
D-22-5 |
センサフュージョン技術の検討
○下川 功(日立) |
D-22-6 |
服装コーディネートを支援するモバイルアプリケーション
◎△大井鞠奈・長谷川治久(日本女子大) |
D-22-7 |
自発的なインタラクション促進による認知症症状緩和を目指したロボットの開発
◎多田直生・安藤敏彦(仙台高専) |
ロジスティクスにおける輸送費,荷役費、保管費,物流管理費、包装費などのコスト削減が求められる中,取扱アイテム数量の多い物流拠点などでは高効的管理のために倉庫の自動化が進められてきた.これに対し,問屋や小売店などの小規模倉庫では導入費や管理費が嵩む自動倉庫等の導入は現実的ではなく,管理作業を人手に依存している.しかし,人手作業では倉庫内の管理に時間がかかる上にミスやムラが生じやすく,導入しやすい管理支援システムが求められている.このような中,本研究では小型化が進む安価な UAV に着目し,複数台の小型 UAVを用いた現品管理のための倉庫内飛行方法について検討する.
ロボットが施設内を教示再生走行による自動巡回中に異常事態が発生した場合,遠隔のオペレータが異常事態を確認するため,教示再生走行を中断してロボットを遠隔操作で走行(遠隔走行)させることがある.異常事態の確認が完了すると,ロボットを教示再生走行が中断した位置と中断時の走行方向に精度良く戻さないと,教示再生走行が再開されない.しかし,遠隔のオペレータがロボットのカメラ映像を見ながら遠隔操作でこれらの条件を満足させることは難しい.本論文では,教示再生走行から遠隔走行に切り替えたときに,遠隔走行と同時に新たな教示走行を実施する方式を提案する.遠隔走行時に記録した走行ルートと地図データを使用して,走行ルートとは逆のルートを逆再生することで,教示再生走行の中断位置まで自律的に走行し,中断時の走行方向に自律的に旋回できる.本提案方式により,遠隔走行から教示再生走行への再開が容易になる.
近年労働力不足が社会課題とされ,各分野に自律移動型サービスロボットの導入試行が実施されている.しかしロボットの導入には人手による教示作業や移動経路の変更による再教示を行う必要があり,教示方法を簡易化する改善案が提案されている.本稿では高度遠隔運用の観点からマルチベンダーロボットに最適な自律移動教示の方法を検討するため,LiDARセンサーを用いたSLAMと ARマーカーを用いた自律移動教示を比較し、ロボットの移動教示から走行開始までの時間短縮の有効性を確認した.
観光産業を始めとする地域の活性化のためには人々の往来を喚起することが不可欠であるが,高齢・過疎化が進行する地方都市においては,その採算性の低下から公共交通機関は減少する傾向にある.さらには,Post/Withコロナ社会を見据えると,不特定多数の人々との接触は急けるべきであり,自家用車を用いた少人数単位の移動手段がより重要になる.これらの社会情勢に対して自動運転車両の導入・普及が期待されるが,冬季に積雪をともなう地域においては,いくつかの障壁が存在する.本研究では,降雪・積雪に起因する突発的なトラブルに対して,そこに遭遇した車両群との協調に基づいて交通整理を行う仮想信号機を提案する.
筆者らは現場の生産性向上を目指し、省人化、無人化を実現する3D自由視点映像生成技術(以下、自由視点映像技術)の開発を行っている.自由視点映像技術では主にカメラ画像を扱い、リアルタイム性、マルチセンサ分析、ソリューションを迅速配置するSIレス化が課題である.本稿では、分散メッセージ技術に着目し、これらの課題を解決するセンサフュージョン技術を提案した.提案技術を試作してサーバの受信性能を評価し、フレーム受信間隔が、平均154[ms](6.4[fps])となることを確認し、提案技術の実現可能性を示した.
外出前に着衣を決定することは天気・TPO・好みに応じた判断が難しく、多くの人の悩みになっている。本稿では状況に応じた適切な服の選択を効率的に行うことを支援する服装コーディネート支援アプリケーションを提案する。モバイルアプリと連携する提案・判定エンジンにより、個人の嗜好と状況に応じた服装を提案するアプリケーションを構築可能とする。本稿では、個人が登録した服装を対象に検索、評価が可能であることを示した。
近年,介護職員の不足が懸念される.高齢者が介護を要する主要因は認知症である.その中核症状は高齢者の不安を原因とし,介護の負担となる.これに対し,「パロ」等の介護ロボットの開発が盛んである.パロには,セラピー実施者のパロの扱い方がその効果に影響する課題が存在する.「認知症高齢者の不安」「セラピー実施者の影響」の緩和を目的に,ロボットの親和性を向上させ,高齢者の自発的なインタラクション促進を試みる機能を開発した.本校高専祭で来訪者の方々を対象に実験を行ったが,親和性の向上は観測できなかった.効果を得る為には,触れ合い時間が短すぎたのではないかと考える.今後は実際に高齢者の反応を調査する予定である.
D-23. サービスコンピューティング
3月17日 13:00〜14:45 Meeting 29 座長 山登庸次(NTT)
D-23-1 |
IoT相互運用のためのWeb of Thingsインタフェースの構築
○小島将弘・酒澤茂之(阪工大) |
D-23-2 |
ワイヤレスセンシングシステム異常原因特定方法に関する一検討
○齊木あずさ・明石貴靖(ナカヨ) |
D-23-3 |
IoT向け相互接続インフラへの他網接続機能の追加
○馬場博幸・石田慶樹(東大)・松村 淳・小畑至弘(IoT-EX) |
D-23-4 |
クランピネスの季節性を考慮した顧客セグメントの提案
○沼瀬太朗・三木良雄(工学院大) |
D-23-5 |
グラフDBを活用した受配電設備管理システムのデータ処理方法
○河村美嗣・川島佑毅・永井幸政(三菱電機) |
D-23-6 |
コンテンツデータ連携のためのメタデータ生成技術の開発
○小松佑人・藤井翔子・阿部晋矢・藤津 智・藤沢 寛(NHK) |
D-23-7 |
データ取引向けデータ利用条件の動的合意支援技術
○栖川 淳・根本直一(日立) |
近年、IoTの普及により様々なモノがインターネットを介して接続されるようになった。それに伴い、異なるプラットフォームを持つIoT機器を相互接続・相互運用することが困難であるという断片化問題が顕著となっている。このような断片化問題の解決策として、WoT(Web of Things)を用いた手法がある。WoTでは、既に標準化されたWeb技術を用いることでモノとWebとを繋ぎ、相互接続を可能とすることで断片化の回避を実現する。本研究では、IoT機器を相互接続可能となるようなWoTシステムを構築し、相互接続したIoT機器により行われる処理時間の差を軽減する手法について検討する。
近年,IoTを利用して工場等の各種設備の稼働状況等を管理するワイヤレスセンシングシステムが普及している.
これにより工場等の各種設備の見える化を実現し,設備機器の異常監視や生産現場環境の監視などを行っている.
このようなシステムにおいては,各種設備状況の監視に影響を及ぼすため,システム内での通信障害を迅速に検知してその原因を特定することが望まれる.
そこで本研究ではワイヤレスセンシングシステムの異常原因を特定する方法について提案する.
筆者らは,先行研究にてIoT向けの多種システム相互接続(以下,相接)用インフラの開発について報告した[1].その後,実際の商用運転などの経験を基に,当該インフラをLPWAなどインターネットではない網やVPNで集約されたデバイスにも直接対応できるよう改良したので報告する.
専門店では,現在も勘に頼った経営やマーケティングを行っている企業が数多く存在する.専門店の顧客は,衝動購買が少なく短期間で嗜好が変化しないという特徴を持ち,従来の分析手法では専門店のID-POSデータから有用な情報を発見することができない.近年提唱されたマーケティング指標として, イベントが均等な間隔に従わない度合いを2値変数で示す「クランピネス」がある.本稿では,顧客別に来店割合の最も高い季節をクランピネスの発生時期と仮定し,クランピネスが発生した季節による顧客セグメントを提案する.提案手法より,クランピネスが発生している季節によって,翌年の離脱率が変化することが判明した.
受配電設備は、高圧の電気を変圧して配電するために、遮断器、変圧器や計測機器等様々な機器から構成されている。このような受配電設備を点検する際、作業員は受配電設備が設置してある現場へ行き、各機器に設定された点検項目、例えば、機器の外観、異臭や温度を確認し、点検結果として記録していた。これまで我々はグラフデータベース(グラフDB)を用いた受配電設備管理システムを提案してきたが、1つの設備内に複数の機器が存在した場合に各々の設備データと点検結果を関連付ける方法は確立されていなかった。
本論文では、グラフDBを用いた受配電設備管理システムにおける設備データと点検結果を自動で関連付ける方法を提案する。
放送コンテンツ同士を意味的に連携(結び付け)し,関連する放送コンテンツを提示することを可能にするシステムを開発している.放送コンテンツの連携のためには,膨大な放送コンテンツにメタデータを付与する必要があるため,放送コンテンツからマルチモーダルで,番組情報の構造化データを生成するための,シーンごとのメタデータ生成技術を開発したので報告する.
データ流通基盤において,データ提供者・データ利用者間のデータ利用条件を迅速かつ安心して合意を実現する方式を提案した
シンポジウムセッション
- この目次は,インターネット講演申込登録のデータを元に作成されています。
- また,講演者を○,◎印で示し, ◎印は本会「学術奨励賞受賞候補者」の資格対象であることを示します。
- ○,◎の後ろに△がある場合はキャリアエクスプローラーの掲載を希望しています。
DS-1. COMP 学生シンポジウム
(コンピュテーション研専)
3月15日 9:00〜11:45 Meeting 41 座長 安藤 映(専修大)
DS-1-1 |
Consistency正則化を取り入れたStackGANによるテキスト入力に基づく画像生成
◎冨永理人・瀬尾昌孝(阪工大) |
DS-1-2 |
深層学習を用いた特徴選別に基づいた異常検知
◎池住勇輝・瀬尾昌孝(阪工大) |
DS-1-3 |
WGANを用いた特性の異なる潜在表現の制限と時系列データの異常検知
◎岡部凌介・瀬尾昌孝(阪工大) |
自然言語による記述に従って画像を自動的に生成することは,アート生成や画像編集といった様々な応用先が考えられる.また,画像と言語のマルチモーダル学習の研究の中でも,近年最も活発な研究分野の一つとなっている.
これまでに提案されたテキストからの画像生成手法の多くは,Goodfellowらによって提案されたGenerative Adversarial Networks(GAN)に基づくものである.その中の一つにHan Zhangらによって提案されたStacked Generative Adversarial Networks(StackGAN)と呼ばれる手法がある.この手法では低解像度画像を生成するStageIを先に学習させ,学習済みのStageIの出力画像をStageIIの入力とすることでより高精細な画像の生成が可能となる.本報告では,StackGANのStageIにConsistency正則化を取り入れることで,より精度の高い画像の生成を試みる.
異常検知において,的確に異常の特徴をとらえることが重要である.
しかしながら,ニューラルネットワークをはじめとする機械学習手法により抽出された特徴には
異常検知に必要な特徴や不要な特徴が混在し,判別根拠を困難化する一因となっている.
提案手法ではMNIST手書き数字を入力画像とし,クラス分類によって,encoder1の潜在空間に正常データを
表現する特徴の意味付けを行い,encoder2の潜在空間にencoder1の潜在空間では表現できない特徴を獲得させ,異常検知の判別に利用する.
異常検知において異常データは数が少ないため学習することは難しい.そこで正常データのみを学習し,潜在変数に対するマッピング領域を制限することにより,異常データが入力されたときのマッピング領域を元に異常性を判別する手法がある.本研究では,時系列データに対する異常検知を行う.提案モデルでは,各時刻における特徴を獲得するEncoderと時刻間の関係性を獲得するLSTM構造のEncoderを用いて特性が異なる潜在変数の獲得を行う.そして,潜在変数が標準正規分布に従うように敵対的学習を行うことによりEncoderを学習し,正常領域を制限する.
休 憩(10:30 再開) 座長 大下福仁(奈良先端大)
DS-1-4 |
2-連結グラフ上の2頂点対点素パスを構築する自己安定アルゴリズムについて
◎北岡拓馬・金 鎔煥・片山喜章(名工大) |
DS-1-5 |
Turtlebot3による共有離散座標系の生成について
◎渡辺智之・金 鎔煥・片山喜章(名工大) |
DS-1-6 |
自律分散ロボットで間隔dの均一配置を視野d-1で実現するアルゴリズムについて
◎△相津俊介・金 鎔煥・片山喜章(名工大) |
自己安定アルゴリズムとは,任意の初期状況から有限時間内に正当な状況(解状況)に収束する分散アルゴリズムである.また点素パスとは,パス間で共通のノードを含まないような複数のパスのことである.本研究では,送受信ノードがそれぞれ2つの場合,2(点)連結グラフ上であれば必ず送受信ノード間を結ぶ2本の点素なパスが構築できることを示した上で,そのような条件下において送受信ノード間を結ぶ2本の点素なパスを構築する自己安定アルゴリズムを提案する.
自律分散ロボットシステムとは分散システムの一種で,メモリや通信機能がないといった低機能な複数の自律移動端末(ロボット)が,観測(Look)-移動先の計算(Compute)-移動(Move)の3つのフェーズからなるサイクルを繰り返すことで目的を達成する理論的なシステムである.
我々は,理論的成果を汎用的な実機を用いて動作させるために必要な基盤技術の開発を考えた.中でも移動誤差と共通座標系の問題に着目する.理論モデルによる一点集合問題を例にすると,移動に誤差がある場合は問題が解けないことは明らかである.一方,離散空間であればロボットが存在できる点が離散的であり,連続空間に比べて誤差修正が容易であると考えられる.そこで本研究では手始めとして,汎用ロボットとしてTurtlebot3を用いて離散座標空間の共有を実現する方法を提案する.
自律分散ロボットは自律的に動作する移動可能な端末であり,それらが協調して動作し与えられた1つの目標を達成するシステムを自律分散ロボットシステムという.その自律分散ロボットシステムで均一配置問題を扱う.正方形グリッドグラフ上に配置された視野範囲がd-1の完全同期スケジューラの下で動く自律分散ロボットが縦横dの間隔をあけた配置に到達するアルゴリズムを提案した.既存研究では視野範囲は2dの自律分散ロボット群であり,自律分散ロボットの条件を変更することにより,視野範囲をd-1に狭めることを可能とした.
3月15日 13:00〜15:45 Meeting 41 座長 増澤利光(阪大)
DS-1-7 |
(依頼講演)Dividing a discrete cake fairly
◎Ayumi Igarashi(NII) |
DS-1-8 |
木に対する例外付き準平等分割
◎伊藤雅士・小野廣隆・大舘陽太(名大) |
DS-1-9 |
辺ケイレス必勝判定アルゴリズムの高速化
○吉渡 叶(名大)・木谷裕紀(九大)・土中哲秀・小野廣隆(名大) |
公平分割題とは,異なる選好を持つ人々にどのように複数の財を公平に分担するかを考える資源配分問題のことである. 1948年にHugo Steinhausがケーキ分割問題の数学的なモデルを提案して以来, 経済学, 計算機科学, 数学の多岐にわたる学問領域で高い関心を集めた. 古典的なモデルでは, ケーキや土地のように分割可能な財に対する公平分割問題に対して研究が主であったが, 近年分割が可能でない複数の財を公平に配分するにはどうすればよいか, 広く研究が行われるようになった. 可分財の配分と異なり, 不可分財の分担では, 他人の持分を羨むことがない無羨望配分の存在が保証されない. そのため, 近似的な公平性の概念またそれらを満たす解の存在を保証できるかどうか, 議論が盛んに行われるようになった. 本発表では, 主に人工知能分野における最新の研究について紹介した後, グラフの連結制約条件付きの公平分割問題に関する発表者らの成果について紹介する.
与えられた重み付きグラフを,p個の連結成分は共通のある範囲内の重さ, 例外となるt個の成分はそれぞれ定めた範囲内に収まる重さになるように分割するものをグラフの「例外付き準平等分割」と呼ぶ. 例外なしの準平等分割は木幅2のグラフに対してでもNP困難であるが, 木に対しては多項式時間で解くことができることが知られている. 本研究ではt>0かつ木の場合について例外付き準平等分割を求める計算量について考察する.主結果としてtに関する擬FPTアルゴリズムと, 上下限に自然な制限を加えた場合のtに関するFPTアルゴリズムの計算量を示す. また, 一般のtに対しては,木の深さなどに強い制限を置いたとしても強NP完全であることを示す.
辺ケイレスとは任意の単純無向グラフの上で行われる組合せゲームである.各プレイヤは自分の手番において辺を1つ選択し,選択された辺とその両端点,さらにその両端点に接続していた全ての辺が削除される.これを2人のプレイヤで交互に繰り返し,先に自分の手番で選択できる辺が無くなった方が負けである.本研究では辺ケイレスにおけるO*(2^n)時間必勝判定アルゴリズムと,入力グラフの頂点被覆数kに対しO*(1.1893^{k^2+6.340k})時間で必勝プレイヤを判定するアルゴリズムを提案する.さらに,木グラフに対してはO*(2^{n/2})時間で必勝判定が可能であることを示す.
ここでO*は入力の多項式項を省略したオーダー表記である.
休 憩(14:30 再開) 座長 小野廣隆(名大)
DS-1-10 |
(依頼講演)解グラフを用いた多項式遅延列挙アルゴリズムの構築技法
○栗田和宏(NII) |
DS-1-11 |
45度系格子パターンにおける局所平坦折り可能な展開図の数え上げとZDDによる列挙
◎榎本優大・河上悠輝・脊戸和寿・堀山貴史(北大)・三谷 純(筑波大) |
DS-1-12 |
Extended MSO Model Checking via Small Vertex Integrity
◎Tatsuya Gima・Yota Otachi(Nagoya Univ.) |
与えられた性質を満たす「もの」をもれなく重複なく出力する問題を列挙問題といい,その問題を解くアルゴリズムを列挙アルゴリズムという.特に,与えられた性質を満たす部分グラフを列挙するアルゴリズムは列挙問題の中でも中心的に研究されている.本稿では,近年,極大な部分グラフや極小な部分グラフの列挙に関して大きな発展を見せる列挙アルゴリズムの構築技法である,解グラフを用いた効率良いアルゴリズムの構築技法について解説を行う.
折り紙の展開図は、紙のどこを折るかを線図として示したものである。新しい折り紙作品の創出には、折り線の位置や方向を特定の格子上に限定し、その格子のどの辺を折り線として採用して展開図とするかを検討することが多い。松川らにより、代表的な制約条件として45度系格子パターンにおいて、4×4、5×3の場合の局所平坦折り可能な展開図の列挙が行われた。本研究では、45度系格子パターンにおける局所平坦折り可能な展開図の個数を数え上げるアルゴリズムと、ZDDを用いた展開図の列挙アルゴリズムの2つを提案する。また、2×n の場合の展開図の個数を一般項の形で導出するとともに、6×1,000の場合までの数え上げおよび8×8の場合までの列挙を行う。
We study the model checking problem of an extended MSO
with local and global cardinality constraints, called MSOGLLin, introduced
recently by Knop, Koutecký, Masařík, and Toufar [Log. Methods Comput. Sci., 15(4), 2019].
We show that the problem is fixed-parameter tractable
parameterized by vertex integrity, where vertex integrity is a graph parameter
standing between vertex cover number and treedepth.
Our result thus fill a gap between the fixed-parameter tractability with vertex cover
number and the W[1]-hardness of the problem with treedepth.
ADS-1. チップ組み込み型細粒度再構成ロジック最前線
(VLSI設計技術研専、リコンフィギャラブルシステム研専 共催)
3月18日 10:00〜11:40 Meeting 40座長 久我守弘(熊本大)
ADS-1-1 |
Edge DX における NanoBridge FPGA への期待
○山口佳樹(筑波大) |
ADS-1-2 |
スイッチ、RISC-V、細粒度ロジックを搭載したIoT用デバイスSLMLET
○天野英晴(慶大) |
ADS-1-3 |
スピントロニクス素子ベース不揮発FPGA: 超低消費電力再構成可能ハードウェアプラットフォームへの挑戦
○鈴木大輔(会津大)・夏井雅典・羽生貴弘(東北大) |
ADS-1-4 |
MECデバイス向けFPGA-IP試作チップの動作検証
○久我守弘・中里優弥(熊本大)・趙 謙(九工大)・尼崎太樹・飯田全広(熊本大) |
本講演では,デジタルトランスフォーメーション(DX)を支える情報通信技術と言う観点から,FPGA 利用における得失をまず明らかにする.続いて,それを解決する可能性を持つ Nano-Bridge FPGA について紹介し,そのシステム実装を通してエッジDXにもたらすインパクトについて議論する.
SLMLETは、IoTデバイスの暗号化、匿名化、MQTTブローカのオフローディングを目的とした低コスト、低電力の再構成可能ロジックであり、細粒度デバイス本体として熊本大学のSLM再構成ロジックを持ち、制御と簡単な計算用のRISC-V、外部とのパケットを交換するHypernetのスイッチを持っている。スイッチのDMA機能を利用し、複数のチップ間でストリーム処理を効率よく行うことができる。複数の構成情報をチップ内部に圧縮した形で格納し、高速に入れ替えることが可能である。さらに内部の情報を内部メモリにロードし、交換することで、ハードウェアコンテキストのマイグレーションが可能である。
Internet of things (IoT)技術の発展に伴い、従来のクラウド一極集中型の情報処理から各種端末におけるローカルな情報処理、すなわちEdge computingの重要性が高まってきている。このようなハードウェアプラットフォームとして、内部に記憶された回路情報の書換えにより演算機能を再構成可能なField-programmable gate array (FPGA)の需要が高まってきている。 一方,従来のSRAMセル、すなわち揮発の記憶を前提としたFPGAでは情報の保持のために常時給電が必要であり、そのため待機電力の消費がEdge応用に向けた課題となっている。不揮発FPGAはSRAMセルの代わりに不揮発のメモリ素子に情報を記憶することで電源供給の一時停止(Power-gating)が可能であり、この特徴により無駄な待機電力の消費をゼロにすることが可能である。著者らは不揮発メモリ素子の一つであるスピントロニクス素子に着目し不揮発FPGAの研究を進めている。本稿では、スピントロニクス素子ベース不揮発FPGAの技術動向について概説するとともに、その応用並びに超低消費電力再構成可能ハードウェアプラットフォームへの展望についても述べる。
マルチアクセスエッジコンピューティング(MEC)はIoT 環境においてエッジ–クラウドの間で連携した処理を
実行する際に,エッジデバイスにおける負荷の低減,リアルタイム性の確保,エッジ–クラウド間通信トラフィッ
クの削減等を実現するために重要となってきている.本稿では,MECデバイスにおいて様々な応用に向けて高性
能で低消費電力のハードウェアアクセラレーションを実現するために開発したFPGA-IP に関し,その試作チッ
プの動作検証について報告する.