読むべき論文リスト
読むべき論文リスト
苗村研の研究の歴史をプロジェクト毎にまとめています.
苗村研に入ったら,まずこのページから研究の歴史を把握してください.
PDFはこちらから
苗村先生
おすすめ論文
川上先生
これまでの研究と論文:Rei Kawakami
おすすめ論文:
-
学生向けCMU金出先生の記事(全7回)超おすすめ: http://mec.gr.jp/INTER/kanade/kanade1.html
-
論文の書き方(Technical writing): NaeLab/Tips/proofreading#ad63d017
-
記事など Y. Amit and P. Felzenswalb, "Object detection" Object detectionについて簡潔にまとめてある. 情報処理学会, 前田英作, "痛快! サポートベクトルマシン" 情報処理学会, 上田修功, "統計学的学習研究探訪" 情報処理学会, 甘利俊一, "独立成分解析:多変量データの新しい分解法" 情報処理学会, 上田修功, "ベイズ学習法の最前線 -変分ベイズ法-" 情報処理学会, 坂野鋭, 山田敬嗣, "怪奇!!次元の呪い -識別問題, パターン認識, データマイニングの初心者のた めに-" 情報処理学会, 西田健次, 栗田多喜夫, "カーネル学習法とその画像認識への応用" 情報処理学会, 上田修功, "アンサンブル学習" 情報処理学会, 福井和広, 山口修, "部分空間法の理論拡張と物体認識への応用" 情報処理学会, 村瀬洋, "画像認識のための生成型学習" 情報処理学会, 村田昇, "スパースコーディングの基礎理論と画像処理への応用" 人工知能学会, ヨアブ・フロインド, ロバート・シャピリ, "ブースティング入門" 人工知能学会, 本村陽一, 佐藤泰介, "ベイジアンネットワーク" 日本統計学会誌, 大森裕浩, "マルコフ連鎖モンテカルロ法の最近の展開" 田中和之, "クラスター変分法と確率的情報処理-Belief Propagationと画像処理アルゴリズム-"
-
本 Richard Szeliski, "Computer Vision: Algorithms and Applications": 日本語版が研究室にある.有名なRichの本. 英語版PDF http://szeliski.org/Book/Richard O. Duda, Peter E. Hart, David G. Stork, "Pattern Classification": この間買ったので研究室にある.有名な本 金谷健一, "これなら分かる最適化数学: 基礎原理から計算手法まで": 金谷先生は教科書を書くのが上手.非常に分かりやすい. Berthold Horn, "Robot vision": 池内先生の先生の本.当時のComputer visionの最新がまとまった教科書的な本. Henrik Wann Jensen著, 苗村健訳, "フォトンマッピング―実写に迫るコンピュータグラフィックス": 苗村先生訳の本.光の反射など知りたい人向け,すごく分かりやすい. Springer, "A reference guide to computer vision": 川上の机にある. 尾上守夫 監訳, "パターン識別" 上坂吉則, 尾関和彦, "パターン認識と学習のアルゴリズム" 石井健一郎, 上田修功, 前田英作, 村瀬洋, "わかりやすい パターン認識" 甘利俊一, 麻生英樹, 津田宏治, 村田昇, "パターン認識と学習の統計学-新しい概念と手法" Andrew Webb, "Statistical Pattern Recognition" Brendan J. Frey, "Graphical Models for Machine Learning and Digital Communication"
-
もっとDeepな世界 そのうち更新します (as of 4/7/2014)
小泉先生
これまでの研究と論文:Google サイト
最初から論文を探すのはおすすめしません。
-
最初は専門用語とかわからないので、論文が読めない(理解できない)と思います。
-
ついでに言うと、ただ読んでも、その研究の面白さに気が付けない可能性もあります。
-
まずはVRの入門書とかを読むといいと思います。
-
当たり前ですが、人間の使うしくみを設計するなら、人間のことを知る必要があります。
-
インタラクションや、VR/AR/MRみたいな研究においては、人間の知覚特性を知っておくことが大切です。
面白い研究に感激しよう
-
まずはビデオとかでざっくり研究を見て、ワクワクして下さい。その次に自分がそれを超えるワクワクを作るんだと想像して下さい。
-
ビデオみて分かんないところは、論文読んでみたり、先輩と議論してみましょう。
-
先輩とか詳しい人と一緒に見るといいです(解説が聞けるので)。
-
希望者は未来館のお茶会に来て下さい([email protected]に連絡下さい)。
-
先輩に何しているのかを聞きましょう。
-
オススメは3月のオープンラボのポスターを読むことです。
-
気になった先輩にアタックしましょう。
-
「先輩の研究の面白さってなんですか?」ってダイレクトに聞いてみよう。
入門書
-
この本を読むと「バーチャル」の使い方を意識できるようになります。
-
バーチャルリアリティという学問が、人のリアリティの機序を工学的手法によって、追求する学問なんだということを学ぶことが 出来ます。
-
知覚の基礎的なことが学べます。
-
VR学会の教科書です。オススメはしますが、僕は未読です!
-
情報デザインの基礎的な話が書かれています。
-
インタラクションデザインではプロトタイプを作ることが重要です。その手法などが記載されています。
-
知覚の入門書です。
-
多感覚統合などにも言及していて、広く浅く学べます。
-
電子情報通信学会の知識ベースです。各分野の基礎的な知見を網羅しています。
-
例えば画面共有とかミュージアムに興味のある人はコラボレーションシステムを読みましょう。もう少し人間そのものの研究に興味のある人は感覚・知覚・認識の基礎を読みましょう。
おすすめ論文
- 先輩の卒論や修論を読みましょう。NaeLab/thesis
福嶋先生
これまでの研究と論文:http://shogofukushima.com/
おすすめ論文
可視光通信プロジェクタ / PVLC(Pixel-level Visible Light Communication)(2006-)
2006年から2014年までの研究の歴史を1枚にまとめています.https://drive.google.com/open?id=1SjmcKtyGj5hLqD69FxJGWin2I3O2IH7-
論文リスト(リンク先がみられない場合は古参メンバーにダウンロードをお願いしてください)
PVLC歴代メンバーリスト
歴史などは2014オープンハウスでつくったポスターをみると分かりやすいかもしれません
| お名前(敬称略) | 学部 | 修士 | プロダクト | Keyword,備考 |
|---|---|---|---|---|
| 北村 匡彦 | 学府2007卒 | EmiTable | 空間分割型可視光通信,DMD | |
| 木村 翔 | 学部2006卒 | 電情2008卒 | 高速カメラ,コンピューテーショナルフォトグラフィ | |
| 大口 諒 | 電情2009卒 | Photonastic Surface | ピンアレイディスプレイ | |
| 岸 遼 | 学府2010卒 | SteganoScan, SteganoScan Orbs | 残像ディスプレイ | |
| 谷田 英生 | 学部2008卒 | FPGAの改良 | ||
| 李 鎭河 | 学部2009卒 | Bloxels | ボクセルディスプレイ | |
| 深澤 尚史 | 学部2010卒 | 学府2012卒 | Sticky Projection | グレイコード,光学系,カラー化,空中像 |
| 加藤 由訓 | 学部2011卒 | 学府2013卒 | iPvlc | 複数台プロジェクタの連携,スマートデバイスとの連携 |
| 田中 恭太郎 | 学部2012卒 | 電情2014卒 | フリッカ,プロジェクタ多重化 | |
| 周 磊杰 | 電情M2 | RPVLC | FPGAの改良,動画対応 | |
| 後藤 正太郎 | 学部2013卒 | 電情2015卒 | オフスクリーンPVLC | フリッカ,周波数スペクトルによる位置計測 |
| 小泉 実加 | 学部2015卒 | RPVLC | 光源制御、カラー化 | |
| 平木 剛史 | 電情M2 | RPVLC | PVLCプロジェクタによる群ロボット制御 | |
| 高橋 一成 | 学部2014卒 | 電情M2 | RPVLC | データと通信の設計、ライブラリ構築 |
PVLC発表資料アーカイブ
(未電子化)のものは,PVLC班の誰かが紙で持ってるはずです.
(所在不明)のものは,図書館など探さないとないかもしれません.
一応コピペで参考文献にできるようにはしてますが、bibtex使ったほうがいいと 思います.
論文誌
-
A Basic Study on Position-dependent Visible Light Communication using DMD
-
北村 匡彦, 苗村 健: ``DMDを用いた空間分割可視光通信: メタメディア情報を埋め込んだ映像投影'', VR論, vol. 12, no. 3, pp. 381 -- 388 (2007.9).
-
Position-Dependent Visible Light Communication : Projecting Meta-Media Data along with Visual Images
-
A Basic Study on Ubiquitous Information Environment Using Pixel-Level Visible Light Communication Projector and High-Speed Camera
-
SteganoScan & SteganoScan Orbs : Spatially Augmented Displays with Pixel-Level Visible Light Communication Projector
国際会議
SIGGRAPH
その他の国際会議
国内口頭発表
MVE
-
A Basic Study of 3D Form Display with Visible Light Communication Projector
-
Photonastic Surface : 3D Form Display Controllable with Light
-
A Basic Study of Persistence of vision display with Visible Light Communication Projector
-
Bloxels: Glowing Blocks as Volumetric Pixels : Establishing Communication Channel by Stacking Blocks
-
StickyProjection : Interactive Display using Pixel-level Visible Light Communication Projector
-
iPvlc : Collaboration between PVLC Projector and Smart Mobile Devices
-
Optical Systems on the Communication Channel of PVLC Projector : Floating Images and Projection containing Position Data
-
Measurement of Spatio-temporal Frequency Characteristics while Watching Images of PVLC Projector
-
A Basic Study on Multiplexing of PVLC Projectors
VRSJ
-
北村 匡彦, 苗村 健: ``DMDを用いた空間分割可視光通信による静止画への情報埋め込み'', 日本バーチャルリアリティ学会第11回大会, pp. 502 -- 505 (2006.9).
-
Study of Information Embedding Technology for Position-dependent Visible Light Communication using DMD
-
木村 翔, 北村 匡彦, 苗村 健: ``EmiTable: 映像と連携してメタ情報を発信するテーブル型ディスプレイ'', 日本バーチャルリアリティ学会第12回大会, T02 (2007.9).
-
EmiTable: A Tabletop Surface that can Emit Imperceptible Metadata along with Visible Image
-
木村 翔, 筧 康明, 高橋 桂太, 苗村 健: ``可視光通信プロジェクタと高速度カメラを用いたユビキタス情報環境の基礎検討'', 日本バーチャルリアリティ学会第12回大会, 2C2-5 (2007.9).
-
A Basic Study on Ubiquitous Information Environment Using Visible Light Communication Projector and High-Speed Camera
-
大口 諒, 筧 康明, 高橋 桂太, 苗村 健: ``光で制御する3次元形状ディスプレイ Photonastic Surface の提案'', 日本バーチャルリアリティ学会第13回大会, 2B4-2 (2008.9)l
-
Proposal of 3D Form Display "Photonastic Surface"
-
深澤 尚史, 苗村 健: ``可視光通信プロジェクタによる映像表現のための符号化方式の検討'', 日本バーチャルリアリティ学会第16回大会, 21D-2 (2011.9).
-
Displaying and Encoding Scheme for PVLC Projector
その他の国内口頭発表
-
A Study on Position-dependent Visible Light Communication using DMD for ProCam
-
木村 翔, 筧 康明, 高橋 桂太, 苗村 健: ``可視光通信プロジェクタと高速度カメラを用いたユビキタス情報環境におけるインタラクション'', インタラクション2008, pp. 169 -- 170 (2008.3).
-
Human Computer Interaction Using Visible Light Communication Projector and High-Speed Camera
-
岸 遼, 筧 康明, 苗村 健: ``光で制御する残像ディスプレイSteganoScanの提案'', エンタテインメントコンピューティング(EC2009), pp. 43 -- 46 (2009.9)
-
Proposal of Persistence of Vision Display "SteganoScan" kishi_EC2009.pdf
学内発表
修士学位論文
-
北村 匡彦: ``映像の中に機械制御情報を埋め込む空間分割型可視光通信の研究'', 東京大学大学院学際情報学府学際理数情報学コース修士学位論文 (2007.1).
-
(未電子化)
-
木村 翔: ``可変光通信プロジェクタを用いた映像とのイ ンタラクションに関する研究'', 東京大学大学院情報理工学系研究科電子情報学専攻修士学位論文 (2008.2).
-
大口 諒: ``光を用いて制御する3次元形状ディスプレイの研究'', 東京大学大学院情報理工学系研究科電子情報学専攻修士学位論文 (2009.2).
-
(所在不明)
-
岸 遼: ``可視光通信プロジェクタを用いた空間拡張型ディスプレイの研究'', 東京大学大学院学際情報学府先端表現情報学コース修士学位論文 (2010.1).
-
深澤 尚史: ``可視光通信プロジェクタの通信路における結像光学系の研究 ―位置情報を埋め込んだ映像の空中像提示とプロジェクタ投影―'', 東京大学大学院学際情報学府先端表現情報学コース修士学位論文 (2012.1).
-
田中 恭太郎: ``可視光通信プロジェクタの多重化に関する基礎検討'', 東京大学大学院情報理工学系研究科電子情報学専攻修士学位論文 (2014.2).
-
後藤 正太郎: ``可視光通信プロジェクタにおける時空間投影パターンの研究 -ちらつきの抑制と受光領域の拡張に向けて-'', 東京大学大学院情報理工学系研究科電子情報学専攻修士学位論文 (2015.2).
情理輪講発表資料(M2中間発表)
-
木村 翔: ``拡張現実型情報提示手法に関する研究'', 東京大学大学院情報理工学系研究科電子情報学専攻輪講発表資料 (2007.4).
-
A Study on Spatially Augmented Reality Based Display
-
大口 諒: ``可視光通信プロジェクタを用いた 3 次元形状ディスプレイの研究'', 東京大学大学院情報理工学系研究科電子情報学専攻輪講発表資料 (2008.4).
-
A Study on 3D Form Display with Pixel-level Visible Light Communication Projector
-
田中 恭太郎: ``可視光通信プロジェクタの多重化に関する研究'', 東京大学大学院情報理工学系研究科電子情報学専攻輪講発表資料 (2013.5).
-
Research on Multiplexing of PVLC Projectors
-
周 磊杰: ``Dynamically reconfigurable framework for pixel-level visible light communication projector'', 東京大学大学院情報理工学系研究科電子情報学専攻輪講発表資料 (2013.11).
情理輪講発表資料(M1サーベイ輪講)
-
木村 翔: ``拡張現実型情報提示の研究動向'', 東京大学大学院情報理工学系研究科電子情報学専攻輪講発表資料 (2006.10).
-
(未電子化)
-
大口 諒: ``光を用いた情報伝達と映像提示の融合に関する研究動向'', 東京大学大学院情報理工学系研究科電子情報学専攻輪講発表資料 (2007.10).
-
(未電子化)
-
田中 恭太郎: ``光学特性を利用したインタラクティブシステムに関する研究動向'', 東京大学大学院情報理工学系研究科電子情報学専攻輪講発表資料 (2013.5).
-
A Survey on Interactive Systems Utilizing Optical Modules
-
周 磊杰: ``A Survey on High Frame Rate Projection Using the Digital Micromirror Device'', 東京大学大学院情報理工学系研究科電子情報学専攻輪講発表資料 (2013.6).
-
後藤 正太郎: ``可視光通信における変調方式に関する調査'', 東京大学大学院情報理工学系研究科電子情報学専攻輪講発表資料 (2013.11).
-
A survey on modulation methods for visible light communication
-
高橋一成: ``可動なピクセル群を用いたスケーラブルな映像表現'', 東京大学大学院情報理工学系研究科電子情報学専攻輪講発表資料 (2014.11).
-
A Survey on Scalable Image Expression method using movable pixel devices
-
&ref(): File not found: "issei_M1rinko.pdf" at page "NaeLab/2012/MEMBERS/ktanaka/PVLCSurvey/Archive";
卒業論文
-
谷田 英生: ``動画対応可視光通信プロジェクタの開発とその応用'', 東京大学工学部電子情報工学科卒業論文 (2008.2).
-
李 鎭河: ``積層による情報伝達可能なブロック型ディスプレイデバイスの基礎検討'', 東京大学工学部電子情報工学科卒業論文 (2009.2).
-
(所在不明)
-
深澤 尚史: ``可視光通信プロジェクタを用いたインタラクティブな情報提示の基礎検討'', 東京大学工学部電子情報工学科卒業論文 (2010.2).
-
加藤 由訓: ``可視光通信プロジェクタとスマートデバイスを連携した情報提示の検討'', 東京大学工学部電子情報工学科卒業論文 (2011.2).
-
田中 恭太郎: ``可視光通信プロジェクタの映像におけるフリッカ知覚に関する基礎検討'', 東京大学工学部電子情報工学科卒業論文 (2012.2).
-
後藤 正太郎: ``可視光通信プロジェクタ映像鑑賞時の時空間周波数特性の計測'', 東京大学工学部電子情報工学科卒業論文 (2013.2).
-
小泉 実加: 可視光通信プロジェクタのカラー化とその応用, 東京大学工学部電子情報工学科卒業論文 (2015.2).
卒業論文中間報告書
-
谷田 英生: ``DMDを用いたDisplay-Based Computingの検討'', 東京大学工学部電子情報工学科卒業論文中間報告書 (2007.9).
-
李 鎭河: (題目不明), 東京大学工学部電子情報工学科卒業論文中間報告書 (2008.9).
-
(所在不明)
-
深澤 尚史: ``可視光通信プロジェクタにおけるビットパターン生成手法の検討'', 東京大学工学部電子情報工学科卒業論文中間報告書 (2009.9).
-
(未電子化)
-
加藤 由訓: ``複数の可視光通信プロジェクタを連携した拡張現実感の研究'', 東京大学工学部電子情報工学科卒業論文中間報告書 (2010.9).
-
田中 恭太郎: ``可視光通信プロジェクタの映像におけるフリッカ知覚に関する基礎検討'', 東京大学工学部電子情報工学科卒業論文中間報告書 (2011.9).
-
後藤 正太郎: ``可視光通信プロジェクタの映像におけるフリッカ知覚特性の計測'', 東京大学工学部電子情報工学科卒業論文中間報告書 (2012.9).
PVLCで何を実現しようとしてきたか.試みた 内容を中心にまとめている.こちら
クロミック材料関係(2011-)
SolaColor: Space Coloration with Solar Light (橋田ら, 2011)
Photochromic Sculpture: Volumetric Color-forming Pixels (橋田ら, 2011)
Hand-rewriting: Automatic Rewriting similar to Natural Handwriting (橋田ら, 2012)
Inkantatory Paper: Interactive Paper Interface with Multiple Functional Inks (辻井ら, 2013)
Photochromic Carpet: Playful Floor Canvas with Color-Changing Footprints (ダニエルら, 2013)
対面的画面共有 / Inter-Personal Display(2011-)
裸眼複合現実感システム(空中像インタラクション)/
「実像鏡」ことDCRAに関して
-
「実像鏡」の原案論文
-
Maekawa, Satoshi, Kouichi Nitta, and Osamu Matoba. "Transmissive optical imaging device with micromirror array." Optics East 2006. International Society for Optics and Photonics, 2006.
-
実像鏡とガルバノスキャナを使って3D空中像を出す。実像鏡の原理説明がわかりやすい。
-
Miyazaki, Daisuke, et al. "Floating volumetric image formation using a dihedral corner reflector array device." Applied optics 52.1 (2013): A281-A289.
有名な論文
-
空中像とのインタラクションについての全体像
-
Rakkolainen, I. (2008). Mid-air displays enabling novel user interfaces. SAME '08: Proceeding of the 1st ACM International Workshop on Semantic Ambient Media Experiences. doi:10.1145/1461912.1461919
-
デプスカメラとプロジェクタを組み合わせたインタラクション
-
Wilson, A. D., & Benko, H. (2010). Combining multiple depth cameras and projectors for interactions on, above and between surfaces, 273–282.
-
ハーフミラーとデプスセンサの組み合わせ(ステレオになってる)
-
Hilliges, O., Kim, D., Izadi, S., Weiss, M., & Wilson, A. (2012). HoloDesk: direct 3d interactions with a situated see-through display, 2421–2430.
-
ブロックでインタラクション(PVLCを使ってる)
-
Lee, J., Kakehi, Y., & NAEMURA, T. (2009). Bloxels: glowing blocks as volumetric pixels. SIGGRAPH '09: SIGGRAPH 2009 Emerging Technologies. doi:10.1145/1597956.1597961
-
擬似奥行方向を使って、奥行方向への映像提示
-
Lee, J., Olwal, A., Ishii, H., & Boulanger, C. (2013). SpaceTop: integrating 2D and spatial 3D interactions in a see-through desktop environment. Presented at the CHI '13: Proceedings of the SIGCHI Conference on Human Factors in Computing Systems, ACM Request Permissions. doi:10.1145/2470654.2470680
-
実像鏡+アクチュエータ(前川さんの実像鏡を使ってる。インタラクションとして、特殊なペンデバイスを使ってる)
-
Markon, S., Maekawa, S., Onat, A., & Furukawa, H. (2012). Interactive medical visualization with floating images (pp. 20–23). Presented at the Complex Medical Engineering (CME), 2012 ICME International Conference on. doi:10.1109/ICCME.2012.6275719
-
高画質の実像鏡を使って、空中像のクォリティーを向上
-
Miyazaki, D., Hirano, N., Maeda, Y., Yamamoto, S., Mukai, T., & Maekawa, S. (2013). Floating volumetric image formation using a dihedral corner reflector array device. Applied Optics, 52(1), A281–A289.
-
凹面鏡を使って、空中像を作る
-
Sawada, S., & Kakeya, H. (2012). Floating Volume Viewer. SA '12: SIGGRAPH Asia 2012 Emerging Technologies. doi:10.1145/2407707.2407717
-
デプスセンサ+携帯のディスプレイの組み合わせ
-
Sodhi, R. S., Jones, B. R., Forsyth, D., Bailey, B. P., & Maciocci, G. (2013). BeThere: 3D mobile collaboration with spatial input. Presented at the CHI '13: Proceedings of the SIGCHI Conference on Human Factors in Computing Systems, ACM Request Permissions. doi:10.1145/2470654.2470679
-
Repro3D
-
Yoshida, Takumi, et al. "Repro3d: full-parallax 3d display using retro-reflective projection technology." ACM SIGGRAPH 2010 Emerging Technologies. ACM, 2010.
BeThere | Proceedings of the SIGCHI Conference on Human Factors in Computing Systems
その他
歴代先輩たちの研究
-
FloasionTable(和田)
-
FloasionTable : 複合現実展示のための多方向から鑑賞可能な空間立像ディスプレイ(デジタルミュージアム,デジタルミュージアムとエンタテイメントメディア) http://ci.nii.ac.jp/naid/110008002514
-
ExFloasion(中島)
-
Totaro NAKASHIMA, Takuro WADA, and Takeshi NAEMURA: ``ExFloasion: Multi-layered Floating Vision System for Mixed Reality Exhibition,'' 16th Intern. Conf. Virtual Systems and MultimediaVSMM2010, pp. 95 -- 98 (2010.10).
-
MRsionCase(はんようる)
-
http://dl.acm.org/citation.cfm?id=2407746.2407756&coll=DL&dl=GUIDE&CFID=287384510&CFTOKEN=87633531
超解像自由視点画像合成 / Super-Resolved Free-Viewpoint Image Synthesis
吉橋 / Bird
白石さん(2010-2011)
-
修論 "生態調査・監視のための画像認識を用いた野鳥の検出" 修論.pdf
-
"バードストライク防止のため画像認識を用いた鳥 検出," 風力エネルギー学会,pp. 96--103 (2012).白石_風力エネルギー2012_No4-pp96.pdf
長谷川さん (2012)
- 卒論 "生態調査のための画像認識を用いた野鳥出現数調査の基礎検討 " 110445.pdf
吉橋 (2013-2015)
-
卒論 "野鳥の生態調査のための画像データセットの構築と認識手法の検討" graduate-report.pdf
-
こちらを編集 -> Google docs
その他
計算機リソース
- 一覧 -> Google spreadsheet
謝辞について
-
飯田先生の予算を入れる場合
-
本研究は、環境省海ワシ類における風力発電施設に係るバードストライク防止策検討委託事業の助成を受けたものです。
-
A part of this work is entrusted by the Ministry of the Environment, JAPAN (MOEJ), the project of which is to examine effective measures for preventing birds, especially sea-eagles, from colliding with wind turbines.
-
川上科研を入れる場合
-
本研究は、JSPS科研費JP18K11348の助成を受けたものです。 JP16K16083
-
This work was supported by JSPS KAKENHI Grant Number JP18K11348.
-
吉橋学振を入れる場合
-
本研究は、JSPS科研費JP16J04552の助成を受けたものです。
-
This work was supported by Grant-in-Aid for JSPS Fellows JP16J04552.
-
組み合わせ例 This work was also supported by grants from the Japan Society for the Promotion of Science (JSPS; KAKENHI Grant Number JP16KXXXXX and Grant-in-Aid for JSPS Fellows JP16J04552).
これまでのBirdグループの変遷
2018/4-2019/3:
-
研究活動 ・吉橋D3 研究内容 Open set 認識, 動画アノテーション ・森脇M2 Deep learningによるHDR生成 ・邵M1
-
研究アイディア ・MTL(Multi-task learning)続き ・風車のブレードの異常検知(+ドローン) ・鳥の動きによる分類 ・牛のre-identification ・Conv-LSTMのvisualization ・細胞動画の分類 ・異常検知(auto encoderで) ・画像を使った屋根の自動認識 ・動きの学習(点データの歩行のシミュレーションデータ等で) ・Zero-shot/One-shot Learning ・Deep Palette ・Auto Encoderの正則化 ・カラー校正(川上)
-
投稿予定 ・森脇ら, CVIM 9月研究会, 7月上旬 ・Yoshihashi, Trinh, et al., PAMI, "Differentiating objects by motion: Joint Detection and Tracking of Small Flying Objects" cvpr_PDF aaai_PDF
-
投稿済 ・Shao et al., CVPR workshop 3/23->29 〆切 "CNN-based Cattle Detection and Counting in Aerial Images" PDF ・吉橋ら, MIRU, 2018 3/8 & 22〆切, 夏開催,"動き表現の深層学習に基づく小物体の検出と追跡" 原稿 ・Fukuda et al., ECCV, 3/14 〆切, "Multi-task Learning of Object Detection and Semantic Segmentation with Cross-connected Convolutional Neural Networks" overleaf PDF ・Yoshihashi et al., CVA, "Pedestrian detection with motion features via two-stream convnets" PDF
-
発表文献
2017/4-2018/3:
-
研究活動 ・吉橋D2 研究内容 LSTMによる動画での検出と追跡,特にConv-LSTMによる学習で追跡+検出,Two-stream architecture, 動画アノテーション ・福田M2 「交差接続型畳み込みニューラルネットワークによる物体検出と意味領域分割のマルチタスク学習」修論 (意味領域分割+Deep detectorの構造を洗練,Annotationを画素レベルからバウンディングボックスレベルへ簡易化,Cross-connectionの提案) ・アンヤ Understanding what Convolutional LSTM learns by analyzing motion sequences ・森脇M1 Deep learningによるHDR生成 ・邵B4 牛(CNNに変更,SfMした画像内で頭数を推定) 「放牧支援のための深層学習を用いた空撮画像における牛検出と個体数推定」卒論
-
発表文献 ・王ら,SSII, 2017年, 6月, "畜産業支援に向けたドローンによる空撮画像の撮影と牛検出への応用" PDF 投稿原稿 ・Yoshihashi et al., Wind Energy, "Bird detection and species classification with time-lapse images around a wind farm: Dataset construction and evaluation" PDF・邵ら,PCSJ/IMPS, 2017年, 11月, "放牧支援のための空撮画像におけるCNNに基づく牛検出" PDF
2016/4-2017/3:
-
研究活動 ・吉橋D1 研究内容 Two-stream architectureによる動画への拡張, MSRAインターン, LSTMによる動画での検出,動画アノテーション ・チンM2 「Aggregating Appearance and Motion Information using Long Short-term Memory Networks for Bird Detection」修論 (LSTMにより静止画情報と動き情報を統合し検出に応用) ・福田M1 研究内容 意味領域分割+Deep detectorの構造を洗練,また,Annotationを画素レベルからバウンディングボックスレベルへ簡易化させる ・王B4 「畜産業支援に向けた空撮画像からの牛の検出と個体数の推定」卒論 (空撮画像におけるHOG+SVMによる牛の検出,複数枚の重ねあわせによる推定性能の向上)
-
発表文献 ・チンら,電子情報通信学会PRMU研究会3月,2017,"動物体検出のためのLSTMネットワークによる静止画と動き情報の統合" 原稿 ・Trinh et al., WWEC, 2016, 10月, "Bird Detection near wind turbines from high-resolution video using LSTM Networks" PDF ・福田ら, 映メ大会, 2016, 8月, "鳥検出のための矩形領域を教師情報としたCNNによる領域分割" 原稿 ・Takeki et al., ICIP, 2016, 9月, "Detection of small birds in large images by combining a deep detector with semantic segmentation" PDF suppl ・Takeki et al., CVA, 2016, 8月, "Combining deep features for object detection at various scales: Finding small birds in landscape images" PDF ・竹木ら, MIRU, 2016, 8月, 「深層特徴量の組み合わせによる解像度に適応的な物体検出―遠景画像に小さく写る鳥の検出」 PDF ・バら, SSII, 2016, 6月, 「複雑な背景や変形を考慮したロバストな鳥の自動追跡」 PDF 投稿原稿
2015/4-2016/3:
-
研究活動 ・吉橋M2 「深層学習による屋外画像からの物体検出―低解像度物体への適用と動き特徴量の導入」修論 (Deep learningで分類を再評価, Two-stream architectureによる動画への拡張) ・竹木B4 「深層特徴検出器と意味領域分割の組み合わせによる解像度に適応的な物体検出」 卒論 (意味領域分割をDeep detectorに導入し, 検出性能を向上させた) ・バB4 「Tracking Deformable Wild Birds in Landscape Image Sequences(変形を考慮した野鳥の自動追跡)」 卒論 (網走データでTrackingを評価, DSSTにHOGでなくMBHを適用し性能向上) ・チンM1 研究内容 動画データにLSTMを適用して物体を検出 ・その他 苫前で4K動画撮影
-
発表文献 ・竹木ら, 映メ大会, 2015, 「生態調査に向けた領域分割と検出器の組み合わせによる鳥画像検出」 PDF ・Yoshihashi et al., ICIP, 2015, "Construction of a bird image dataset for ecological investigations" PDF ・Yoshihashi et al., EWEA, 2015, "Evaluation of bird detection using time-lapse images around a wind farm" PDF 投稿原稿
2014/4-2015/3:
-
研究活動 ・吉橋M1 研究内容 静止画データセットの整理, Deep learningの導入 ・バB4 研究内容 網走で動画撮影, Trackingの性能比較
-
発表文献 ・吉橋ら, SSII, 2014, 「野鳥の生態調査のための画像データセットの構築」 PDF
2013/4-2014/3:
- 研究活動 ・吉橋B4 「野鳥の生態調査のための画像データセットの構築と認識手法の検討」 卒論 (正式なデータセットを構築, Haar+Adaboostで性能を確かめた)
2012/4-2013/3:
-
研究活動 ・長谷川B4 「生態調査のための画像認識を用いた野鳥出現数調査の基礎検討」 卒論 (Haar+Adaboostの前処理に背景差分を導入, 淡路のデータで評価)
-
発表文献 ・白石ら, 風力エネルギー2012, 「バードストライク防止のための画像認識を用いた鳥の検出」※要確認 PDF
2011/4-2012/3:
- 研究活動 ・白石M2 「生態調査・監視のための画像認識を用いた野鳥の検出」 修論 (Haar+Adaboostで性能を確かめた, オレオレデータで評価)
平木 / 情報投影
- 情報投影班の主に新人さんに読んでほしいペーパーをまとめたページ
アドバイス的なもの
アウトプットをしよう
-
読んだ論文について、何かしらのメモを残すことは大事
-
人間なので時間が立つと内容を忘れる、いざ学位論文を書く時にあるとないとでけっこう違う
-
僕はGoogle Docsのメモなんかに最近はしています
参考 高速で論文がバリバリ読める落合先生のフォーマットがいい感じだったのでメモ - 書架とラフレンツェ
-
落合先生の授業ガイダンス
-
落合先生のスライド1枚フォーマット
-
最初はこのフォーマットに倣うと良いかもしれない、ネット上に同じように他の人が読んだものが公開されているから、それも見て知識の増強も可能
-
外部の勉強会(CHI勉強会やUIST勉強会)に参加して発表するときも、このフォーマットに則っている人も多いです。
質より量
-
もちろん質も大事ですが、最初は分野全体の研究をある程度漏れなく把握することが一番大事だと思います。
-
1本をしっかり読み込むのはテーマの形が見えてきているときには必要になってくるけど、テーマ探しのときには必須ではない
-
その代わり量をこれでもかと増やしてください、1週間に25本読んでください。
-
cf. 落合先生の授業スライド p.26
-
直感ですが、100本読めば1つの研究に関しての関連研究はほぼほぼ網羅できてるのかな、と思います。
-
国際会議のフルペーパではだいたい50本程度の引用をすることを考えて、50%程度を引用すると考えるとまぁなんとなく妥当な数字 。
-
僕は「研究のアイディアが浮かびません」、という人にはだいたい「サーベイしろ、100本読め」としか言いません
論文リスト
テーブルトップディスプレイ上でのロボット制御
-
RoboTable2: a novel programming environment using physical robots on a tabletop platform (ACE2011)
-
杉本雅則先生の研究
-
ロボットが乗ったテーブルトップディスプレイ上で,様々な動作をGUIでプログラム可能なプラットフォームの研究
-
DIとFTIRを使ったマルチタッチディスプレイで,手とロボットのマーカを認識
-
ロボットの位置はカメラで認識(ReacTIVision)
-
Bluetoothでロボットに制御命令を与えている
-
ロボット制御自体は何秒前進などを個々にプログラムする必要がある
-
Interactions with a line-follower: An interactive tabletop system with a markerless gesture interface for robot control (ICRB2011)
-
テーブルトップディスプレイ上で,手によるジェスチャで線を描き,その線をロボットが追従することでロボットを制御する研究
-
テーブルトップ上におけるロボット環境の研究で,制御に関する提案をしているものはあんまりないので,そういう文脈でこれをreferしたい
-
インタラクティブにロボットを制御できるという反面,線が見えて映像との調和性に難がある(そもそもカメラ認識なので映像を出すと根本から画像処理の前提がくずれる)
-
LEGO Mindstorm NXTなのでロボットが大きい
-
関連する日本語論文が数本ある
-
IEEE ICRB: Int. Conf. on Robotics and Biometrics
-
Planner Manipulator Displayの話
-
テーブルトップディスプレイ上でロボットを制御し,映像と連動したふるまいをさせることで情報を提示する研究
-
人が動かすこともでき,自走もするインターフェースとしてロボットがふるまうことで,情報環境として役立つ
-
位置の検出はIRマーカ,情報の送信はIrDA
プロジェクションベースの位置認識
-
Hybrid infrared and visible light projection for location tracking (UIST2007)
-
Johnny Leeさんの研究
-
DLPプロジェクタの光源を赤色LED+赤外LEDのユニットに置換
-
画像を投影しながら赤外線通信を行うこ とができ,グレイコードを投影することで,位置情報をセンサで検出することができる
-
赤外PLC的にはすごいクリティカルな研究
-
複数の蛍光灯で可視光通信を行い,LEGO Mindstorm NXTを制御する研究
-
ジャイロセンサと可視光通信による情報で,自己位置推定ができることが評価の結果わかっている
-
ISP : Intelligent Signal Processing
-
屋内において,複数の蛍光灯と,センサアレイを使って可視光通信を行い,位置を推定する研究
-
可視光通信においては,普通にライト番号などをデータフォーマットに直して伝送し,どの位置でどのセンサが受信できたかという情報を用いる.
-
蛍光灯間隔が大きいので,もちろん誤差は大きい
-
そもそものスケーリングがかなり違う
-
汎用的なデータ転送によって位置情報を送信する試みの研究としてreferするかも
-
Smart light-ultra high speed projector for spatial multiplexing optical transmission (PROCAM2005)
-
Hideaki Nii, Maki Sugimoto, Masahiko Inami
-
DBCにおいて,高速LEDプロジェクタを試作して位置情報に応じたデータを不可視情報として送信する研究
-
空間解像度は著しく低く,モノクロ(杉本先生談)
-
4x5px
-
日本語(新居さんのD論): 空間分割多重化によるデータ投影技術の研究
-
Ramesh先生の研究
-
グレイコードパターンのスライドと光源のセットを縦一列に並べ,時分割で点灯することで位置情報を取得し,モーションキャプチャを行う研究
-
取得した位置情報を無線で返送
-
455kHzでLEDを明滅させている
-
原理上1軸の位置情報しか取れないので,3次元情報をとるためには3つ必要(x1,x2で三角測量してxとz,yは別で設置)
-
システムは新居さんが作っている(上記D論に日本語記述あり)
-
Ramesh先生の研究
-
普通のプロジェクタでグレイコードを投影して,フォトセンサで受信し,RFIDタグの通信でその情報を返送することで位置情報を取得する研究
-
雰囲気はSticky Projectionに近い
-
ポケプロで出来たりして手軽な反面,光による高速な通信というアプローチからはずれている
-
グレイコード は思いっきり見えちゃう
-
HiFi: hide and find digital content associated with physical objects via coded light
-
DLPプロジェクタでグレイコードパターンを投影し,モバイルデバイスの位置を検出するシステムの研究
-
基本原理はPVLCと同じ
-
ただ,データ埋め込みのみしか行っていないため,人間に見える映像としては無意味なものとなっている
-
汎用的なデータ送信ではなく,パターンの投影による位置情報の埋め込みのみしか行っていない
-
ディスプレイ映像に不可視情報を付与する技術に関するサーベイ論文
-
EmiTableもreferされている.
-
不可視情報埋め込みに関して,光学素子を使うことで特定の人にだけ見えるもの,カメラやセンサだと取得できるもの,カメラやセンサで取得し,その後信号処理することでデータを取得できるものに分類されている.
-
最後のはセキュリティ方面に需要があるらしい
**