Faster R-CNNの入力サイズにつてい
Afficher commentaires plus anciens
こんにちは。
Faster R-CNNを学習させようとしています。こちらのドキュメント(Faster R-CNN 深層学習オブジェクト検出器の学習 - MATLAB trainFasterRCNNObjectDetector - MathWorks 日本)を実際に実行してネットワークの入力サイズを確認したのですが、32×32×3でありかなり小さいサイズでした。
入力サイズがその値ということは、車の映る画像全体を32×32にリサイズしてネットワークに入力し、その後RPNで車のみをプーリングし分類+検出すると思うのですが、物理的に入力サイズが小さすぎませんでしょうか。しかし、ドキュメントではこの値で精度良く検出できていて不思議です。
逆にこちらのドキュメント(Faster R-CNN 深層学習の検出器を使用したオブジェクトの検出 - MATLAB - MathWorks 日本)では、Resnetを使用しており入力サイズが224×224であり、かなりサイズが違います。物理的な大きさで言えばこちらの方が特徴が学習しやすいように感じます。
そもそもこの2つのドキュメントですが、タイトルが違うものの検出器を学習させ最後にオブジェクトを検出しているので、行っていることは同じでしょうか?
最後に32×32のような人間が見ても特徴がわからないサイズで物体検出できている理由が知りたいです。
勉強不足で申し訳ありませんが、よろしくお願いいたします。
Réponse acceptée
Plus de réponses (0)
Catégories
En savoir plus sur 深層学習を使用したオブジェクトの検出 dans Centre d'aide et File Exchange
Community Treasure Hunt
Find the treasures in MATLAB Central and discover how the community can help you!
Start Hunting!