YOLOv5によるAI物体検出ソリューション|ディープラーニング|機械学習

 

ここ数年、AIディープラーニング技術の急速な発展により、物体検出の勢いが劇的に加速している。物体検出は、ほとんどの視覚ベースのAIソフトウェアやプログラムの中核であり、シーン理解において重要な役割を果たしている。画像や動画を自動解析して、さまざまなアイテム、動物、人物を検出、識別、カウントすることは、セキュリティ、交通、医療、軍事アプリケーションで一般的に使用されている。

コンピュータ・ビジョンの分野と性能は著しく進歩しているが、物体の検出は複雑な実装であり、しばしば多くの課題に直面する。物体検出は、視覚的分類と物体の位置特定を含む非常に複雑なタスクである。物体検出の課題には以下のようなものがある:

1.オブジェクトは完全に見えるかもしれない
視点が違う

2.光が暗ければ暗いほど、物体の視認性は低下する。

3.ごちゃごちゃした背景の影響
認識

4.動きのある物体は、より精密なアルゴリズムを必要とする。

物体検出によく使われるアルゴリズムには、R-CNN(領域ベース畳み込みニューラルネットワーク)、高速R-CNN、YOLOがある。R-CNNモデルは一般的に精度が高いが、YOLOモデルファミリーは高速で、R-CNNよりもはるかに速く、リアルタイムで物体検出を実現する。

このベンチマーク(YOLOv5 TensorRT Benchmark for NVIDIA® Jetson™ AGX Xavier™ and NVIDIA® Laptop 1また、大人気のYOLOv5物体検出をBlade 3でテストし、RK3588チップでどのように動作するか、その性能を示しました。 

ここでは、リアルタイムのカメラフィードとビデオに対するYOLOオブジェクト検出を行うための詳細なチュートリアルリソースを紹介します。


リソース
リンク

ベンチマーク
https://community.mixtile.com/t/blade-3-yolov5-benchmark/607
リアルタイムカメラ検出 https://community.mixtile.com/t/how-to-change-the-rk-yolov5-demo-to-capture-real-time-camera-feeds/609
ビデオのオブジェクト検出 https://community.mixtile.com/t/how-to-do-object-detection-in-video-with-rk-yolov5-demo/622

さらに、Blade 3ボードの性能を評価し、その有効性を実証するために、詳細なビデオも作成しました。このビデオでは、驚くべきRK YOLOv5物体検出を行うためのシングルボードコンピュータの使い方を紹介します。

ディープラーニング技術とAIによる物体検出 - SBCを搭載

Mixtile Blade 3

先のベンチマークで述べたように、Mixtile Blade 3ボードは、NPUの精度、低消費電力、リーズナブルなコストといったコア機能を備えているため、費用対効果の高いAIOTおよび物体検出ソリューションにとって非常に有益である。 

Mixtile Edge 2

Blade 3ボードと比較すると、Mixtile Edge 2は1Top NPUを搭載しているが、パフォーマンスも非常に高い。最大2.0GHzのクアッドコアARM Cortex-A55を搭載し、最大8GBのLPDDR4をサポートする。高性能NPU内蔵のRK3568 SoCを採用し、TensorFlow、Caffe、Tflite、Pytorch、Onnx NN、Android NNなどのAIディープラーニングフレームワークに最適。

機械学習用の強力な6TOPS NPU

Mixtile Blade 3の心臓部には、クアッドコアCortex-A76とクアッドコアCortex-A55を搭載した8nm製造の低消費電力・高性能プロセッサー、RK3588 SoCが搭載されている。また、強力なクアッドコアGPUのMali G610MC4と6TOPSのNPUが搭載されており、AIワークロードのパフォーマンスを向上させ、広範な機械学習をサポートします。NPUは、ディープラーニング技術に必要な複雑な数学計算を実行するために特別に設計されています。このため、ヨーロ物体検出タスクに不可欠な大量のデータ処理に非常に効率的です。

RK 3588 NPU

  • 自社開発の新マルチコア・アーキテクチャ
  • 帯域幅の利用率向上
  • 前処理アクセラレーションのサポート
  • Eltwiseの性能向上
  • INT4/TF32データ型の追加
  • INT8の演算能力は最大6TOPS

正確な画像処理によるAI物体検出へのアクセス

このシステム・オン・チップには、HDR、3A、3DNR、シャープネス、デヘイズ、魚眼補正、ガンマ補正など、複数のアルゴリズム・アクセラレータを実装できる48メガピクセルの画像信号プロセッサが搭載されている。

AIディープラーニングのための高度なビデオストリーミング処理

内蔵HDMIインターフェースや、高品質ビデオフォーマットのエンコード/デコードのオンボードサポートもあり、パーソナルコンピューティングからビデオストリーミングまで、他の幅広いアプリケーションにも同様に適しています。このチップには、強力なArm Mali-G610 GPUが搭載されており、高品質のグラフィックス処理と、VulkanやOpenGL ES 3.2などの高度なグラフィックスAPIのサポートを提供することができます。これは、高度なビジュアライゼーションやユーザー・インターフェースを必要とする物体検出アプリケーションにとって重要です。

Mixtile AI物体検出ソリューションの利点

画像やビデオ内のオブジェクトをリアルタイムで検出・分類し、AIディープラーニングの効率を最大限に高めることができます。

1.ビジュアルAIディープラーニング・アクセラレーション

AIや機械学習を使った物体検出に関しては、効率と精度が考慮すべき重要な要素だ。YOLO(You Only Look Once)はディープラーニングアルゴリズムで、その正確な物体検出能力で人気を博している。さらに、Mixtile Blade 3は低消費電力に設計されており、高効率で物体検出を行うための環境に優しい選択肢となっている。

2.多様なAIOT産業に力を与える:

インテリジェント・ヘルスケア・モニタリング

産業用異常検知

自律レジ

エクスプレス・ソート

自律走行車

精密農業

3.幅広い接続オプションに対応

AIや機械学習を使った物体検出を成功させるためには、物体検出システムと周辺機器とのインターフェースが重要です。PCIe 3.0、USB 3.1、HDMI 2.1などの高速インターフェイス。つまり、AIの物体検出アプリケーションで一般的に使用されるさまざまなセンサー、カメラ、その他の周辺機器と簡単にインターフェースできる。

4.プレミアムソリューションで特定のビジネスを構築する

当社のシングルボードコンピュータは、小規模プロジェクトから大規模な展開まで、幅広いアプリケーションのニーズに合わせて拡張することができます。ディープラーニングや機械学習プロジェクトのために、クラウドベースのソリューションや他の分散システムと簡単に統合することができます。

AI/MLプロジェクトにMixtileを選ぶ理由は?

プロフェッショナル・サポート

専任アカウントマネージャー、10年以上のR&D技術革新と15人以上の専門サポートチーム

フル製品構築サービス

Mixtileのプレミアムな研究開発、生産、アフターサービスは、あなたのデザインコンセプトを販売可能な製品に変えます。

完全なテクニカル・リソース

顧客のニーズに応じて、アプリケーションのカスタマイズや統合サービスを提供しています。SDKを含む完全なリソース、 開発ドキュメント技術資料やチュートリアルも提供される。

エスディーケー

開発関連文書

技術資料

チュートリアル