Electronics Information Service

組込みシステム技術者向け
オンライン・マガジン

MENU

SOLUTION

ケイデンスのTensilica新製品Vision Q7 DSP、車載、AR/VR、モバイル、監視カメラの市場に向け、ビジョン、AI処理のパフォーマンスを2倍高速化

2019.5.16  5:48 pm

SLAMアルゴリズムに向けて最適化された命令セットの強化により、最大1.82TOPSのパフォーマンスを提供

ケイデンス・デザイン・システムズ社(本社:米国カリフォルニア州サンノゼ市、以下、ケイデンス)は、5月15日(米国現地時間)、Tensilica® Vision DSP製品群を拡張し、最大1.82 TOPS (tera operations per second) のパフォーマンスを提供する新製品Cadence® Tensilica Vision Q7 DSPについて発表しました。

組み込み向けビジョン、AIアプリケーションにおいてますます高まる演算要求に対応するために、Vision Q7 DSPは、前世代の製品Vision Q6 DSPと同じ面積で比較して2倍のAIおよび浮動小数点演算パフォーマンスを提供します。Vision Q7 DSPは、車載、ロボット、ドローン、モバイルなどの市場で広く使われているSLAM(simultaneous localization and mapping)アルゴリズムに特化して最適化されており、未知の環境のマップを自動で生成、修正すると共に、AR/VRなどに向けてはインサイドアウトなトラッキングをサポートします。さらに詳細については、www.cadence.com/go/visionq7をご参照下さい。

エッジ側のアプリケーションにおいてイメージセンサーに対する需要はますます高まっており、組み込み向けビジョン市場の成長を牽引しています。今日のビジョン向けアプリケーションにおいては、ビジョンとAIの処理を合わせて行うことが求められており、エッジ向けSoCの開発においては極めて柔軟性が高く、高速で低消費電力のビジョン、AIソリューションが必要となります。さらに、イメージングカメラなどのエッジ側のアプリケーションにおいてもAI処理の前にプリあるいはポストプロセッシングを実行するためのビジョン向けDSPが求められます。SLAMアルゴリズムの実行と共に、エッジ側のSoCにはパフォーマンスの向上およびレイテンシの低減が求められ、さらにバッテリー駆動のデバイスに対しては消費電力を更に削減するためのオフロード演算エンジンも必要になります。SLAMアルゴリズムにおいては、必要な精度を達成するために固定小数点、浮動小数点演算を共に活用するので、SLAMに対応するビジョンDSPは両方のデータタイプに対してさらに高いパフォーマンスを提供することが求められます。

消費電力、アーキテクチャ、命令セットに関する改良により、Vision Q7 DSPは難度の高いエッジ向けビジョン、AI処理に最適なソリューションであり、下記のような重要な指標に対するパフォーマンスを向上しています。

・VLIW (very long instruction word) SIMDアーキテクチャにより、Vision Q6 DSPと同面積で比較して最大1.7倍のTOPSを提供

・8/16/32-bitデータタイプ、および単精度、半精度に対応するVFPUオプションをサポートする命令セットの強化によって、Vision Q6やVision P6 DSPに比べてSLAMカーネルに対する処理が2倍高速化

・半精度(FP16)、単精度(FP32)に対するFLOPS/mm2(floating-point operations per mm2)が、Vision Q6、Vision P6 DSPに比べて2倍向上

・Vision Q6と同面積で比較してAI処理のパフォーマンスが最大2倍向上したことにより、GMAC/mm2も2倍向上

256 MACをサポートしていた全世代のVision Q6 DSPに対してVision Q7 DSPは512 8-bit MAC をサポートしており、AIアプリケーションに対して柔軟性の高いソリューションを提供します。また、推論専用のアクセラレーターTensilica DNA 100と併用することで、さらにAI処理のパフォーマンスを向上させることも可能です。さらに、Vision Q7 DSPにおいては、3D DMA、コンプレッション、256-bit AXIインタフェースなどiDMAに関する様々な強化が行われています。Vision Q7 DSPは、Vision Q6 DSPとの上位互換性が保たれており、既存のソフトウェアの再利用が可能で、Vision Q6 やVision P6 DSPから容易に移行することができます。

Embedded Vision Alliance コメント
Jeff Bier氏(founder of the alliance)
「ビジョンAIのアプリケーションは広範かつ急激に成長しており、演算パフォーマンスに対する要求は高まるばかりです。特に、コスト競争が激しいバッテリー駆動のデバイスにおいてビジョン処理が行われる場合など、コストと消費電力に対する制限のもとで必要なレベルのパフォーマンスを達成することが共通の課題となっています。ビジョンAIアプリケーションの需要に合わせて様々な演算処理エンジンを開発することによってこれらの課題を解決するケイデンスの貢献に賛辞を贈ります。」

ArcSoft社コメント
Frison Xu氏(marketing VP)
「私たちはこれまで2世代にわたりケイデンスのVision DSP上でAIおよびビジョン系アプリケーションを開発し、提供してきました。今回Tensilica Vision Q7 DSPによってビジョン、AI処理のパフォーマンスが2倍向上したことは、低レイテンシが重要なSLAMアルゴリズムの実行において特に有益です。今回のパフォーマンス向上により、私たちはカメラアプリケーションなど複数のイメージセンサーを搭載する製品を新規に開発することが可能になります。」

Megvii社コメント
David Shen氏(senior product marketing director)
「ケイデンスおよび私どものお客様と共に、私たちは顔認識などのビジョン技術を、高パフォーマンス、低消費電力、低レイテンシが重要な様々なアプリケーションにポーティングしてきました。ケイデンスは、我々の技術を実現するために必要なソフトウェアツールとライブラリを含め、ベストなビジョン、AI向けプラットフォームを提供してくれています。」

ケイデンス・コメント
Lazaar Louis (senior director of product management and marketing for Tensilica IP)
「私たちがターゲットとしている様々なマーケットに向けたエッジコンピューティングにおいて、高パフォーマンス、低消費電力で柔軟性の高いDSPを活用してビジョンアプリケーションをオフロードで実行させることは必須です。ケイデンスはこれまで6世代にわたるVision DSPを提供し成功の歴史を築いてきました。新製品Vision Q7 DSPは、視覚を具現化するSLAMなど大変複雑なビジョン、AIアルゴリズムを採用する重要なお客様の要求に対応します。Vision Q7 DSPは、既に実績のある車載向けのポートフォリオもさらに強化し、ISO26262など機能安全に関する規格に準拠し、最先端の演算処理技術を車の中で実現します。」

Vision Q7 DSPは、Tensilica Xtensa® Neural Network Compiler (XNNC)を通じてCaffe、 TensorFlow、TensorFlowLite等のフレームワークで開発されたAIアプリケーションサポートをしています。XNNCは、ニューラルネットワークをVision Q7 DSP向けに高度に最適化されたハイパフォーマンスなコードにマッピングします。また、Vision Q7 DSPは、Android対応デバイスのオンデバイスAIの高速化に対応するAndroid Neural Network (ANN) APIもサポートしています。また、ソフトウェア環境としては、1,700以上のOpenCVベースのコンピュータ・ビジョン関数が完全かつ最適な形でサポートされており、既存のコンピュータ・ビジョンアプリケーションのハイレベルな移行を迅速に行うことができます。さらに、すべての開発ツールおよびライブラリは、SoCベンダーがISO2626 ASIL D (automotive safety integrity level D)に準拠できるように開発されています。

■日本ケイデンス・デザイン・システムズ社
 http://www.cadence.co.jp