インテル® System Studio 2017 · 2018-08-09 · インテル® XDK IoT Edition Node.js...
Transcript of インテル® System Studio 2017 · 2018-08-09 · インテル® XDK IoT Edition Node.js...
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項
コネクテッド・デバイスは複雑さを増し、あらゆるところに存在システム/組込み開発者の課題と可能性が増加
これらの課題に取り組むには、ソフトウェア開発者は次のようなツールが必要 簡単に使える統合スイート 複雑なシステムの不具合を解決できるように迅速に支援 電力を浪費しているソースの詳細を提供 パフォーマンスが求められる、ユニークで競争力に優れたユースケースへの対応と高速化
ネットワーク &通信輸送 医療産業
軍事、航空宇宙、
政府小売
$$
画像処理デジタル・
セキュリティー/監視
クライアント& モバイル
クラウド/データセンター/
ストレージIoT デバイス
F
143 bpm
ゲートウェイ
2
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項3
システム/組込み開発者にシステムワイドの深い洞察を提供
開発期間を短縮
電力効率とパフォーマンスを向上
システムの信頼性を強化
組込みソリューションを迅速に開発
インテル® SYSTEM STUDIO
最新のインテル® プラットフォームをサポート
包括的なすぐに使えるドメイン固有のルーチン
システムワイドの視覚的なパフォーマンス解析により迅速に最適化
強力で分かりやすいパフォーマンス解析ツール
高度に最適化され、プラットフォーム向けにチューニングされたライブラリーとコンパイラー
実用的なデータ - ウェイクアップ、スリープステート、周波数、温度
相関システムイベントのトレース/デバッグ
クローズド筐体のソフトウェア・デバッグとプロダクション・ハードウェア上でのトレース
拡張されたデバッガー・ワークフローにより素早くデバッグを開始
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項
インテル® System Studio は包括的なツールスイートを提供システム/組込み開発者にシステムワイドの深い洞察を提供
4
パフォーマンスが求められるユースケースへの対応と高速化 電力を浪費しているソースの詳細を提供 複雑なシステムの不具合を解決できるように迅速に支援 簡単に使える統合スイート
組込みソリューションを迅速に開発 - 詳細: intel.ly/system-studio (英語)1 Linux*、組込み Linux*、Wind River* Linux*、Yocto Project*2 UEFI: Unified Extensible Firmware Interface
コンパイラーとライブラリー アナライザー デバッガー
UEFI2
エージェント
JTAG、JTAGoverUSB
Simics*
プラットフォーム・シミュレーション
Linux*1、Android™、Windows®、VxWorks* で動作するシステムおよびアプリケーション・コード
インテル® アーキテクチャー・ベースのプラットフォーム
C/C++コンパイラー
画像、信号、数学、データ処理
電力 &パフォーマンス
メモリー &スレッド化
アプリケーション &システム
デバッグ/トレース
ターゲットシステム
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項5
インテル® System Studio 2017 によりシステム、組込みアプリケーション、デバイスを迅速に開発 – 新機能
最新のインテル® プラットフォームをサポート
インテルの組込み/モバイル・プラットフォームを利用して優れたソリューション/デバイスを開発。アーキテクチャー固有のチューニングの向上、グラフィックス・エンジンへのオフロードを含む新機能。
改良された解析によりコード・パフォーマンスを最適化
拡張されたデータレポートと新しいサブシステム解析により、開発者はパフォーマンス・ボトルネックを特定して、コードへの影響を素早く理解し、より効率的なコードを作成可能。
コンパイラー & ライブラリー 画像、マシンラーニング、ストレージ、通信、輸送を含む、負荷の高い処理のパフォーマンスと機能を向上 - これらのターゲット向けに革新的なソリューション/アプリケーションの作成を支援。
簡単に使用可能 拡張されたユーザビリティー、ワークフロー、タスクベースのチュートリアルにより、開発者の生産性を向上。
素早いプロトライプ生成、競争優位性の確立
短期間でプロトタイプから生産に取り掛かれるように支援。ほかのインテル® ソフトウェア・ツールおよび SDK と連携して、ユニークで競争力に優れた機能の革新を支援。
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項6
各エディションと構成インテル® System Studio 2017
Composer Edition Professional Edition Ultimate Edition
ビルド
インテル® C++ コンパイラー
インテル® TBB
インテル® IPP
インテル® MKL
√√√√
√√√√
√√√√
解析
インテル® VTune™ Amplifier for Systems – パフォーマンス・
プロファイラー
インテル® Energy Profiler
インテル® Graphics Performance Analyzers
インテル® Inspector for Systems – メモリー/スレッドのデバッガー
√√√√
√√√√
デバッグ GDB アプリケーション・デバッガー3
インテル® System Debugger
GDB OpenOCD3
√ √ √√√
ホスト・オペレーティング・システム Linux*、Windows®
ターゲット・オペレーティング・システム1 Linux*2、Android™、Windows®
ハードウェア・プロセッサー/プラットフォーム4
プロセッサー: インテル® Quark™ プロセッサー X1000、インテル® Atom™ x3/x5/x7 プロセッサー、インテル® Core™ M プロセッサー、インテル® Core™ i3/i5/i7 プロセッサー、インテル® Xeon® プロセッサー
開発プラットフォーム: インテル® Edison 開発プラットフォーム、インテル® Joule™ モジュール、インテル® Puma™ 6 メディア・ゲートウェイ、第 2 世代インテル® Galileo ボード
1 利用可能なターゲット OS ライセンス: Linux*+Android™ (コンボ)、Windows®2 Linux*、組込み Linux*、Wind River* Linux*、Yocto Project*3 Linux* ターゲット OS でサポート4 サポートされるプロセッサーとプラットフォームの詳細は、リリースノートを参照してください。
フローティング・ライセンス、アカデミック・ライセンス、および VxWorks* サポートを含むその他の構成については、software.intel.com/en-us/intel-system-studio/try-buy (英語) を参照してください。すべてのエディションに 1 年間のインテル® プレミアサポート (更新可能) が含まれます。
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項
インテル® System Studio はシステム/組込み開発者を支援開発期間を短縮
7
「IMCORP は、電力ケーブル診断を行う複雑な信号処理アルゴリズムのパイオニアです。インテル® System Studio に含まれるインテル® VTune™ Amplifier を利用することで、それまで 8 時間以上かかっていたクリティカルなパフォーマンス hotspot の特定作業を 5 分以内に行うことができました。」
IMCORP R&D ソフトウェア・エンジニア
8 時間以上から 5 分に生産性を向上
www.imcorp.com
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項8
「インテル® System Studio に含まれるインテル® System Debugger を利用することで、工業オートメーション・システム・ソフトウェアのハードウェア依存コードを改善できました。インテル® System Studio により、プロセッサーの内部状態やソフトウェアのタイム・クリティカルな実行パスの分析にかかる労力が劇的に軽減しました。」
Beckhoff AutomationHenning Zabel 博士
コードを改善
「クラッシュの調査で、1 週間かかってなんとか問題が発生した場所は見つけましたが、原因の究明が非常に困難で苦労していました。インテル® Inspector を実行してみたところ、すぐに境界外の配列を見つけることができました。それは、実際にクラッシュが発生した場所よりもずっと前にありました。もっと早くインテル® Inspector を使用していれば 1 週間も無駄にせずに済みました!」
Envivio シニア・コーデック・アーキテクチャー・エンジニア
Mikael Le Guerroué 氏
効率を向上 -無駄な作業を排除
インテル® System Studio はシステム/組込み開発者を支援システムの信頼性を強化
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項
「インテル® System Studio により、最近リリースした弊社の Android™ ベースのタブレット Tolino Tab* 8” (電子書籍リーダー) では、ユーザー・エクスペリエンスが 3 倍 (500 ~ 700 ミリ秒から 200 ミリ秒) に劇的に向上しました。これにより、CPU 負荷が軽減され、電力効率が少なくとも 3 倍向上しました。」
Deutsche Telekom チーフ・プロダクト・オーナー
Dirk Hofmann 氏
「インテル® System Studio を使用することにより、弊社のインテル® アーキテクチャー・ベースのネットワーク・ビデオ・レコーダー・システムのパフォーマンスが 50% 向上しました。」
Zhejiang Dahua Technology Co.製品ライン・マネージャー
Cai Jian Feng 氏
3 倍向上電力効率
インテル® System Studio はシステム/組込み開発者を支援電力効率とパフォーマンスを向上
50% 向上パフォーマンス
9
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項
インテル® XDK IoT Edition
Node.js ベースのアプリケーションを直接IoT デバイス上で開発
インテル® IoT
ゲートウェイ
システム/組込み開発を容易にするツール
インテル® System Studio組込みソリューションを迅速に開発
インテル® System Studio for Microcontrollers
マイクロコントローラー・ベースのソリューションの作成に役立つツール
CPU ベースのシステム/組込み開発者向け
3 つのエディション: Composer、Professional、Ultimate
関連ツールキット (無料)
インテル® Computer Vision SDK
インテル® Media SDK またはインテル® Media Server Studio
インテル® SDK for OpenCL* Applications
コンピューター・ビジョン・ソリューションを高速化
高速で高密度のメディア処理 インテル® グラフィックスにより計算を最適化
10
IoT Edition素早く簡単に市場投入するための IoT ゲートウェイ
インテル® IoT Developer KitIoT ソリューションを簡単に作成
インテル® SYSTEM STUDIOベンチマーク
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項13
インテル® C++ コンパイラー - SPEC* ベンチマークで優れたパフォーマンスを達成
1 11.03 1.091.51
1.67
1 11.02
1.28
2.03
1.7
Windows® Linux* Windows® Linux*SPECfp*_speed_base2006 の推定値 SPECint*_speed_base2006 の推定値
システム構成: Windows® ハードウェア: インテル® Xeon® プロセッサー E3-1245 v5 @ 3.50GHz、ハイパースレッディング有効、ターボブースト有効、32GB RAM。Linux* ハードウェア: インテル® Xeon® プロセッサー E5-2680 v3 @ 2.50GHz、256GB RAM、ハイパースレッディング有効。ソフトウェア: インテル® C++ コンパイラー 17.0、Microsoft® C/C++ 最適化コンパイラー 19.00.23918 (x86/x64)、GCC 6.1.0、PGI* 15.10、Clang/LLVM 3.8。Linux* OS: Red Hat* Enterprise Linux* Server 7.1 (Maipo)、カーネル 3.10.0-229.el7.x86_64。Windows® OS: Windows® 10 Pro (10.0.10240 N/A Build 10240)。SPEC* ベンチマーク (www.spec.org)。
PG
I* 1
5.1
0
インテル
® C
++
コンパイラー
17
.0
PG
I* 1
5.1
0
Cla
ng
3.8
インテル
® C
++
コンパイラー
17
.0
浮動小数点演算 整数演算
相対 (相乗平均) パフォーマンス SPEC* ベンチマーク
インテル
® C
++
コンパイラー
17
.0
Vis
ua
l C
++
® 2
01
5
Vis
ua
l C
++
® 2
01
5
GC
C 6
.1.0
Cla
ng
3.8
GC
C 6
.1.0
インテル
® C
++
コンパイラー
17
.0
1 11.05 1.131.39
1.71
1 11.03 1.021.28
1.55
Windows® Linux* Windows® Linux*SPECfp*_rate_base2006 の推定値 SPECint*_rate_base2006 の推定値
システム構成: Windows® ハードウェア: インテル® Xeon® プロセッサー E3-1245 v5 @ 3.50GHz、ハイパースレッディング有効、ターボブースト有効、32GB RAM。Linux* ハードウェア: インテル® Xeon® プロセッサー E5-2680 v3 @ 2.50GHz、256GB RAM、ハイパースレッディング有効。ソフトウェア: インテル® C++ コンパイラー 17.0、Microsoft® C/C++ 最適化コンパイラー 19.00.23918 (x86/x64)、GCC 6.1.0、PGI* 15.10、Clang/LLVM 3.8。Linux* OS: Red Hat* Enterprise Linux* Server 7.1 (Maipo)、カーネル 3.10.0-229.el7.x86_64。Windows® OS: Windows® 10 Pro (10.0.10240 N/A Build 10240)。SPEC* ベンチマーク (www.spec.org)。SPECint* ベンチマークでは、Visual C++® コンパイラーとインテル® コンパイラーでSmartHeap 11.3 を使用。
PG
I* 1
5.1
0
インテル
® C
++
コンパイラー
17
.0
PG
I* 1
5.1
0
インテル
® C
++
コンパイラー
17
.0
Cla
ng
3.8
インテル
® C
++
コンパイラー
17
.0
Cla
ng
3.8
インテル
® C
++
コンパイラー
17
.0
浮動小数点演算 整数演算
相対 (相乗平均) パフォーマンス SPEC* ベンチマーク
Vis
ua
l C
++
® 2
01
5
GC
C 6
.1.0
Vis
ua
l C
++
® 2
01
5
GC
C 6
.1.0
性能に関するテストに使用されるソフトウェアとワークロードは、性能がインテル® マイクロプロセッサー用に最適化されていることがあります。SYSmark* や MobileMark* などの性能テストは、特定のコンピューター・システム、コンポーネント、ソフトウェア、操作、機能に基づいて行ったものです。結果はこれらの要因によって異なります。製品の購入を検討される場合は、他の製品と組み合わせた場合の本製品の性能など、ほかの情報や性能テストも参考にして、パフォーマンスを総合的に評価することをお勧めします。ベンチマークの出典: インテル コーポレーション最適化に関する注意事項: インテル® コンパイラーでは、インテル® マイクロプロセッサーに限定されない最適化に関して、他社製マイクロプロセッサー用に同等の最適化を行えないことがあります。これには、インテル® ストリーミング SIMD 拡張命令 2、インテル® ストリーミングSIMD 拡張命令 3、インテル® ストリーミング SIMD 拡張命令 3 補足命令などの最適化が該当します。インテルは、他社製マイクロプロセッサーに関して、いかなる最適化の利用、機能、または効果も保証いたしません。本製品のマイクロプロセッサー依存の最適化は、インテル® マイクロプロセッサーでの使用を前提としています。インテル® マイクロアーキテクチャーに限定されない最適化のなかにも、インテル® マイクロプロセッサー用のものがあります。この注意事項で言及した命令セットの詳細については、該当する製品のユーザー・リファレンス・ガイドを参照してください。注意事項の改訂 #20110804
インテル® C++ コンパイラーによる優れた C++ アプリケーション・パフォーマンス ― Windows®/Linux*(数値が大きいほど高性能)
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項
単精度複素数 1D および 2D FFT、インテル® Core™ i7-6700 プロセッサー
インテル® MKL と FFTW* の FFT パフォーマンスの比較
14
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項
単精度複素数 1D および 2D FFT、インテル® Xeon® プロセッサー E5-2699 v4
インテル® MKL と FFTW* の FFT パフォーマンスの比較
15
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項16
インテル® IPP により画像のサイズ変更関数のパフォーマンスを大幅に向上
1 2
インテル® AVX 向けに最適化されたコードとコンパイルした C コード インテル® AVX-512 向けに最適化されたコードとコンパイルした C コード
2
1
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項17
インテル® IPP により信号処理関数のパフォーマンスを大幅に向上
1 2
インテル® AVX 向けに最適化されたコードとコンパイルしたC コード インテル® AVX-512 向けに最適化されたコードとコンパイルした C コード
1
2
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項18
インテル® IPP により Tencent* の不正画像フィルターシステムが 2 倍以上スピードアップ
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項19
WeChat*、QQ*、QQ Album* などの人気があるアプリケーションでは、新しく生成される画像が約 100 ペタバイトにも上ります。不正画像 (アダルトコンテンツなど) をアップロードしようとするユーザーもいます。
それらをブロックするため、システムは各画像をチェックします。100 ペタバイトのデータを検索することを想像してみてください。
OpenCV* では 143ms かかるこの処理を、インテル® IPP のフィルター関数 (ipp_filter2D) は 9ms で実行します。つまり、インテル® IPP の filter2D は、OpenCV* コードよりも 15 倍高
速です。
インテル® IPP により Tencent* の不正画像フィルターシステムが 2 倍以上スピードアップ
※コンパイル時に OpenCV* はインテル® IPP を統合するため、いくつかの関数は自動的にインテル® IPP 関数を呼び出すことができます。
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項20
JD.com は、中国のほかのどの企業よりも多くのオンライン・トランザクションを処理しており、2014 年第二四半期の市場シェアは 54.3% でした。
ビジネスの急成長に伴い、提供する製品の数は 2011 年の約 150 万から 2013 年には約 2570 万へと大幅に増加しました。現在では、JD.com が扱うデータはペタバイトの領域に達しており、効率的で強固な分散型ファイルシステムが求められています。
JD.com は、画像処理を 17 倍スピードアップし、300,000 画像の処理を 2,800 秒から 162 秒に短縮しました。
インテル® IPP によりJD.com が画像処理を 17 倍スピードアップ
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項21
毎日、Tencent* では WeChat*、QQ*、QQ Album* でユーザーが生成した数十億もの画像を処理しています。
• 1 日で数億もの画像がアップロード、格納、処理、そしてダウンロードされます―そのため、大量の計算リソースを必要とします。
• 画像は、圧縮しても数百ペタバイトに上り、爆発的な成長が続いていて、対応するクラスターは 20,000 を超えるサーバーにより構成されています。
Tencent* のエンジニアは、オンラインシステムにもインテル® IPP の MD5 を実装しました。その結果、オリジナルの MD5 と比較して、パフォーマンスが約 60% 向上しました。
ケーススタディーの詳細
インテル® IPP によりTencent* が MD5 画像識別を 2 倍スピードアップ
インテル® SYSTEM STUDIO機能詳細
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項
画像、信号、データ処理アプリケーション向けのビルディング・ブロックインテル® インテグレーテッド・パフォーマンス・プリミティブ (インテル® IPP)
最適化
サポート
さまざまな取り組み
インテル® IPP について画像、信号、データ、暗号化処理作業を高速化する、すぐに使える、プロセッサー
向けに最適化された関数
インテル® IPP を使用する理由• ハイパフォーマンス• 簡単に使える API• 開発期間の短縮• プロダクション環境にも対応
画像処理• 医療用画像• コンピューター・ビジョン• デジタル監視• 生体認証• 自動ソート• ADAS• 視覚探索
信号処理• ゲーム (高度なオーディオコンテンツやエフェクト)
• エコー・キャンセレーション• 通信• エネルギー
データ圧縮と暗号化• データセンター• エンタープライズ・データ管理• ID 検査• スマートカード/スマートウォレット• 電子署名• 情報セキュリティー/サイバーセキュリティー
インテル® IPP の入手方法インテル® System Studio
インテル® Parallel Studio XE無料ツールプログラム
詳細: software.intel.com/intel-ipp (英語)サポート: software.intel.com/en-us/forums/intel-integrated-performance-primitives (英語)
23
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項24
マシンラーニング、科学、工学、金融、デザイン系アプリケーションにおける数学処理を高速化
密/スパース線形代数 (BLAS、LAPACK、PARDISO)、FFT、ベクトル演算、サマリー統計などの関数を含む
ほかの数学ライブラリーから簡単に切り替えられる業界標準の API
プロセッサーのパフォーマンスを最大限に引き出すように高度に最適化、スレッド化、およびベクトル化済み
インテル® マス・カーネル・ライブラリー (インテル® MKL) エネルギー 金融解析工学設計 デジタル
コンテンツ制作
科学/研究 信号処理
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項
マルチスレッド化とヘテロジニアス・コンピューティングを容易にインテル® スレッディング・ビルディング・ブロック (インテル® TBB)
最適化
サポート
さまざまな取り組み
インテル® TBB について1 つまたは複数のデバイス上のすべての CPU を利用して、アプリケーションの並列化を容易にする高度にテンプレート化された C++ ライブラリー
インテル® TBB を使用する理由• ハイパフォーマンス• 簡単に使える API• 開発期間の短縮• プロダクション環境にも対応
アプリケーション• アニメーション・レンダリング• 数値天気予報• 海洋学 & 天体物理学• AI & オートメーション• 遺伝子工学• 医療アプリケーション (画像処理、MRI
画像再構成)• リモート・センシング・アプリケーション• 社会経済学• 金融セクター (株式デリバティブの価
格付け、統計)• データファイルの大量更新• ビッグデータ問題
インテル® TBB の入手方法インテル® System Studio
インテル® Parallel Studio XE無料ツールプログラムオープンソース・サイト
詳細: software.intel.com/intel-tbb (英語)サポート: software.intel.com/en-us/forums/intel-threading-building-blocks (英語)
25
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項
正確なデータと意味のある解析で高速なコードを素早く開発 正確な CPU、GPU、スレッドデータ
メモリーアクセスとストレージ解析
強力なデータ解析とフィルター
データをソースコードに表示
セットアップが簡単で、特別な
コンパイラーは不要
高速でスケーラブルなコードを迅速に開発インテル® VTune™ Amplifier パフォーマンス・プロファイラー
intel.ly/vtune-amplifier-xe (英語)
SAS Institute Inc.主任開発者Claire Cates 氏
「先週は、インテル® VTune™ Amplifier により、3 倍のパフォーマンス向上を
見つけることができました。今週は、さらに3 倍パフォーマンスを向上できました。」
26
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項27
Application Performance Snapshotベクトル化とスレッド化によるパフォーマンス向上の可能性を見つけるインテル® VTune™ Amplifier パフォーマンス・プロファイラー
目的
休憩時間に簡単に実行可能
コードの現代化により利点が得られる個所を表示
ユーザー
パフォーマンス・チーム – 最も大きな利点が得られるアプリケーションを迅速に特定
開発者 – コードの現代化によるパフォーマンス・ゲインを予測 その他の用途
実用的なチューニング・データ – Snapshot を利用して素早く “ヘルス” チェックを行うことも可能
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項28
電力を無駄にしているソフトウェアを素早く特定ウェイクアップ、スリープステート、周波数、温度に関する実用的なデータインテル® Energy Profiler
低電力状態を長時間維持することで、ウェイクアップを結合し、電力消費を抑えて、バッテリー持続時間を向上
ファンレスシステムの温度管理を最適化
software.intel.com/en-us/intel-energy-profiler (英語)
コア周波数を下げて電力効率を向上
C6 ディープ・スリープ・モードにより消費電力を削減
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項29
詳細なフレーム解析により FPS を向上
複数のプラットフォームと GPU をサポート
困難な CPU/GPU の問題を特定
リアルタイム・ハードウェア・メトリックの詳細な解析
ソースコードや外部の変更は不要
グラフィックス・アプリケーションのデバッグ、解析、最適化ゲームの最適化とパフォーマンスの向上インテル® Graphics Performance Analyzers (無料)
intel.software.com/gpa (英語)PC ゲーム (Windows®、Ubuntu*) モバイルゲーム (Windows®、Android™)
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項
正当性検証ツールにより ROI が 12%-21%1 向上 早期に発見した問題のほうが修正コストが少なくて済む
いくつかの調査によると ROI% はケースバイケースだが、早期に発見/対応したほうがコストを抑えられる
エラーによっては診断に数カ月を要する 競合やデッドロックは簡単に再現できない
メモリーエラーをツールなしで発見するのは困難
デバッガー統合により迅速な診断が可能 問題の直前にブレークポイントを設定
デバッガーで変数とスレッドを確認
メモリー/スレッドエラーの特定とデバッグメモリー/スレッドのデバッガー – インテル® Inspector
デバッガー・ブレークポイント
数カ月かかっていた診断を数時間に短縮
「インテル® Inspector により、パッケージをリリースする前に、切り分けが困難なスレッドエラーを迅速に追跡できるようになりました。」
Harmonic Inc.ソフトウェア開発ディレクター
Peter von Kaenel 氏1 コスト要因 - Square Project による分析
CERT: U.S. Computer Emergency Readiness Team および Carnegie Mellon CyLab NIST: National Institute of Standards & Technology : Square Project の結果
intel.ly/inspector-xe (英語)
30
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項
複雑なシステムの問題を迅速に切り分け総合的なシステムワイドのハードウェア/ソフトウェア・イベントトレースインテル® System Debugger
31
タイムスタンプ付きの関連付けされたトレース情報を使用して問題を効率良く特定
ソフトウェアとハードウェア間の複雑な相互作用を解析
タイムスタンプ情報による
イベントトレース
フィルターダイアログを使用して特定のイベントに注目第 6 世代インテル® Core™ プロセッサー・ファミリー以降で利用可能
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項32
開発者がエンジニアリング・サンプルではなく、実際のプロダクション・ハードウェア上で作業する時間を排除
JTAG 機器/プローブにかかるコストを節約 - 高価な JTAG プローブの代わりに標準 USB 接続でデバッグ
JTAG デバッグ・ステーションを交代で使用する必要なし
柔軟な設計 – アクセス可能なハードウェア JTAG ポートの要件を緩和
システムワイドのクローズド筐体のデバッグ低コストの USB 接続による JTAG ベースのデバッグとトレース
(1) SVT = Silicon View Technology – 詳細: https://designintools.intel.com/product_p/itpxdpsvt.htm (英語)
CPU リセットからのデバッグ & トレース
インテル® SVT CLOSED CHASSIS ADAPTER (1)
インテル® SystemDebugger
ターゲットシステム 物理的な USB
ポートを介したJTAG データ
OS ブートのデバッグ & トレース
USB ケーブル
ターゲットシステム
インテル® SystemDebugger
第 6 世代インテル® Core™ プロセッサー・ファミリー以降で利用可能
インテル® SYSTEM STUDIO関連情報: 新機能
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項
インテル® System Studio 2017** - 新機能最新のインテル® プラットフォームをサポート
インテル® Quark™ プロセッサー X1000、インテル® Atom™ x3/x5/x7 プロセッサー、インテル® Core™ M プロセッサー、インテル® Core™ i3/i5/i7 プロセッサー、インテル® Xeon® プロセッサー、インテル® Edison 開発プラットフォーム、インテル® Puma™ 6 メディア・ゲートウェイほか
インテル® IPP は最新のベクトル命令を活用: インテル® SSE4.2 (インテル® Atom™ プロセッサー)、インテル® AVX 2 (インテル® Core™ プロセッサー)、インテル® AVX-512 (インテル® Xeon® プロセッサー)
高速なルーチン: FIR、MulPack、Min/Max、DotProd、BinToGray/GrayToBin、Morphology、CrossCorr、Sort、さまざまなフィルターなど
SIMD Data Layout Template (SDLT) により C++ コードのベクトル化を向上 コンパイラーによるループと関数のアライメントの向上 特定のターゲット・プロセッサー向けに強力なチューニングを行うコンパイラー・オプションを追加
– 第 5 世代インテル® Core™ プロセッサー向けのチューニング: /tune:broadwell (Windows®) または –mtune=broadwell (Linux*)– 第 6 世代インテル® Core™ プロセッサー向けのチューニング: /tune:skylake (Windows®) または –mtune=skylake (Linux*)
インテル® グラフィックス・テクノロジーへのオフロード (インテル® C++ コンパイラー) と OpenCL* 2.0 共有仮想メモリー (インテル® IPP/インテル® VTune™ Amplifier for Systems) のサポートを拡張
より多くの情報を利用して優れたコードを作成 より詳細なコンパイラーの最適化レポートとインテル® Inspector のスレッド・エラー・レポート インテル® VTune™ Amplifier for Systems のディスク I/O 解析により、バランスの取れていないディスク I/O と計算を検出
アプリケーション用のドメイン固有のツール マシンラーニング/ニューラル・ネットワーク: インテル® MKL を使用したディープ・ニューラル・ネットワーク (DNN) プリミティブ 画像処理: インテル® IPP を利用して 64 ビット・データ型で超解像をサポート
エクスペリエンスの向上 単純な IDE ワークフローにより簡単に製品開発に着手可能 特定のプロジェクトでの各種ツールの使用法を示すタスクベースのチュートリアルをさらに充実 デバッガー・ワークフローの拡張 (セッション管理、デバッグスクリプトのサポート、トレース出力のフィルター/検索) により製品のデバッグに集中可能
**ここでは主な機能のみ紹介 - すべての機能についてはリリースノートをご覧ください
34
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項
インテル® System Studio 2017インテル® C++ コンパイラー
インテル® C++ コンパイラー
より効果的な使用によりパフォーマンスを向上インテル® グラフィックス・テクノロジーへのオフロードを向上ベクトル化の改良点: 新しい SIMD Data Layout Template (SDLT) により C++ コードのベクトル化を向上 ループと関数のアライメントを向上 インテル® AVX-512 命令をサポート
新しいターゲット・プロセッサー・アーキテクチャー用のチューニング・オプション
正しい情報でより効果的なコードを作成最適化レポートの拡張: レジスター割り当てレポート、アノテーション付きのソース一覧、セキュリティー機能の強化により生産性と効率を向上
最新の言語標準とプラットフォームをサポートC++14、C11、最新の Windows® と Visual Studio® プラットフォームほか
35
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項
インテル® System Studio 2017インテル® IPP
概要 高速なルーチン
さらなるベクトル化によりパフォーマンスを向上 ベクトル & SIMD 命令を利用してパフォーマンスを向上
• インテル® SSE4.2 (インテル® Atom™ プロセッサー)、インテル® AVX 2 (インテル® Core™ プロセッサー)、インテル® AVX-512 (インテル® Xeon® プロセッサー)
改良された画像処理と超解像サポート 画像データ処理の精度を向上するため、新しい 64 ビット・
データ型を追加
コンピューター・ビジョン・アプリケーション向けにパフォーマンスを最適化 OpenCV* パフォーマンスを向上
インテル® アドバンスト・ベクトル・エクステンション 512 (インテル® AVX-512) 135 関数を Knights Landing✝ と Skylake✝ 向けに最適化:
32f Min/Max、Norms、Mean、Sum、Compare、SwapChannels、Copy、いくつかの Filters、Morphology、CrossCorr、いくつかの算術関数
17 関数を Skylake✝ 向けに最適化: DotProd、Convert、BinToGray/GrayToBin、いくつかの Filters、FIR、MulPack
インテル® アドバンスト・ベクトル・エクステンション 2 (インテル® AVX2)Haswell✝ と Skylake✝ 向けに最適化された関数: Convert、CrossCorr、Max/Min、PolarToCart、Sort、いくつかの算術関数
インテル® ストリーミング SIMD 拡張命令 4.2 (インテル® SSE4.2) インテル® Atom™ プロセッサー向けに最適化された関数:CopyMirrorBorder、Morphology (Dilate/ErodeBorder)、AlphaComposition
出典: インテルコーポレーション - Sharmila Chockalingam (20160603)
36
✝ 開発コード名
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項
インテル® System Studio 2017インテル® TBB & インテル® MKL
インテル® TBB インテル® MKL
ヘテロジニアス・コンピューティングのサポートを拡大 OpenCL* 2.0 共有仮想メモリー (SVM) 使用タイプを
サポート
インテル® MKL との互換性を向上• スレッドレイヤーのサポートをすべてのレベル 1
BLAS 関数に拡張
マシンラーニング & ニューラル・ネットワーク・アプリケーションのパフォーマンスを向上 新しいディープ・ニューラル・ネットワーク (DNN)
プリミティブによりインテル® アーキテクチャー上で畳み込みニューラル・ネットワークとディープ・ニューラル・ネットワークを高速化• 畳み込み、正規化、アクティベーション、プーリング関数
インテル® TBB との互換性を向上 スレッドレイヤーのサポートをすべてのレベル 1
BLAS 関数に拡張
37
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項
インテル® System Studio 2017インテル® VTune™ Amplifier for Systems & インテル® Inspector
インテル® VTune™ Amplifier for Systems インテル® Inspector
最適化の可能性がないかサブシステムを解析 ディスク I/O 解析は、ディスク・サブシステム、CPU、プロセッサー・
バスの使用状況をモニターして、バランスの取れていないディスクI/O の検出および計算を支援
OpenCL* 2.0 共有仮想メモリー (SVM) 使用タイプをサポート
ドライバーをインストールすることなく、より多くのパフォーマンス・データを解析• プリインストールされる Linux* の perf ドライバーを使用したイベント
ベースのサンプリングに、メモリーと帯域幅の問題の可視性を向上するイベントを追加
未活用のパフォーマンスを迅速に発見 新しい Application Performance Snapshot 機能により、単なる推測
ではなくデータに基づいて最適化の可能性の優先度を迅速かつ容易に付け、コードの現代化の潜在的な利点を表示
競合状態を簡単に診断 競合状態が発生したソースコードの行番号と変数 (グローバル、
スタティック、スタック) の名前を特定することで、競合状態とスレッドエラーのデバッグを改良
38
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項
インテル® System Studio 2017インテル® Graphics Performance Analyzers (インテル® GPA) & インテル® System Debugger
インテル® GPA インテル® System Debugger最適化の可能性がないかサブシステムを解析ディスク I/O 解析により、バランスの取れていないディスク I/O を検出
正しい情報でより効果的なコードを作成Graphics Frame Analyzer ergs の選択履歴とジオメトリ―・エクスポートを新たにサポート すべての試みを元に戻す機能を実装 ergs を使用状況、色分けされたリソースタイプに視覚的に関連付け
るリソース履歴を追加 Ubuntu* ターゲットのリモート・プロファイルを新たにサポートSystem Analyzer フレームレート制限の影響を最小限に抑えるための、Android™ と
Ubuntu* ターゲット向けの Vsync オーバーライドを実装 システムメトリックを1つのビューにまとめた Ubuntu* ターゲット用
の新しいシステムビュー Ubuntu* ターゲット向けに第 6 世代インテル® Core™ プロセッサー
上で GPU ハードウェア・メトリックをサポート
最新のグラフィックス API をサポートMicrosoft® DirectX® 12 API
改良されたデバッグ・ワークフロー より簡単なターゲット接続: デバッガー設定の保存と復元機能
を備えた新しいプロジェクト/セッションをサポート トレース出力フィルター/検索機能を向上 新しい Python* デバッグ・スクリプト・サポート
互換性の向上• DWARF4 デバッグ形式をサポート
39
その他のインテル® ソフトウェア開発ツールインテル® SYSTEM STUDIO と連携して動作
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項
IDE
/ツール
ハードウェア
OS
イメージ
ミドルウェア
クラウド
/エッジ解析
インテル® IoT Developer Kit
41
software.intel.com/iot (英語) API バインド (C、C++、Node.JS、Python*、Java*)
インテル® Edison ボード
インテル® IoT ゲートウェイ
プロトタイプ 評価/開発/デプロイ
MCU(インテル® Quark™ SE マイクロコントローラー、インテル® Quark™ マイクロコントローラー D2000)
アクチュエーター
Trusted Analytics Platform
(TAP)
IBM* BlueMix*、Microsoft® Azure®、Amazon* AWS*、AT&T* ほか
IoT エッジ解析
通信スタック(Wi-Fi*、Bluetooth* Technology、ZigBee* など)
管理機能、セキュリティー、クラウド接続など
センサー/アクチュエーター・ライブラリー
I/O ライブラリー(SPI、GPIO、I2C、
AIO、UART)
インテル® Galileo ボード
IDP/ Workbench
センサー
Intel®
インテル® Edison ボード、インテル® Galileo ボード、インテル® IoT ゲートウェイ、MCU
I/O およびセンサー/アクチュエーター向けミドルウェア・ライブラリー
IoT ソリューションを作成、実行、デバッグ、最適化するための IDE とツール
インテル® System Studio IoT Edition
インテル® XDK IoT Edition
Wind River* Helix* Cloud
MCU 開発ツール
C、C++、JavaScript*、Python*、Java* プログラミング言語をサポート
データの収集、視覚化、解析のための IoT クラウド/エッジ解析
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項
インテル® System Studio for Microcontrollersインテル® Quark™ マイクロコントローラー向けに高速でインテリジェントなモノの開発を支援
42
インテル® Quark™ マイクロコントローラーを利用して魅力的な IoT ソリューションを開発
Eclipse* 統合開発環境で開発効率を向上 最適化コンパイラーとライブラリーを使用して高速でコンパクトなコードを開発 デバッガーとアナライザーにより品質と電力効率を保証
インテル® SYSTEM STUDIO を利用して、組込みソリューションを迅速に開発software.intel.com/en-us/intel-system-studio-microcontrollers (英語)
1インテル® Quark™ マイクロコントローラー D2000 とインテル® Quark™ SE マイクロコントローラーの電力解析は近日サポート予定
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項
革新的な開発を加速インテル® Computer Vision SDK & インテル® SDK for OpenCL* Applications
インテル® Computer Vision SDKコンピューター・ビジョン・ソリューションを高速化
インテル® SDK for OpenCL* Applications
互換性1 つのグラフにさまざまな種類のビルディング・ブロックを混在させることが可能 ビルトインカーネル (CPU、GPU、IPU など) OpenCV* 関数、デバッグ/ユーティリティー・カーネル カスタムカーネル: ネイティブ C/C++、OpenCV*、OpenVX*、
OpenCL* ほか
ヘテロジニアス 各カーネルが異なる IP ブロックで実行するように割り当て コンピューター・ビジョン・アクセラレーターを簡単にプログラム可能 プラットフォームと IP ブロック間で簡単に移植可能 効率良いメモリー転送とタスク・スケジュール
パフォーマンスOpenVX* ランタイムで使用される複数のパフォーマンス向上機能(例: タイリング、キャッシュ/CPU の局所性、グラフ融合)
インテル® プラットフォーム向けの開発環境無料: software.intel.com/intel-opencl (英語)
プラットフォーム – OpenCL* の利点 ヘテロジニアス・コンピューティング向けのオープンスタン
ダードの移植性に優れた API Windows®、Linux*、Android™ 向けのハイパフォーマンスな
ヘテロジニアス・アプリケーションを開発 インテル® グラフィックス・テクノロジー向けプログラムを作成
する標準的な方法
43
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項
エッジ クライアント
エンドツーエンドの高速で効率良いメディア処理エッジからクライアントまでシームレスなソフトウェア開発エクスペリエンス
インテル® MEDIA SDK組込み Linux* 向け
インテル® MEDIA SERVER STUDIO インテル® MEDIA SDKWindows®/組込み Linux* 向け
FPGA
ビデオ・ゲートウェイ データセンター/クラウド
ネットワーク・ビデオ・レコーダー ビデオ・トランスコード/解析、リモート・デスクトップ、ゲーム
プレイヤー/エディター車載インフォテインメント/エンターテインメント
インテルが提供 ハードウェア・アクセラレーション・コーデックによるスケーラブルなパフォーマンス SDK および API の包括的なセット
開発期間の短縮 ソフトウェアの移植性
スマートカメラ/スマートカー
44
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項
プロセッサー、周辺機器、ネットワークをシミュレート
任意のサイズのターゲット・システムをシミュレート
未変更のターゲット・バイナリーを実行
ユニークで強力なデバッグ手法を使用
シミュレーションの動作を記録、保存、復元
Wind River* Simics* シミュレーション・テクノロジーSimics* は、開発者が利用する複雑な電子システムのハードウェアをシミュレートするシステム・シミュレーター
SIMICS
ターゲット・ハードウェア
アクセス - ソフトウェア開発プロセスからハードウェアによるボトルネックを排除
コラボレーション – 保存したシミュレーション環境を共有、通信、交換
オートメーション – デバッグ、テスト、プロファイル、トレース機能を自動化
インテル® System Studio に含まれている評価版シミュレーターSimics* は Wind River* (インテルの子会社) がライセンス所有および販売
45
インテル® SYSTEM STUDIO技術的な詳細
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項47
デバッグ & トレース
インテル® System Debugger
UEFI、OS、ドライバーJTAG ベース
システム・ソフトウェア
インテル® Debug Extensions for
WinDbg
Windows® スタックWinDbg over JTAG
ビルド & 最適化
インテル® C++
コンパイラーインテル®
グラフィックス・テクノロジーへのオフロードを含む
インテル® IPP
インテル® MKL
インテル® TBB
Eclipse* ベース、Visual Studio®
インテル拡張 GDB
IDE サポート
システム/組込みアプリケーション
インテル® Energy Profiler
インテル® GPA Frame Analyzer
インテル® GPA Platform Analyzer
インテル® GPA System Analyzer
インテル® Inspector
インテル® VTune™ Amplifier
解析
CPU/GPU ワークロードリアルタイム
CPU 上のコード・パフォーマンス時間ベース、イベントベース
システムワイドの電力効率ウェイクアップ、スリープステート、周波数、温度
グラフィックス・パフォーマンスOpenGL* ES、DirectX®
アプリケーションの安定性スレッド/メモリーリーク
パフォーマンス
電力
正当性
CPU/GPU ワークロードオフライン/詳細
Composer Edition
Professional Edition
Ultimate Edition
インテル® System Studio に含まれる機能
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項48
インテル® IPP
インテル拡張GDB デバッガー
Eclipse* IDE、WR Workbench、
Visual Studio®
インテル® C++ コンパイラー
IDE サポート• Eclipse*、Workbench* (Linux* ターゲット OS)• Visual Studio® (Windows® ターゲット OS)
IA 向けに最適化されたコンパイラーインテル® グラフィックス・テクノロジーへのオフロードを含む
IA 向けに最適化されたライブラリー• 画像、信号、データ処理
アプリケーション・デバッガーLinux*、Android™
パフォーマンスが最適化されたコードをビルド
Composer Editionビルド & 最適化
システム/組込みアプリケーション 優れたコード・パフォーマンス 強固なコードのためのアプリケーション・
リモート・デバッグ パフォーマンスが求められるコードルーチン
用ライブラリー 複数のターゲット OS プラットフォームで
統一されたスレッド化手法 一般的な IDE に統合
インテル® MKL • 1D、2D、3D FFT ほか
インテル® TBBスレッド・ライブラリーWindows®、Linux* ターゲット用統合テンプレート
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項49
インテル® Energy Profiler
インテル® GPA Frame Analyzer
インテル® GPA Platform Analyzer
インテル® GPA System Analyzer
インテル® Inspector
インテル® VTune™ Amplifier
解析
CPU/GPU ワークロード• リアルタイム
CPU 上のコード・パフォーマンス時間ベース、イベントベース
システムワイドの電力効率ウェイクアップ、スリープステート、周波数、温度
グラフィックス・パフォーマンスOpenGL* ES、DirectX®
アプリケーションの安定性スレッド/メモリーリーク
パフォーマンス
電力
正当性
• オフライン/詳細
ワークロード解析によりシステムの動作を理解 より応答性に優れたシステムのコード解析 高速グラフィックスのフレーム解析 システムワイドの解析により電力効率を最適化 スレッドおよびメモリーリーク解析によりシステ
ムの安定性を向上
電力効率、パフォーマンス、コードの正当性を解析
Professional EditionComposer Edition を含む
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項50
インテル® System Debugger
システム・ソフトウェア
安定性を高めるシステムワイドのデバッグとトレース
デバッグ & トレース
UEFI、OS、ドライバーのデバッグ& トレースJTAG ベースLinux*、Android™ ターゲット OS
システムワイドのデバッグとトレース UEFI、OS、ドライバー、ミドルウェア用 イベントトレースにより困難な問題を迅速に
特定 さまざまな JTAG ハードウェア・インターフェイ
スをサポート より効率的なデバッグサイクルのために OS
(Linux*、Android™、VxWorks*) を認識 Windows® インテグレーター向けのフルスタッ
ク・デバッグ
Ultimate EditionProfessional Edition を含む
インテル® Debug Extensions for
WinDbg
Windows® スタックWinDbg over JTAGWindows® ターゲット OS
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項
デバッグとトレース
51
表示できる項目:• 実際のソースコード行• 変数のステータス• HW レジスターの内容
デバッグ = システムのスナップショット
時間
ハードウェア・イベントBluetooth*、GPS
ソフトウェア・イベントOS、ファームウェア
STOP
表示できる項目:• タイムスタンプ付きのハードウェア・イベントと
ソフトウェア・イベント• サービスルーチンのマップ
トレース = システムの履歴
時間
STOP
プラットフォーム・ソフトウェア プラットフォーム・ソフトウェア
トレースはハードウェア・イベントとソフトウェア・イベントの履歴を正確に表示し、複雑な問題を迅速に識別して切り分けることができる
ハードウェア・イベントBluetooth*、GPS
ソフトウェア・イベントOS、ファームウェア
デバッグトレース記録 時間
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項52
BIOS/UEFI OS/RTOS/カーネル/ドライバーブートフェーズ
USB.DbCスタック
インテル® SVT Closed Chassis Adapter
USB クローズド筐体の JTAG
USB クローズド筐体のデバッグ
CPU リセット USB 接続確立(UEFI の一部、OS に依存しない)
コスト効率に優れたアクセスでシステムワイドの問題を切り分けUSB を介した低コストの JTAG ベースのデバッグとトレース・ソリューション
CPU リセットからのデバッグ & トレース
インテル® SVT CLOSED CHASSIS ADAPTER (1)
OS ブートのデバッグ & トレース
USB ケーブル
インテル® SystemDebugger
ターゲットシステム
(1) SVT = Silicon View Technology – 詳細: https://designintools.intel.com/product_p/itpxdpsvt.htm (英語)
物理的な USB ポートを介したJTAG データ
ターゲットシステム
インテル® SystemDebugger
第 6 世代インテル® Core™ プロセッサー・ファミリー (開発コード名 Skylake) で利用可能
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項53
プリエンプティブなリアルタイム Linux* でアプリケーションのパフォーマンスを解析パフォーマンス・アナライザーはリアルタイム Linux* システムのプロファイルをサポート
プリエンプティブな Linux* システムのパフォーマンスhotspot を素早く正確に特定
o データコレクターが優先度の高いタスクで中断されるため、プリエンプティブなシステムにおける正確なパフォーマンス・プロファイルは困難
インテル® VTune™ Amplifier は低オーバーヘッドのサンプリングによりデータ収集を継続
コンカレンシー解析、ロックと待機解析、コンテキスト・スイッチ情報を提供
インテル®
VTune™ Amplifier の
データコレクター
組込みリアルタイム・アプリケーション
プリエンプティブなリアルタイム
Linux*
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項54
仮想環境でアプリケーションのパフォーマンスを解析パフォーマンス・アナライザーは仮想環境でのパフォーマンス・プロファイルをサポート
ゲスト OS で実行中の組込みアプリケーションのパフォーマンスと動作を検証して解析
1 つのプラットフォームで仮想環境を利用して複数の OS とアプリケーションのパフォーマンスを最適化し、ハードウェア・コストを抑制
VM1 1
ゲスト OS 1
組込みアプリケーション
VM2 1
ゲスト OS 2
組込みアプリケーション
VM3 1
ゲスト OS 3
組込みアプリケーション
ハイパーバイザー
1 KVM、Wind River* Open Virtualization windriver.com/announces/open_virtualization/ (英語)
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項55
Windows® システムの詳細情報により信頼性を強化Microsoft® WinDbg カーネルデバッガー向けのシステムデバッグおよびトレース拡張
JTAG を利用して新しい Microsoft® WinDbg で簡単にプラットフォームを起動し Windows® ドライバーを検証
ドライバーや割り込みを含む、完全停止状態の Windows® システムをデバッグ
インテル® Processor Trace により複雑なランタイム時の問題を迅速に切り分け
JTAG およびインテル® Processor Trace 対応のMicrosoft® WinDbg カーネルデバッガー
インテル® Processor Trace
の情報
第 6 世代インテル® Core™ プロセッサー・ファミリー以降で利用可能
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項
グラフィックス・コア
オフロードされるコードをコンパイラーが生成
CPUコア
グラフィックス・コアにオフロードされた計算負荷の高いコードを効率良くデバッグオフロードコード用デバッガー
56
計算負荷の高いコードをプロセッサーとグラフィックス・コア間で連携して実行
簡単なコンパイラー宣言子 (#pragma) を使用してオフロード用にコードをマーク
グラフィックス・コアで実行するコードのデバッグが可能
インテル® HD グラフィックスまたはインテル® Iris™ Pro
グラフィックスを搭載したインテル® Core™ プロセッサーおよびインテル® Xeon® プロセッサー
デバッグ・クライアント
グラフィックス・コアで実行する
アプリケーションのソースコード
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項
必要な情報を素早く表示インテル® VTune™ Amplifier
関数をダブルクリックしてソースを表示
データのグループを調整
… (リストの一部のみ表示)
[+] をクリックするとコールスタックが表示される
タイムライン (またはグリッド) の選択範囲でフィルター
プロセスとその他のコントロールでフィルター
チューニングの可能性はピンクで表示ホバーするとヒントが表示される
57
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項
タイムラインでスレッドの動作を視覚的に確認インテル® VTune™ Amplifier
オプション: API を使用してフレームとユーザータスクをマーク
オプション: 収集中にマークを追加
CPU 時間
ホバー:
遷移基本 hotspot 高度な hotspotロックと待機
58
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項
並列パフォーマンスの問題を視覚化共通パターンを見つける
粗粒度のロック
高いロック競合
ロード・インバランス
低コンカレンシー
59
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項
インテル® GPU の計算パフォーマンスインテル® VTune™ Amplifier
プロセッサー全体 (CPU + GPU) 向けにチューニング
OpenCL* カーネルと GPU オフロードのチューニング新しいプロセッサーでは、GPU データの収集も可能 (オプション)。GPU & CPU アクティビティーの関連付け(Windows® のみ)。
可能性をハイライト表示潜在的なチューニングの可能性があるセルはピンクでハイライト。ホバーすると推奨事項が表示される。
60
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項61
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項62
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項
呼び出し元/呼び出し先 – 親/子の解析インテル® VTune™ Amplifier
左ペインで関数をクリックして呼び出し元/呼び出し先の情報を表示
タイム・クリティカルな実行パスのボトルネックを素早く発見
63
© 2016 Intel Corporation. 無断での引用、転載を禁じます。* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
最適化に関する注意事項
法務上の注意書きと最適化に関する注意事項本資料の情報は、現状のまま提供され、本資料は、明示されているか否かにかかわらず、また禁反言によるとよらずにかかわらず、いかなる知的財産権のライセンスも許諾するものではありません。製品に付属の売買契約書『Intel's Terms and Conditions of Sale』に規定されている場合を除き、インテルはいかなる責任を負うものではなく、またインテル製品の販売や使用に関する明示または黙示の保証 (特定目的への適合性、商品性に関する保証、第三者の特許権、著作権、その他、知的財産権の侵害への保証を含む) をするものではありません。
性能に関するテストに使用されるソフトウェアとワークロードは、性能がインテル® マイクロプロセッサー用に最適化されていることがあります。SYSmark* や MobileMark* などの性能テストは、特定のコンピューター・システム、コンポーネント、ソフトウェア、操作、機能に基づいて行ったものです。結果はこれらの要因によって異なります。製品の購入を検討される場合は、他の製品と組み合わせた場合の本製品の性能など、ほかの情報や性能テストも参考にして、パフォーマンスを総合的に評価することをお勧めします。
© 2016 Intel Corporation. 無断での引用、転載を禁じます。Intel、インテル、Intel ロゴ、Intel Inside、Intel Inside ロゴ、Intel. Experience What‘s Inside、Intel. Experience What’s Inside ロゴ、Intel Atom、Intel Core、Intel Jourle、Iris、Puma、Quark、Xeon、Intel Xeon Phi、VTune は、アメリカ合衆国および / またはその他の国における Intel Corporation の商標です。Microsoft、Azure、DirectX、Visual C++、Visual Studio、 Windows および Windows Server は、米国 Microsoft Corporation の、米国およびその他の国における登録商標または商標です。Android は Google Inc. の登録商標または商標です。
最適化に関する注意事項
インテル® コンパイラーでは、インテル® マイクロプロセッサーに限定されない最適化に関して、他社製マイクロプロセッサー用に同等の最適化を行えないことがあります。これには、インテル® ストリーミング SIMD 拡張命令 2、インテル® ストリーミング SIMD 拡張命令 3、インテル® ストリーミング SIMD 拡張命令 3 補足命令などの最適化が該当します。インテルは、他社製マイクロプロセッサーに関して、いかなる最適化の利用、機能、または効果も保証いたしません。本製品のマイクロプロセッサー依存の最適化は、インテル® マイクロプロセッサーでの使用を前提としています。インテル® マイクロアーキテクチャーに限定されない最適化のなかにも、インテル® マイクロプロセッサー用のものがあります。この注意事項で言及した命令セットの詳細については、該当する製品のユーザー・リファレンス・ガイドを参照してください。
注意事項の改訂 #20110804
64