| No.233 | NVIDIA CUDA Toolkit 2.3を発表
|
| 投稿者:
NVIDIA CUDA Team
| NVIDIAは本日、GPUコンピューティング向けCUDA ToolkitおよびSDKのバージョン2.3をリリースしたと発表しました。この最新リリースでは、NVIDIAの超並列CUDA対応GPUから最大のパフォーマンスを飛躍的に引き出す複数の重要な新機能をサポートしています。今回リリースされたCUDA Toolkitには、性能の向上とcuda-gdbハードウェア・デバッガへの対応の拡張が含まれています。
CUDA Toolkit 2.3に追加された新しい機能は、次のとおりです。
* CUFFT Libraryは、倍精度変換に対応するようになりました。また、CUFFT Libraryには、単精度変換向けの著しい性能向上も含まれています。詳細については、CUDA Toolkitのリリース・ノートをご覧ください。
* CUDA Toolkitインストーラには、CUDA-GDBハードウェア・デバッガ、およびCUDA Visual Profilerが含まれるようになりました。CUDA-GDBデバッガは、対応するすべてのLinuxディストリビューション向けに利用可能です。(以下を参照)
* SLIグループ内の各GPUは個別に列挙されるようになったため、計算アプリケーションはSLIがグラフィックス向けに有効になっている場合でも、マルチGPUの性能を活用することができます。
* CUDA Toolkitの64ビット・バージョンは、32ビットのアプリケーションのコンパイルに対応するようになりました (詳細については、リリース・ノートをご覧ください。Linux上のLD_LIBRARY_PATHへの変更も含まれます)。
* fp16 <-> fp32変換イントリンシックに新しく対応することにより、fp32での計算を伴うfp16フォーマットのデータを保存できるようになりました。fp16フォーマットの利用は、16ビットの整数より高い数値域を必要とするものの、fp32よりは低精度で、メモリー・スペースと帯域の消費を低減するアプリケーションには理想的です。
* CUDA SDKは以下を含むようにアップデートされました。 * ピッチ・リニア・メモリーから効果的にテクスチャを行う方法を示す新しいpitchLinearTexureコードのサンプル。 * ファイルをロードする代わりに、メモリーからPTXソースをロードするためにcuModuleLoadDataEx()を使用する方法を示す新しいPTXJITコード・サンプル。
* MPEG-2、VC-1、およびH.264のコンテンツをデコードし、ディスプレイ向けにOpenGLもしくはDirect3DにフレームをパスするためにNVCUVIDライブラリを使用する方法を示すWindows向けの二つの新しいコード・サンプル。
* CUDAカーネル関数パラメータを適切にアラインする方法を示すアップデートされたコード・サンプル。同じコードがx32およびx64システムで機能します。
* Visual Profilerは以下の強化された機能を有しています。 * すべてのメモリー・トランスファーAPIコールが報告されるようになりました。 * 各GPUでの複数のコンテキストのプロファイリングへの対応。 * CPU上の要求された開始時間の同期クロック、GPU上のすべてのカーネルの立ち上げとメモリー・トランスファー向けの開始/終了時間用の同期クロック。
* Compute Capability 1.2以上を備えるGPU向けグローバル・メモリーへのロード、および保存効率メトリクス。
* MacOS向けCUDAドライバは、CUDA Toolkitとは別個にパッケージされるようになりました。 * 主要なLinuxディストリビューション、MacOS XおよびWindowsへのサポート * MacOS X6ならびにそれ以降のバージョン(32ビット) * Visual Studio 8(VC2005 SP1)、およびVisual Studio 9 (VC2008)を備えるWindows XP、Windows Vista、Windows 7 * Fedora 10、RHEL 4.7 & 5.3、SLED 10.2 & 11.0、OpenSUSE 11.1、およびUbuntu 8.10 & 9.04
|
| 2009-07-23 19:43:50 |
|
| 0票 |
| 参考 | |
| カテゴリー | |