_mm256_nmsub_pd

更新 : 2011 年 3 月

Visual Studio 2010 SP1 が必要です。

Microsoft 固有の仕様 →

FMA4 YMM 命令 vfnmsubpd を生成して、ソースに対して丸め操作 1 回の倍精度否定積差を実行します。

__m256 _mm256_nmsub_pd (
   __m256 src1,
   __m256 src2,
   __m256 src3
); 

パラメーター

  • [入力] src1
    8 個の 32 ビット浮動小数点値を含む 256 ビットのパラメーター。

  • [入力] src2
    8 個の 32 ビット浮動小数点値を含む 256 ビットのパラメーター。

  • [入力] src3
    8 個の 32 ビット浮動小数点値を含む 256 ビットのパラメーター。

戻り値

8 個の 32 ビット浮動小数点値を含む 256 ビットの結果 r。

r[i] := -(src1[i] * src2[i]) - src3[i];

必要条件

組み込み

アーキテクチャ

_mm256_nmsub_pd

FMA4

ヘッダー ファイル <intrin.h>

解説

src1 の 4 個の各倍精度浮動小数点値と src2 の対応する値が乗算されます。 結果は否定値になり、src3 の対応する値がその値から減算されます。その結果がターゲットの対応する値として格納されます。 各否定積差の実行時には、中間結果が無限の精度で計算されたかのように、最後に丸め操作が 1 回行われます。

vfnmsubpd 命令は、FMA4 ファミリの命令の一部です。 この組み込みを使用する前に、プロセッサでこの命令がサポートされていることを確認してください。 この命令に対するハードウェア サポートを確認するには、InfoType を 0x80000001 にして __cpuid 組み込みを呼び出し、CPUInfo[2] (ECX) のビット 16 をチェックします。 このビットは、命令がサポートされている場合は 1 になり、サポートされていない場合は 0 になります。

使用例

#include <stdio.h>
#include <intrin.h>
int main()
{
    __m256d a, b, c, d;
    int i;
    for (i = 0; i < 4; i++) {
        a.m256d_f64[i] = i;
        b.m256d_f64[i] = 2.;
        c.m256d_f64[i] = 3.;
    }
    d = _mm256_nmsub_pd(a, b, c);
    for (i = 0; i < 4; i++) printf_s(" %.3lf", d.m256d_f64[i]);
    printf_s("\n");
}
  

参照

参照

__cpuid, __cpuidex

その他の技術情報

_mm_nmsub_pd

_mm_nmsub_sd

_mm256_nmsub_ps

_mm256_macc_pd

_mm256_nmacc_pd

_mm256_msub_pd

Visual Studio 2010 SP1 用に追加された FMA4 組み込み

履歴の変更

日付

履歴

理由

2011 年 3 月

このコンテンツを追加。

SP1 機能変更