P_64_PROFILE_REDUCTION(32, { rd += P_SH(ps1, 1) * P_SH(ps2, 1); })