Some small refactorings
Use llvm intrinsics for `vfpclassss` and `vfpclasssd` Use `simd_insert` for `x86_polyfill`
This commit is contained in:
parent
bb2b4293b9
commit
aa001c3f3e
4 changed files with 13 additions and 3417 deletions
|
|
@ -1,764 +0,0 @@
|
|||
<summary>["AVX512BW"]</summary><p>
|
||||
|
||||
* [x] [`_mm512_loadu_epi16`]
|
||||
* [x] [`_mm512_mask_loadu_epi16`] //need i1
|
||||
* [x] [`_mm512_maskz_loadu_epi16`] //need i1
|
||||
* [x] [`_mm_loadu_epi16`]
|
||||
* [x] [`_mm_mask_loadu_epi16`] //need i1
|
||||
* [x] [`_mm_maskz_loadu_epi16`] //need i1
|
||||
* [x] [`_mm256_loadu_epi16`]
|
||||
* [x] [`_mm256_mask_loadu_epi16`] //need i1
|
||||
* [x] [`_mm256_maskz_loadu_epi16`] //need i1
|
||||
* [x] [`_mm512_loadu_epi8`]
|
||||
* [x] [`_mm512_mask_loadu_epi8`] //need i1
|
||||
* [x] [`_mm512_maskz_loadu_epi8`] //need i1
|
||||
* [x] [`_mm_loadu_epi8`]
|
||||
* [x] [`_mm_mask_loadu_epi8`] //need i1
|
||||
* [x] [`_mm_maskz_loadu_epi8`] //need i1
|
||||
* [x] [`_mm256_loadu_epi8`]
|
||||
* [x] [`_mm256_mask_loadu_epi8`] //need i1
|
||||
* [x] [`_mm256_maskz_loadu_epi8`] //need i1
|
||||
* [x] [`_mm512_mask_storeu_epi16`]
|
||||
* [x] [`_mm512_storeu_epi16`]
|
||||
* [x] [`_mm_mask_storeu_epi16`] //need i1
|
||||
* [x] [`_mm_storeu_epi16`]
|
||||
* [x] [`_mm256_mask_storeu_epi16`] //need i1
|
||||
* [x] [`_mm256_storeu_epi16`]
|
||||
* [x] [`_mm512_mask_storeu_epi8`] //need i1
|
||||
* [x] [`_mm512_storeu_epi8`]
|
||||
* [x] [`_mm_mask_storeu_epi8`] //need i1
|
||||
* [x] [`_mm_storeu_epi8`]
|
||||
* [x] [`_mm256_mask_storeu_epi8`] //need i1
|
||||
* [x] [`_mm256_storeu_epi8`]
|
||||
* [x] [`_mm512_abs_epi16`]
|
||||
* [x] [`_mm512_mask_abs_epi16`]
|
||||
* [x] [`_mm512_maskz_abs_epi16`]
|
||||
* [x] [`_mm_mask_abs_epi16`]
|
||||
* [x] [`_mm_maskz_abs_epi16`]
|
||||
* [x] [`_mm256_mask_abs_epi16`]
|
||||
* [x] [`_mm256_maskz_abs_epi16`]
|
||||
* [x] [`_mm512_abs_epi8`]
|
||||
* [x] [`_mm512_mask_abs_epi8`]
|
||||
* [x] [`_mm512_maskz_abs_epi8`]
|
||||
* [x] [`_mm_mask_abs_epi8`]
|
||||
* [x] [`_mm_maskz_abs_epi8`]
|
||||
* [x] [`_mm256_mask_abs_epi8`]
|
||||
* [x] [`_mm256_maskz_abs_epi8`]
|
||||
* [x] [`_mm512_add_epi16`]
|
||||
* [x] [`_mm512_mask_add_epi16`]
|
||||
* [x] [`_mm512_maskz_add_epi16`]
|
||||
* [x] [`_mm_mask_add_epi16`]
|
||||
* [x] [`_mm_maskz_add_epi16`]
|
||||
* [x] [`_mm256_mask_add_epi16`]
|
||||
* [x] [`_mm256_maskz_add_epi16`]
|
||||
* [x] [`_mm512_add_epi8`]
|
||||
* [x] [`_mm512_mask_add_epi8`]
|
||||
* [x] [`_mm512_maskz_add_epi8`]
|
||||
* [x] [`_mm_mask_add_epi8`]
|
||||
* [x] [`_mm_maskz_add_epi8`]
|
||||
* [x] [`_mm256_mask_add_epi8`]
|
||||
* [x] [`_mm256_maskz_add_epi8`]
|
||||
* [x] [`_mm512_adds_epi16`]
|
||||
* [x] [`_mm512_mask_adds_epi16`]
|
||||
* [x] [`_mm512_maskz_adds_epi16`]
|
||||
* [x] [`_mm_mask_adds_epi16`]
|
||||
* [x] [`_mm_maskz_adds_epi16`]
|
||||
* [x] [`_mm256_mask_adds_epi16`]
|
||||
* [x] [`_mm256_maskz_adds_epi16`]
|
||||
* [x] [`_mm512_adds_epi8`]
|
||||
* [x] [`_mm512_mask_adds_epi8`]
|
||||
* [x] [`_mm512_maskz_adds_epi8`]
|
||||
* [x] [`_mm_mask_adds_epi8`]
|
||||
* [x] [`_mm_maskz_adds_epi8`]
|
||||
* [x] [`_mm256_mask_adds_epi8`]
|
||||
* [x] [`_mm256_maskz_adds_epi8`]
|
||||
* [x] [`_mm512_adds_epu16`]
|
||||
* [x] [`_mm512_mask_adds_epu16`]
|
||||
* [x] [`_mm512_maskz_adds_epu16`]
|
||||
* [x] [`_mm_mask_adds_epu16`]
|
||||
* [x] [`_mm_maskz_adds_epu16`]
|
||||
* [x] [`_mm256_mask_adds_epu16`]
|
||||
* [x] [`_mm256_maskz_adds_epu16`]
|
||||
* [x] [`_mm512_adds_epu8`]
|
||||
* [x] [`_mm512_mask_adds_epu8`]
|
||||
* [x] [`_mm512_maskz_adds_epu8`]
|
||||
* [x] [`_mm_mask_adds_epu8`]
|
||||
* [x] [`_mm_maskz_adds_epu8`]
|
||||
* [x] [`_mm256_mask_adds_epu8`]
|
||||
* [x] [`_mm256_maskz_adds_epu8`]
|
||||
* [x] [`_mm512_alignr_epi8`]
|
||||
* [x] [`_mm512_mask_alignr_epi8`]
|
||||
* [x] [`_mm512_maskz_alignr_epi8`]
|
||||
* [x] [`_mm_mask_alignr_epi8`]
|
||||
* [x] [`_mm_maskz_alignr_epi8`]
|
||||
* [x] [`_mm256_mask_alignr_epi8`]
|
||||
* [x] [`_mm256_maskz_alignr_epi8`]
|
||||
* [x] [`_mm512_avg_epu16`]
|
||||
* [x] [`_mm512_mask_avg_epu16`]
|
||||
* [x] [`_mm512_maskz_avg_epu16`]
|
||||
* [x] [`_mm_mask_avg_epu16`]
|
||||
* [x] [`_mm_maskz_avg_epu16`]
|
||||
* [x] [`_mm256_mask_avg_epu16`]
|
||||
* [x] [`_mm256_maskz_avg_epu16`]
|
||||
* [x] [`_mm512_avg_epu8`]
|
||||
* [x] [`_mm512_mask_avg_epu8`]
|
||||
* [x] [`_mm512_maskz_avg_epu8`]
|
||||
* [x] [`_mm_mask_avg_epu8`]
|
||||
* [x] [`_mm_maskz_avg_epu8`]
|
||||
* [x] [`_mm256_mask_avg_epu8`]
|
||||
* [x] [`_mm256_maskz_avg_epu8`]
|
||||
* [x] [`_mm512_mask_blend_epi16`]
|
||||
* [x] [`_mm_mask_blend_epi16`]
|
||||
* [x] [`_mm256_mask_blend_epi16`]
|
||||
* [x] [`_mm512_mask_blend_epi8`]
|
||||
* [x] [`_mm512_broadcastb_epi8`]
|
||||
* [x] [`_mm_mask_blend_epi8`]
|
||||
* [x] [`_mm256_mask_blend_epi8`]
|
||||
* [x] [`_mm512_mask_broadcastb_epi8`]
|
||||
* [x] [`_mm512_maskz_broadcastb_epi8`]
|
||||
* [x] [`_mm_mask_broadcastb_epi8`]
|
||||
* [x] [`_mm_maskz_broadcastb_epi8`]
|
||||
* [x] [`_mm256_mask_broadcastb_epi8`]
|
||||
* [x] [`_mm256_maskz_broadcastb_epi8`]
|
||||
* [x] [`_mm512_broadcastw_epi16`]
|
||||
* [x] [`_mm512_mask_broadcastw_epi16`]
|
||||
* [x] [`_mm512_maskz_broadcastw_epi16`]
|
||||
* [x] [`_mm_mask_broadcastw_epi16`]
|
||||
* [x] [`_mm_maskz_broadcastw_epi16`]
|
||||
* [x] [`_mm256_mask_broadcastw_epi16`]
|
||||
* [x] [`_mm256_maskz_broadcastw_epi16`]
|
||||
* [x] [`_mm512_bslli_epi128`]
|
||||
* [x] [`_mm512_bsrli_epi128`]
|
||||
* [x] [`_mm512_cmp_epi16_mask`]
|
||||
* [x] [`_mm512_mask_cmp_epi16_mask`]
|
||||
* [x] [`_mm_cmp_epi16_mask`]
|
||||
* [x] [`_mm_mask_cmp_epi16_mask`]
|
||||
* [x] [`_mm256_cmp_epi16_mask`]
|
||||
* [x] [`_mm256_mask_cmp_epi16_mask`]
|
||||
* [x] [`_mm512_cmp_epi8_mask`]
|
||||
* [x] [`_mm512_mask_cmp_epi8_mask`]
|
||||
* [x] [`_mm_cmp_epi8_mask`]
|
||||
* [x] [`_mm_mask_cmp_epi8_mask`]
|
||||
* [x] [`_mm256_cmp_epi8_mask`]
|
||||
* [x] [`_mm256_mask_cmp_epi8_mask`]
|
||||
* [x] [`_mm512_cmp_epu16_mask`]
|
||||
* [x] [`_mm512_mask_cmp_epu16_mask`]
|
||||
* [x] [`_mm_cmp_epu16_mask`]
|
||||
* [x] [`_mm_mask_cmp_epu16_mask`]
|
||||
* [x] [`_mm256_cmp_epu16_mask`]
|
||||
* [x] [`_mm256_mask_cmp_epu16_mask`]
|
||||
* [x] [`_mm512_cmp_epu8_mask`]
|
||||
* [x] [`_mm512_mask_cmp_epu8_mask`]
|
||||
* [x] [`_mm_cmp_epu8_mask`]
|
||||
* [x] [`_mm_mask_cmp_epu8_mask`]
|
||||
* [x] [`_mm256_cmp_epu8_mask`]
|
||||
* [x] [`_mm256_mask_cmp_epu8_mask`]
|
||||
* [x] [`_mm512_cmpeq_epi16_mask`]
|
||||
* [x] [`_mm512_mask_cmpeq_epi16_mask`]
|
||||
* [x] [`_mm_cmpeq_epi16_mask`]
|
||||
* [x] [`_mm_mask_cmpeq_epi16_mask`]
|
||||
* [x] [`_mm256_cmpeq_epi16_mask`]
|
||||
* [x] [`_mm256_mask_cmpeq_epi16_mask`]
|
||||
* [x] [`_mm512_cmpeq_epi8_mask`]
|
||||
* [x] [`_mm512_mask_cmpeq_epi8_mask`]
|
||||
* [x] [`_mm_cmpeq_epi8_mask`]
|
||||
* [x] [`_mm_mask_cmpeq_epi8_mask`]
|
||||
* [x] [`_mm256_cmpeq_epi8_mask`]
|
||||
* [x] [`_mm256_mask_cmpeq_epi8_mask`]
|
||||
* [x] [`_mm512_cmpeq_epu16_mask`]
|
||||
* [x] [`_mm512_mask_cmpeq_epu16_mask`]
|
||||
* [x] [`_mm_cmpeq_epu16_mask`]
|
||||
* [x] [`_mm_mask_cmpeq_epu16_mask`]
|
||||
* [x] [`_mm256_cmpeq_epu16_mask`]
|
||||
* [x] [`_mm256_mask_cmpeq_epu16_mask`]
|
||||
* [x] [`_mm512_cmpeq_epu8_mask`]
|
||||
* [x] [`_mm512_mask_cmpeq_epu8_mask`]
|
||||
* [x] [`_mm_cmpeq_epu8_mask`]
|
||||
* [x] [`_mm_mask_cmpeq_epu8_mask`]
|
||||
* [x] [`_mm256_cmpeq_epu8_mask`]
|
||||
* [x] [`_mm256_mask_cmpeq_epu8_mask`]
|
||||
* [x] [`_mm512_cmpge_epi16_mask`]
|
||||
* [x] [`_mm512_mask_cmpge_epi16_mask`]
|
||||
* [x] [`_mm_cmpge_epi16_mask`]
|
||||
* [x] [`_mm_mask_cmpge_epi16_mask`]
|
||||
* [x] [`_mm256_cmpge_epi16_mask`]
|
||||
* [x] [`_mm256_mask_cmpge_epi16_mask`]
|
||||
* [x] [`_mm512_cmpge_epi8_mask`]
|
||||
* [x] [`_mm512_mask_cmpge_epi8_mask`]
|
||||
* [x] [`_mm_cmpge_epi8_mask`]
|
||||
* [x] [`_mm_mask_cmpge_epi8_mask`]
|
||||
* [x] [`_mm256_cmpge_epi8_mask`]
|
||||
* [x] [`_mm256_mask_cmpge_epi8_mask`]
|
||||
* [x] [`_mm512_cmpge_epu16_mask`]
|
||||
* [x] [`_mm512_mask_cmpge_epu16_mask`]
|
||||
* [x] [`_mm_cmpge_epu16_mask`]
|
||||
* [x] [`_mm_mask_cmpge_epu16_mask`]
|
||||
* [x] [`_mm256_cmpge_epu16_mask`]
|
||||
* [x] [`_mm256_mask_cmpge_epu16_mask`]
|
||||
* [x] [`_mm512_cmpge_epu8_mask`]
|
||||
* [x] [`_mm512_mask_cmpge_epu8_mask`]
|
||||
* [x] [`_mm_cmpge_epu8_mask`]
|
||||
* [x] [`_mm_mask_cmpge_epu8_mask`]
|
||||
* [x] [`_mm256_cmpge_epu8_mask`]
|
||||
* [x] [`_mm256_mask_cmpge_epu8_mask`]
|
||||
* [x] [`_mm512_cmpgt_epi16_mask`]
|
||||
* [x] [`_mm512_mask_cmpgt_epi16_mask`]
|
||||
* [x] [`_mm512_cmpgt_epi8_mask`]
|
||||
* [x] [`_mm512_mask_cmpgt_epi8_mask`]
|
||||
* [x] [`_mm_cmpgt_epi8_mask`]
|
||||
* [x] [`_mm_mask_cmpgt_epi8_mask`]
|
||||
* [x] [`_mm256_cmpgt_epi8_mask`]
|
||||
* [x] [`_mm256_mask_cmpgt_epi8_mask`]
|
||||
* [x] [`_mm512_cmpgt_epu16_mask`]
|
||||
* [x] [`_mm512_mask_cmpgt_epu16_mask`]
|
||||
* [x] [`_mm_cmpgt_epu16_mask`]
|
||||
* [x] [`_mm_mask_cmpgt_epu16_mask`]
|
||||
* [x] [`_mm256_cmpgt_epu16_mask`]
|
||||
* [x] [`_mm256_mask_cmpgt_epu16_mask`]
|
||||
* [x] [`_mm512_cmpgt_epu8_mask`]
|
||||
* [x] [`_mm512_mask_cmpgt_epu8_mask`]
|
||||
* [x] [`_mm_cmpgt_epu8_mask`]
|
||||
* [x] [`_mm_mask_cmpgt_epu8_mask`]
|
||||
* [x] [`_mm256_cmpgt_epu8_mask`]
|
||||
* [x] [`_mm256_mask_cmpgt_epu8_mask`]
|
||||
* [x] [`_mm512_cmple_epi16_mask`]
|
||||
* [x] [`_mm512_mask_cmple_epi16_mask`]
|
||||
* [x] [`_mm_cmpgt_epi16_mask`]
|
||||
* [x] [`_mm_mask_cmpgt_epi16_mask`]
|
||||
* [x] [`_mm256_cmpgt_epi16_mask`]
|
||||
* [x] [`_mm256_mask_cmpgt_epi16_mask`]
|
||||
* [x] [`_mm512_cmple_epi8_mask`]
|
||||
* [x] [`_mm512_mask_cmple_epi8_mask`]
|
||||
* [x] [`_mm_cmple_epi8_mask`]
|
||||
* [x] [`_mm_mask_cmple_epi8_mask`]
|
||||
* [x] [`_mm256_cmple_epi8_mask`]
|
||||
* [x] [`_mm256_mask_cmple_epi8_mask`]
|
||||
* [x] [`_mm512_cmple_epu16_mask`]
|
||||
* [x] [`_mm512_mask_cmple_epu16_mask`]
|
||||
* [x] [`_mm_cmple_epu16_mask`]
|
||||
* [x] [`_mm_mask_cmple_epu16_mask`]
|
||||
* [x] [`_mm256_cmple_epu16_mask`]
|
||||
* [x] [`_mm256_mask_cmple_epu16_mask`]
|
||||
* [x] [`_mm512_cmple_epu8_mask`]
|
||||
* [x] [`_mm512_mask_cmple_epu8_mask`]
|
||||
* [x] [`_mm_cmple_epu8_mask`]
|
||||
* [x] [`_mm_mask_cmple_epu8_mask`]
|
||||
* [x] [`_mm256_cmple_epu8_mask`]
|
||||
* [x] [`_mm256_mask_cmple_epu8_mask`]
|
||||
* [x] [`_mm512_cmplt_epi16_mask`]
|
||||
* [x] [`_mm512_mask_cmplt_epi16_mask`]
|
||||
* [x] [`_mm_cmple_epi16_mask`]
|
||||
* [x] [`_mm_mask_cmple_epi16_mask`]
|
||||
* [x] [`_mm256_cmple_epi16_mask`]
|
||||
* [x] [`_mm256_mask_cmple_epi16_mask`]
|
||||
* [x] [`_mm512_cmplt_epi8_mask`]
|
||||
* [x] [`_mm512_mask_cmplt_epi8_mask`]
|
||||
* [x] [`_mm_cmplt_epi8_mask`]
|
||||
* [x] [`_mm_mask_cmplt_epi8_mask`]
|
||||
* [x] [`_mm256_cmplt_epi8_mask`]
|
||||
* [x] [`_mm256_mask_cmplt_epi8_mask`]
|
||||
* [x] [`_mm512_cmplt_epu16_mask`]
|
||||
* [x] [`_mm512_mask_cmplt_epu16_mask`]
|
||||
* [x] [`_mm_cmplt_epu16_mask`]
|
||||
* [x] [`_mm_mask_cmplt_epu16_mask`]
|
||||
* [x] [`_mm256_cmplt_epu16_mask`]
|
||||
* [x] [`_mm256_mask_cmplt_epu16_mask`]
|
||||
* [x] [`_mm512_cmplt_epu8_mask`]
|
||||
* [x] [`_mm512_mask_cmplt_epu8_mask`]
|
||||
* [x] [`_mm_cmplt_epu8_mask`]
|
||||
* [x] [`_mm_mask_cmplt_epu8_mask`]
|
||||
* [x] [`_mm256_cmplt_epu8_mask`]
|
||||
* [x] [`_mm256_mask_cmplt_epu8_mask`]
|
||||
* [x] [`_mm512_cmpneq_epi16_mask`]
|
||||
* [x] [`_mm512_mask_cmpneq_epi16_mask`]
|
||||
* [x] [`_mm_cmpneq_epi16_mask`]
|
||||
* [x] [`_mm_mask_cmpneq_epi16_mask`]
|
||||
* [x] [`_mm256_cmpneq_epi16_mask`]
|
||||
* [x] [`_mm256_mask_cmpneq_epi16_mask`]
|
||||
* [x] [`_mm512_cmpneq_epi8_mask`]
|
||||
* [x] [`_mm512_mask_cmpneq_epi8_mask`]
|
||||
* [x] [`_mm_cmpneq_epi8_mask`]
|
||||
* [x] [`_mm_mask_cmpneq_epi8_mask`]
|
||||
* [x] [`_mm256_cmpneq_epi8_mask`]
|
||||
* [x] [`_mm256_mask_cmpneq_epi8_mask`]
|
||||
* [x] [`_mm512_cmpneq_epu16_mask`]
|
||||
* [x] [`_mm512_mask_cmpneq_epu16_mask`]
|
||||
* [x] [`_mm_cmpneq_epu16_mask`]
|
||||
* [x] [`_mm_mask_cmpneq_epu16_mask`]
|
||||
* [x] [`_mm256_cmpneq_epu16_mask`]
|
||||
* [x] [`_mm256_mask_cmpneq_epu16_mask`]
|
||||
* [x] [`_mm512_cmpneq_epu8_mask`]
|
||||
* [x] [`_mm512_mask_cmpneq_epu8_mask`]
|
||||
* [x] [`_mm_cmpneq_epu8_mask`]
|
||||
* [x] [`_mm_mask_cmpneq_epu8_mask`]
|
||||
* [x] [`_mm256_cmpneq_epu8_mask`]
|
||||
* [x] [`_mm256_mask_cmpneq_epu8_mask`]
|
||||
* [x] [`_mm512_cvtepi16_epi8`]
|
||||
* [x] [`_mm512_mask_cvtepi16_epi8`]
|
||||
* [x] [`_mm512_maskz_cvtepi16_epi8`]
|
||||
* [x] [`_mm512_mask_cvtepi16_storeu_epi8`]
|
||||
* [x] [`_mm_mask_cvtepi16_storeu_epi8`]
|
||||
* [x] [`_mm256_mask_cvtepi16_storeu_epi8`]
|
||||
* [x] [`_mm_cvtepi16_epi8`]
|
||||
* [x] [`_mm_mask_cvtepi16_epi8`]
|
||||
* [x] [`_mm_maskz_cvtepi16_epi8`]
|
||||
* [x] [`_mm256_cvtepi16_epi8`]
|
||||
* [x] [`_mm256_mask_cvtepi16_epi8`]
|
||||
* [x] [`_mm256_maskz_cvtepi16_epi8`]
|
||||
* [x] [`_mm512_cvtepi8_epi16`]
|
||||
* [x] [`_mm512_mask_cvtepi8_epi16`]
|
||||
* [x] [`_mm512_maskz_cvtepi8_epi16`]
|
||||
* [x] [`_mm_mask_cvtepi8_epi16`]
|
||||
* [x] [`_mm_maskz_cvtepi8_epi16`]
|
||||
* [x] [`_mm256_mask_cvtepi8_epi16`]
|
||||
* [x] [`_mm256_maskz_cvtepi8_epi16`]
|
||||
* [x] [`_mm512_cvtsepi16_epi8`]
|
||||
* [x] [`_mm512_mask_cvtsepi16_epi8`]
|
||||
* [x] [`_mm512_maskz_cvtsepi16_epi8`]
|
||||
* [x] [`_mm_cvtsepi16_epi8`]
|
||||
* [x] [`_mm_mask_cvtsepi16_epi8`]
|
||||
* [x] [`_mm_maskz_cvtsepi16_epi8`]
|
||||
* [x] [`_mm256_cvtsepi16_epi8`]
|
||||
* [x] [`_mm256_mask_cvtsepi16_epi8`]
|
||||
* [x] [`_mm256_maskz_cvtsepi16_epi8`]
|
||||
* [x] [`_mm512_mask_cvtsepi16_storeu_epi8`]
|
||||
* [x] [`_mm_mask_cvtsepi16_storeu_epi8`]
|
||||
* [x] [`_mm256_mask_cvtsepi16_storeu_epi8`]
|
||||
* [x] [`_mm512_cvtepu8_epi16`]
|
||||
* [x] [`_mm512_mask_cvtepu8_epi16`]
|
||||
* [x] [`_mm512_maskz_cvtepu8_epi16`]
|
||||
* [x] [`_mm_mask_cvtepu8_epi16`]
|
||||
* [x] [`_mm_maskz_cvtepu8_epi16`]
|
||||
* [x] [`_mm256_mask_cvtepu8_epi16`]
|
||||
* [x] [`_mm256_maskz_cvtepu8_epi16`]
|
||||
* [_] [`_cvtmask32_u32`]
|
||||
* [_] [`_cvtmask64_u64`]
|
||||
* [_] [`_cvtu32_mask32`]
|
||||
* [_] [`_cvtu64_mask64`]
|
||||
* [x] [`_mm512_cvtusepi16_epi8`]
|
||||
* [x] [`_mm512_mask_cvtusepi16_epi8`]
|
||||
* [x] [`_mm512_maskz_cvtusepi16_epi8`]
|
||||
* [x] [`_mm_cvtusepi16_epi8`]
|
||||
* [x] [`_mm_mask_cvtusepi16_epi8`]
|
||||
* [x] [`_mm_maskz_cvtusepi16_epi8`]
|
||||
* [x] [`_mm256_cvtusepi16_epi8`]
|
||||
* [x] [`_mm256_mask_cvtusepi16_epi8`]
|
||||
* [x] [`_mm256_maskz_cvtusepi16_epi8`]
|
||||
* [x] [`_mm512_mask_cvtusepi16_storeu_epi8`]
|
||||
* [x] [`_mm_mask_cvtusepi16_storeu_epi8`]
|
||||
* [x] [`_mm256_mask_cvtusepi16_storeu_epi8`]
|
||||
* [x] [`_mm512_dbsad_epu8`]
|
||||
* [x] [`_mm512_mask_dbsad_epu8`]
|
||||
* [x] [`_mm512_maskz_dbsad_epu8`]
|
||||
* [x] [`_mm_dbsad_epu8`]
|
||||
* [x] [`_mm_mask_dbsad_epu8`]
|
||||
* [x] [`_mm_maskz_dbsad_epu8`]
|
||||
* [x] [`_mm256_dbsad_epu8`]
|
||||
* [x] [`_mm256_mask_dbsad_epu8`]
|
||||
* [x] [`_mm256_maskz_dbsad_epu8`]
|
||||
* [x] [`_kadd_mask32`]
|
||||
* [x] [`_kadd_mask64`]
|
||||
* [x] [`_kand_mask32`]
|
||||
* [x] [`_kand_mask64`]
|
||||
* [x] [`_kandn_mask32`]
|
||||
* [x] [`_kandn_mask64`]
|
||||
* [x] [`_knot_mask32`]
|
||||
* [x] [`_knot_mask64`]
|
||||
* [x] [`_kor_mask32`]
|
||||
* [x] [`_kor_mask64`]
|
||||
* [_] [`_kortest_mask32_u8`]
|
||||
* [_] [`_kortest_mask64_u8`]
|
||||
* [_] [`_kortestc_mask32_u8`]
|
||||
* [_] [`_kortestc_mask64_u8`]
|
||||
* [_] [`_kortestz_mask32_u8`]
|
||||
* [_] [`_kortestz_mask64_u8`]
|
||||
* [_] [`_kshiftli_mask32`]
|
||||
* [_] [`_kshiftli_mask64`]
|
||||
* [_] [`_kshiftri_mask32`]
|
||||
* [_] [`_kshiftri_mask64`]
|
||||
* [_] [`_ktest_mask32_u8`]
|
||||
* [_] [`_ktest_mask64_u8`]
|
||||
* [_] [`_ktestc_mask32_u8`]
|
||||
* [_] [`_ktestc_mask64_u8`]
|
||||
* [_] [`_ktestz_mask32_u8`]
|
||||
* [_] [`_ktestz_mask64_u8`]
|
||||
* [_] [`_mm512_kunpackd`]
|
||||
* [_] [`_mm512_kunpackw`]
|
||||
* [x] [`_kxnor_mask32`]
|
||||
* [x] [`_kxnor_mask64`]
|
||||
* [x] [`_kxor_mask32`]
|
||||
* [x] [`_kxor_mask64`]
|
||||
* [x] [`_load_mask32`]
|
||||
* [x] [`_load_mask64`]
|
||||
* [x] [`_mm512_madd_epi16`]
|
||||
* [x] [`_mm512_mask_madd_epi16`]
|
||||
* [x] [`_mm512_maskz_madd_epi16`]
|
||||
* [x] [`_mm_mask_madd_epi16`]
|
||||
* [x] [`_mm_maskz_madd_epi16`]
|
||||
* [x] [`_mm256_mask_madd_epi16`]
|
||||
* [x] [`_mm256_maskz_madd_epi16`]
|
||||
* [x] [`_mm512_maddubs_epi16`]
|
||||
* [x] [`_mm512_mask_maddubs_epi16`]
|
||||
* [x] [`_mm512_maskz_maddubs_epi16`]
|
||||
* [x] [`_mm_mask_maddubs_epi16`]
|
||||
* [x] [`_mm_maskz_maddubs_epi16`]
|
||||
* [x] [`_mm256_mask_maddubs_epi16`]
|
||||
* [x] [`_mm256_maskz_maddubs_epi16`]
|
||||
* [x] [`_mm512_mask_max_epi16`]
|
||||
* [x] [`_mm512_maskz_max_epi16`]
|
||||
* [x] [`_mm512_max_epi16`]
|
||||
* [x] [`_mm_mask_max_epi16`]
|
||||
* [x] [`_mm_maskz_max_epi16`]
|
||||
* [x] [`_mm256_mask_max_epi16`]
|
||||
* [x] [`_mm256_maskz_max_epi16`]
|
||||
* [x] [`_mm512_mask_max_epi8`]
|
||||
* [x] [`_mm512_maskz_max_epi8`]
|
||||
* [x] [`_mm512_max_epi8`]
|
||||
* [x] [`_mm_mask_max_epi8`]
|
||||
* [x] [`_mm_maskz_max_epi8`]
|
||||
* [x] [`_mm256_mask_max_epi8`]
|
||||
* [x] [`_mm256_maskz_max_epi8`]
|
||||
* [x] [`_mm512_mask_max_epu16`]
|
||||
* [x] [`_mm512_maskz_max_epu16`]
|
||||
* [x] [`_mm512_max_epu16`]
|
||||
* [x] [`_mm_mask_max_epu16`]
|
||||
* [x] [`_mm_maskz_max_epu16`]
|
||||
* [x] [`_mm256_mask_max_epu16`]
|
||||
* [x] [`_mm256_maskz_max_epu16`]
|
||||
* [x] [`_mm512_mask_max_epu8`]
|
||||
* [x] [`_mm512_maskz_max_epu8`]
|
||||
* [x] [`_mm512_max_epu8`]
|
||||
* [x] [`_mm_mask_max_epu8`]
|
||||
* [x] [`_mm_maskz_max_epu8`]
|
||||
* [x] [`_mm256_mask_max_epu8`]
|
||||
* [x] [`_mm256_maskz_max_epu8`]
|
||||
* [x] [`_mm512_mask_min_epi16`]
|
||||
* [x] [`_mm512_maskz_min_epi16`]
|
||||
* [x] [`_mm512_min_epi16`]
|
||||
* [x] [`_mm_mask_min_epi16`]
|
||||
* [x] [`_mm_maskz_min_epi16`]
|
||||
* [x] [`_mm256_mask_min_epi16`]
|
||||
* [x] [`_mm256_maskz_min_epi16`]
|
||||
* [x] [`_mm512_mask_min_epi8`]
|
||||
* [x] [`_mm512_maskz_min_epi8`]
|
||||
* [x] [`_mm512_min_epi8`]
|
||||
* [x] [`_mm_mask_min_epi8`]
|
||||
* [x] [`_mm_maskz_min_epi8`]
|
||||
* [x] [`_mm256_mask_min_epi8`]
|
||||
* [x] [`_mm256_maskz_min_epi8`]
|
||||
* [x] [`_mm512_mask_min_epu16`]
|
||||
* [x] [`_mm512_maskz_min_epu16`]
|
||||
* [x] [`_mm512_min_epu16`]
|
||||
* [x] [`_mm_mask_min_epu16`]
|
||||
* [x] [`_mm_maskz_min_epu16`]
|
||||
* [x] [`_mm256_mask_min_epu16`]
|
||||
* [x] [`_mm256_maskz_min_epu16`]
|
||||
* [x] [`_mm512_mask_min_epu8`]
|
||||
* [x] [`_mm512_maskz_min_epu8`]
|
||||
* [x] [`_mm512_min_epu8`]
|
||||
* [x] [`_mm_mask_min_epu8`]
|
||||
* [x] [`_mm_maskz_min_epu8`]
|
||||
* [x] [`_mm256_mask_min_epu8`]
|
||||
* [x] [`_mm256_maskz_min_epu8`]
|
||||
* [x] [`_mm512_mask_mov_epi16`]
|
||||
* [x] [`_mm512_maskz_mov_epi16`]
|
||||
* [x] [`_mm_mask_mov_epi16`]
|
||||
* [x] [`_mm_maskz_mov_epi16`]
|
||||
* [x] [`_mm256_mask_mov_epi16`]
|
||||
* [x] [`_mm256_maskz_mov_epi16`]
|
||||
* [x] [`_mm512_mask_mov_epi8`]
|
||||
* [x] [`_mm512_maskz_mov_epi8`]
|
||||
* [x] [`_mm_mask_mov_epi8`]
|
||||
* [x] [`_mm_maskz_mov_epi8`]
|
||||
* [x] [`_mm256_mask_mov_epi8`]
|
||||
* [x] [`_mm256_maskz_mov_epi8`]
|
||||
* [x] [`_mm512_movepi16_mask`]
|
||||
* [x] [`_mm_movepi16_mask`]
|
||||
* [x] [`_mm256_movepi16_mask`]
|
||||
* [x] [`_mm512_movepi8_mask`]
|
||||
* [x] [`_mm_movepi8_mask`]
|
||||
* [x] [`_mm256_movepi8_mask`]
|
||||
* [x] [`_mm512_movm_epi16`]
|
||||
* [x] [`_mm_movm_epi16`]
|
||||
* [x] [`_mm256_movm_epi16`]
|
||||
* [x] [`_mm512_movm_epi8`]
|
||||
* [x] [`_mm_movm_epi8`]
|
||||
* [x] [`_mm256_movm_epi8`]
|
||||
* [x] [`_mm512_mask_mulhi_epi16`]
|
||||
* [x] [`_mm512_maskz_mulhi_epi16`]
|
||||
* [x] [`_mm512_mulhi_epi16`]
|
||||
* [x] [`_mm512_mask_mulhi_epu16`]
|
||||
* [x] [`_mm512_maskz_mulhi_epu16`]
|
||||
* [x] [`_mm_mask_mulhi_epi16`]
|
||||
* [x] [`_mm_maskz_mulhi_epi16`]
|
||||
* [x] [`_mm256_mask_mulhi_epi16`]
|
||||
* [x] [`_mm256_maskz_mulhi_epi16`]
|
||||
* [x] [`_mm512_mulhi_epu16`]
|
||||
* [x] [`_mm_mask_mulhi_epu16`]
|
||||
* [x] [`_mm_maskz_mulhi_epu16`]
|
||||
* [x] [`_mm256_mask_mulhi_epu16`]
|
||||
* [x] [`_mm256_maskz_mulhi_epu16`]
|
||||
* [x] [`_mm512_mask_mulhrs_epi16`]
|
||||
* [x] [`_mm512_maskz_mulhrs_epi16`]
|
||||
* [x] [`_mm512_mulhrs_epi16`]
|
||||
* [x] [`_mm_mask_mulhrs_epi16`]
|
||||
* [x] [`_mm_maskz_mulhrs_epi16`]
|
||||
* [x] [`_mm256_mask_mulhrs_epi16`]
|
||||
* [x] [`_mm256_maskz_mulhrs_epi16`]
|
||||
* [x] [`_mm512_mask_mullo_epi16`]
|
||||
* [x] [`_mm512_maskz_mullo_epi16`]
|
||||
* [x] [`_mm512_mullo_epi16`]
|
||||
* [x] [`_mm_mask_mullo_epi16`]
|
||||
* [x] [`_mm_maskz_mullo_epi16`]
|
||||
* [x] [`_mm256_mask_mullo_epi16`]
|
||||
* [x] [`_mm256_maskz_mullo_epi16`]
|
||||
* [x] [`_mm512_mask_packs_epi16`]
|
||||
* [x] [`_mm512_maskz_packs_epi16`]
|
||||
* [x] [`_mm512_packs_epi16`]
|
||||
* [x] [`_mm_mask_packs_epi16`]
|
||||
* [x] [`_mm_maskz_packs_epi16`]
|
||||
* [x] [`_mm256_mask_packs_epi16`]
|
||||
* [x] [`_mm256_maskz_packs_epi16`]
|
||||
* [x] [`_mm512_mask_packs_epi32`]
|
||||
* [x] [`_mm512_maskz_packs_epi32`]
|
||||
* [x] [`_mm512_packs_epi32`]
|
||||
* [x] [`_mm_mask_packs_epi32`]
|
||||
* [x] [`_mm_maskz_packs_epi32`]
|
||||
* [x] [`_mm256_mask_packs_epi32`]
|
||||
* [x] [`_mm256_maskz_packs_epi32`]
|
||||
* [x] [`_mm512_mask_packus_epi16`]
|
||||
* [x] [`_mm512_maskz_packus_epi16`]
|
||||
* [x] [`_mm512_packus_epi16`]
|
||||
* [x] [`_mm_mask_packus_epi16`]
|
||||
* [x] [`_mm_maskz_packus_epi16`]
|
||||
* [x] [`_mm256_mask_packus_epi16`]
|
||||
* [x] [`_mm256_maskz_packus_epi16`]
|
||||
* [x] [`_mm512_mask_packus_epi32`]
|
||||
* [x] [`_mm512_maskz_packus_epi32`]
|
||||
* [x] [`_mm512_packus_epi32`]
|
||||
* [x] [`_mm_mask_packus_epi32`]
|
||||
* [x] [`_mm_maskz_packus_epi32`]
|
||||
* [x] [`_mm256_mask_packus_epi32`]
|
||||
* [x] [`_mm256_maskz_packus_epi32`]
|
||||
* [x] [`_mm512_mask_permutex2var_epi16`]
|
||||
* [x] [`_mm512_mask2_permutex2var_epi16`]
|
||||
* [x] [`_mm512_maskz_permutex2var_epi16`]
|
||||
* [x] [`_mm512_permutex2var_epi16`]
|
||||
* [x] [`_mm_mask_permutex2var_epi16`]
|
||||
* [x] [`_mm_mask2_permutex2var_epi16`]
|
||||
* [x] [`_mm_maskz_permutex2var_epi16`]
|
||||
* [x] [`_mm_permutex2var_epi16`]
|
||||
* [x] [`_mm256_mask_permutex2var_epi16`]
|
||||
* [x] [`_mm256_mask2_permutex2var_epi16`]
|
||||
* [x] [`_mm256_maskz_permutex2var_epi16`]
|
||||
* [x] [`_mm256_permutex2var_epi16`]
|
||||
* [x] [`_mm512_mask_permutexvar_epi16`]
|
||||
* [x] [`_mm512_maskz_permutexvar_epi16`]
|
||||
* [x] [`_mm512_permutexvar_epi16`]
|
||||
* [x] [`_mm_mask_permutexvar_epi16`]
|
||||
* [x] [`_mm_maskz_permutexvar_epi16`]
|
||||
* [x] [`_mm_permutexvar_epi16`]
|
||||
* [x] [`_mm256_mask_permutexvar_epi16`]
|
||||
* [x] [`_mm256_maskz_permutexvar_epi16`]
|
||||
* [x] [`_mm256_permutexvar_epi16`]
|
||||
* [x] [`_mm512_sad_epu8`]
|
||||
* [x] [`_mm512_mask_set1_epi16`]
|
||||
* [x] [`_mm512_maskz_set1_epi16`]
|
||||
* [x] [`_mm_mask_set1_epi16`]
|
||||
* [x] [`_mm_maskz_set1_epi16`]
|
||||
* [x] [`_mm256_mask_set1_epi16`]
|
||||
* [x] [`_mm256_maskz_set1_epi16`]
|
||||
* [x] [`_mm512_mask_set1_epi8`]
|
||||
* [x] [`_mm512_maskz_set1_epi8`]
|
||||
* [x] [`_mm_mask_set1_epi8`]
|
||||
* [x] [`_mm_maskz_set1_epi8`]
|
||||
* [x] [`_mm256_mask_set1_epi8`]
|
||||
* [x] [`_mm256_maskz_set1_epi8`]
|
||||
* [x] [`_mm512_mask_shuffle_epi8`]
|
||||
* [x] [`_mm512_maskz_shuffle_epi8`]
|
||||
* [x] [`_mm512_shuffle_epi8`]
|
||||
* [x] [`_mm_mask_shuffle_epi8`]
|
||||
* [x] [`_mm_maskz_shuffle_epi8`]
|
||||
* [x] [`_mm256_mask_shuffle_epi8`]
|
||||
* [x] [`_mm256_maskz_shuffle_epi8`]
|
||||
* [x] [`_mm512_mask_shufflehi_epi16`]
|
||||
* [x] [`_mm512_maskz_shufflehi_epi16`]
|
||||
* [x] [`_mm512_shufflehi_epi16`]
|
||||
* [x] [`_mm_mask_shufflehi_epi16`]
|
||||
* [x] [`_mm_maskz_shufflehi_epi16`]
|
||||
* [x] [`_mm256_mask_shufflehi_epi16`]
|
||||
* [x] [`_mm256_maskz_shufflehi_epi16`]
|
||||
* [x] [`_mm512_mask_shufflelo_epi16`]
|
||||
* [x] [`_mm512_maskz_shufflelo_epi16`]
|
||||
* [x] [`_mm512_shufflelo_epi16`]
|
||||
* [x] [`_mm_mask_shufflelo_epi16`]
|
||||
* [x] [`_mm_maskz_shufflelo_epi16`]
|
||||
* [x] [`_mm256_mask_shufflelo_epi16`]
|
||||
* [x] [`_mm256_maskz_shufflelo_epi16`]
|
||||
* [x] [`_mm512_mask_sll_epi16`]
|
||||
* [x] [`_mm512_maskz_sll_epi16`]
|
||||
* [x] [`_mm512_sll_epi16`]
|
||||
* [x] [`_mm_mask_sll_epi16`]
|
||||
* [x] [`_mm_maskz_sll_epi16`]
|
||||
* [x] [`_mm256_mask_sll_epi16`]
|
||||
* [x] [`_mm256_maskz_sll_epi16`]
|
||||
* [x] [`_mm512_mask_slli_epi16`]
|
||||
* [x] [`_mm512_maskz_slli_epi16`]
|
||||
* [x] [`_mm512_slli_epi16`]
|
||||
* [x] [`_mm_mask_slli_epi16
|
||||
* [x] [`_mm_maskz_slli_epi16
|
||||
* [x] [`_mm256_mask_slli_epi16
|
||||
* [x] [`_mm256_maskz_slli_epi16
|
||||
* [x] [`_mm512_mask_sllv_epi16`]
|
||||
* [x] [`_mm512_maskz_sllv_epi16`]
|
||||
* [x] [`_mm512_sllv_epi16`]
|
||||
* [x] [`_mm_mask_sllv_epi16`]
|
||||
* [x] [`_mm_maskz_sllv_epi16`]
|
||||
* [x] [`_mm_sllv_epi16`]
|
||||
* [x] [`_mm256_mask_sllv_epi16`]
|
||||
* [x] [`_mm256_maskz_sllv_epi16`]
|
||||
* [x] [`_mm256_sllv_epi16`]
|
||||
* [x] [`_mm512_mask_sra_epi16`]
|
||||
* [x] [`_mm512_maskz_sra_epi16`]
|
||||
* [x] [`_mm512_sra_epi16`]
|
||||
* [x] [`_mm_mask_sra_epi16`]
|
||||
* [x] [`_mm_maskz_sra_epi16`]
|
||||
* [x] [`_mm256_mask_sra_epi16`]
|
||||
* [x] [`_mm256_maskz_sra_epi16`]
|
||||
* [x] [`_mm512_mask_srai_epi16`]
|
||||
* [x] [`_mm512_maskz_srai_epi16`]
|
||||
* [x] [`_mm512_srai_epi16`]
|
||||
* [x] [`_mm_mask_srai_epi16`]
|
||||
* [x] [`_mm_maskz_srai_epi16`]
|
||||
* [x] [`_mm256_mask_srai_epi16`]
|
||||
* [x] [`_mm256_maskz_srai_epi16`]
|
||||
* [x] [`_mm512_mask_srav_epi16`]
|
||||
* [x] [`_mm512_maskz_srav_epi16`]
|
||||
* [x] [`_mm512_srav_epi16`]
|
||||
* [x] [`_mm_mask_srav_epi16`]
|
||||
* [x] [`_mm_maskz_srav_epi16`]
|
||||
* [x] [`_mm_srav_epi16`]
|
||||
* [x] [`_mm256_mask_srav_epi16`]
|
||||
* [x] [`_mm256_maskz_srav_epi16`]
|
||||
* [x] [`_mm256_srav_epi16`]
|
||||
* [x] [`_mm512_mask_srl_epi16`]
|
||||
* [x] [`_mm512_maskz_srl_epi16`]
|
||||
* [x] [`_mm512_srl_epi16`]
|
||||
* [x] [`_mm_mask_srl_epi16`]
|
||||
* [x] [`_mm_maskz_srl_epi16`]
|
||||
* [x] [`_mm256_mask_srl_epi16`]
|
||||
* [x] [`_mm256_maskz_srl_epi16`]
|
||||
* [x] [`_mm512_mask_srli_epi16`]
|
||||
* [x] [`_mm512_maskz_srli_epi16`]
|
||||
* [x] [`_mm512_srli_epi16`]
|
||||
* [x] [`_mm_mask_srli_epi16`]
|
||||
* [x] [`_mm_maskz_srli_epi16`]
|
||||
* [x] [`_mm256_mask_srli_epi16`]
|
||||
* [x] [`_mm256_maskz_srli_epi16`]
|
||||
* [x] [`_mm512_mask_srlv_epi16`]
|
||||
* [x] [`_mm512_maskz_srlv_epi16`]
|
||||
* [x] [`_mm512_srlv_epi16`]
|
||||
* [x] [`_mm_mask_srlv_epi16`]
|
||||
* [x] [`_mm_maskz_srlv_epi16`]
|
||||
* [x] [`_mm_srlv_epi16`]
|
||||
* [x] [`_mm256_mask_srlv_epi16`]
|
||||
* [x] [`_mm256_maskz_srlv_epi16`]
|
||||
* [x] [`_mm256_srlv_epi16`]
|
||||
* [x] [`_store_mask32`]
|
||||
* [x] [`_store_mask64`]
|
||||
* [x] [`_mm512_mask_sub_epi16`]
|
||||
* [x] [`_mm512_maskz_sub_epi16`]
|
||||
* [x] [`_mm512_sub_epi16`]
|
||||
* [x] [`_mm_mask_sub_epi16`]
|
||||
* [x] [`_mm_maskz_sub_epi16`]
|
||||
* [x] [`_mm256_mask_sub_epi16`]
|
||||
* [x] [`_mm256_maskz_sub_epi16`]
|
||||
* [x] [`_mm512_mask_sub_epi8`]
|
||||
* [x] [`_mm512_maskz_sub_epi8`]
|
||||
* [x] [`_mm_mask_sub_epi8`]
|
||||
* [x] [`_mm_maskz_sub_epi8`]
|
||||
* [x] [`_mm256_mask_sub_epi8`]
|
||||
* [x] [`_mm256_maskz_sub_epi8`]
|
||||
* [x] [`_mm512_sub_epi8`]
|
||||
* [x] [`_mm512_mask_subs_epi16`]
|
||||
* [x] [`_mm512_maskz_subs_epi16`]
|
||||
* [x] [`_mm512_subs_epi16`]
|
||||
* [x] [`_mm_mask_subs_epi16`]
|
||||
* [x] [`_mm_maskz_subs_epi16`]
|
||||
* [x] [`_mm256_mask_subs_epi16`]
|
||||
* [x] [`_mm256_maskz_subs_epi16`]
|
||||
* [x] [`_mm512_mask_subs_epi8`]
|
||||
* [x] [`_mm512_maskz_subs_epi8`]
|
||||
* [x] [`_mm512_subs_epi8`]
|
||||
* [x] [`_mm_mask_subs_epi8`]
|
||||
* [x] [`_mm_maskz_subs_epi8`]
|
||||
* [x] [`_mm256_mask_subs_epi8`]
|
||||
* [x] [`_mm256_maskz_subs_epi8`]
|
||||
* [x] [`_mm512_mask_subs_epu16`]
|
||||
* [x] [`_mm512_maskz_subs_epu16`]
|
||||
* [x] [`_mm512_subs_epu16`]
|
||||
* [x] [`_mm_mask_subs_epu16`]
|
||||
* [x] [`_mm_maskz_subs_epu16`]
|
||||
* [x] [`_mm256_mask_subs_epu16`]
|
||||
* [x] [`_mm256_maskz_subs_epu16`]
|
||||
* [x] [`_mm512_mask_subs_epu8`]
|
||||
* [x] [`_mm512_maskz_subs_epu8`]
|
||||
* [x] [`_mm512_subs_epu8`]
|
||||
* [x] [`_mm_mask_subs_epu8`]
|
||||
* [x] [`_mm_maskz_subs_epu8`]
|
||||
* [x] [`_mm256_mask_subs_epu8`]
|
||||
* [x] [`_mm256_maskz_subs_epu8`]
|
||||
* [x] [`_mm512_mask_test_epi16_mask`]
|
||||
* [x] [`_mm512_test_epi16_mask`]
|
||||
* [x] [`_mm_mask_test_epi16_mask`]
|
||||
* [x] [`_mm_test_epi16_mask`]
|
||||
* [x] [`_mm256_mask_test_epi16_mask`]
|
||||
* [x] [`_mm256_test_epi16_mask`]
|
||||
* [x] [`_mm512_mask_test_epi8_mask`]
|
||||
* [x] [`_mm512_test_epi8_mask`]
|
||||
* [x] [`_mm_mask_test_epi8_mask`]
|
||||
* [x] [`_mm_test_epi8_mask`]
|
||||
* [x] [`_mm256_mask_test_epi8_mask`]
|
||||
* [x] [`_mm256_test_epi8_mask`]
|
||||
* [x] [`_mm512_mask_testn_epi16_mask`]
|
||||
* [x] [`_mm512_testn_epi16_mask`]
|
||||
* [x] [`_mm_mask_testn_epi16_mask`]
|
||||
* [x] [`_mm_testn_epi16_mask`]
|
||||
* [x] [`_mm256_mask_testn_epi16_mask`]
|
||||
* [x] [`_mm256_testn_epi16_mask`]
|
||||
* [x] [`_mm512_mask_testn_epi8_mask`]
|
||||
* [x] [`_mm512_testn_epi8_mask`]
|
||||
* [x] [`_mm_mask_testn_epi8_mask`]
|
||||
* [x] [`_mm_testn_epi8_mask`]
|
||||
* [x] [`_mm256_mask_testn_epi8_mask`]
|
||||
* [x] [`_mm256_testn_epi8_mask`]
|
||||
* [x] [`_mm512_mask_unpackhi_epi16`]
|
||||
* [x] [`_mm512_maskz_unpackhi_epi16`]
|
||||
* [x] [`_mm512_unpackhi_epi16`]
|
||||
* [x] [`_mm_mask_unpackhi_epi16`]
|
||||
* [x] [`_mm_maskz_unpackhi_epi16`]
|
||||
* [x] [`_mm256_mask_unpackhi_epi16`]
|
||||
* [x] [`_mm256_maskz_unpackhi_epi16`]
|
||||
* [x] [`_mm512_mask_unpackhi_epi8`]
|
||||
* [x] [`_mm512_maskz_unpackhi_epi8`]
|
||||
* [x] [`_mm512_unpackhi_epi8`]
|
||||
* [x] [`_mm_mask_unpackhi_epi8`]
|
||||
* [x] [`_mm_maskz_unpackhi_epi8`]
|
||||
* [x] [`_mm256_mask_unpackhi_epi8`]
|
||||
* [x] [`_mm256_maskz_unpackhi_epi8`]
|
||||
* [x] [`_mm512_mask_unpacklo_epi16`]
|
||||
* [x] [`_mm512_maskz_unpacklo_epi16`]
|
||||
* [x] [`_mm512_unpacklo_epi16`]
|
||||
* [x] [`_mm_mask_unpacklo_epi16`]
|
||||
* [x] [`_mm_maskz_unpacklo_epi16`]
|
||||
* [x] [`_mm256_mask_unpacklo_epi16`]
|
||||
* [x] [`_mm256_maskz_unpacklo_epi16`]
|
||||
* [x] [`_mm512_mask_unpacklo_epi8`]
|
||||
* [x] [`_mm512_maskz_unpacklo_epi8`]
|
||||
* [x] [`_mm512_unpacklo_epi8`]
|
||||
* [x] [`_mm_mask_unpacklo_epi8`]
|
||||
* [x] [`_mm_maskz_unpacklo_epi8`]
|
||||
* [x] [`_mm256_mask_unpacklo_epi8`]
|
||||
* [x] [`_mm256_maskz_unpacklo_epi8`]
|
||||
|
||||
</p>
|
||||
File diff suppressed because it is too large
Load diff
|
|
@ -6751,7 +6751,7 @@ pub unsafe fn _mm512_mask_fpclass_ps_mask<const IMM8: i32>(k1: __mmask16, a: __m
|
|||
#[unstable(feature = "stdarch_x86_avx512", issue = "111137")]
|
||||
pub unsafe fn _mm_fpclass_sd_mask<const IMM8: i32>(a: __m128d) -> __mmask8 {
|
||||
static_assert_uimm_bits!(IMM8, 8);
|
||||
fpclass_asm!("vfpclasssd", __mmask8, xmm_reg, a)
|
||||
_mm_mask_fpclass_sd_mask::<IMM8>(0xff, a)
|
||||
}
|
||||
|
||||
/// Test the lower double-precision (64-bit) floating-point element in a for special categories specified
|
||||
|
|
@ -6776,7 +6776,7 @@ pub unsafe fn _mm_fpclass_sd_mask<const IMM8: i32>(a: __m128d) -> __mmask8 {
|
|||
#[unstable(feature = "stdarch_x86_avx512", issue = "111137")]
|
||||
pub unsafe fn _mm_mask_fpclass_sd_mask<const IMM8: i32>(k1: __mmask8, a: __m128d) -> __mmask8 {
|
||||
static_assert_uimm_bits!(IMM8, 8);
|
||||
fpclass_asm!("vfpclasssd", __mmask8, k1, xmm_reg, a)
|
||||
vfpclasssd(a.as_f64x2(), IMM8, k1)
|
||||
}
|
||||
|
||||
/// Test the lower single-precision (32-bit) floating-point element in a for special categories specified
|
||||
|
|
@ -6800,7 +6800,7 @@ pub unsafe fn _mm_mask_fpclass_sd_mask<const IMM8: i32>(k1: __mmask8, a: __m128d
|
|||
#[unstable(feature = "stdarch_x86_avx512", issue = "111137")]
|
||||
pub unsafe fn _mm_fpclass_ss_mask<const IMM8: i32>(a: __m128) -> __mmask8 {
|
||||
static_assert_uimm_bits!(IMM8, 8);
|
||||
fpclass_asm!("vfpclassss", __mmask8, xmm_reg, a)
|
||||
_mm_mask_fpclass_ss_mask::<IMM8>(0xff, a)
|
||||
}
|
||||
|
||||
/// Test the lower single-precision (32-bit) floating-point element in a for special categories specified
|
||||
|
|
@ -6825,7 +6825,7 @@ pub unsafe fn _mm_fpclass_ss_mask<const IMM8: i32>(a: __m128) -> __mmask8 {
|
|||
#[unstable(feature = "stdarch_x86_avx512", issue = "111137")]
|
||||
pub unsafe fn _mm_mask_fpclass_ss_mask<const IMM8: i32>(k1: __mmask8, a: __m128) -> __mmask8 {
|
||||
static_assert_uimm_bits!(IMM8, 8);
|
||||
fpclass_asm!("vfpclassss", __mmask8, k1, xmm_reg, a)
|
||||
vfpclassss(a.as_f32x4(), IMM8, k1)
|
||||
}
|
||||
|
||||
#[allow(improper_ctypes)]
|
||||
|
|
@ -6952,6 +6952,11 @@ extern "C" {
|
|||
fn vreducesd(a: f64x2, b: f64x2, src: f64x2, k: __mmask8, imm8: i32, sae: i32) -> f64x2;
|
||||
#[link_name = "llvm.x86.avx512.mask.reduce.ss"]
|
||||
fn vreducess(a: f32x4, b: f32x4, src: f32x4, k: __mmask8, imm8: i32, sae: i32) -> f32x4;
|
||||
|
||||
#[link_name = "llvm.x86.avx512.mask.fpclass.sd"]
|
||||
fn vfpclasssd(a: f64x2, imm8: i32, k: __mmask8) -> __mmask8;
|
||||
#[link_name = "llvm.x86.avx512.mask.fpclass.ss"]
|
||||
fn vfpclassss(a: f32x4, imm8: i32, k: __mmask8) -> __mmask8;
|
||||
}
|
||||
|
||||
#[cfg(test)]
|
||||
|
|
|
|||
|
|
@ -97,34 +97,22 @@ pub unsafe fn get_m512i(a: __m512i, idx: usize) -> i64 {
|
|||
#[cfg(target_arch = "x86")]
|
||||
mod x86_polyfill {
|
||||
use crate::core_arch::x86::*;
|
||||
use crate::intrinsics::simd::*;
|
||||
|
||||
#[rustc_legacy_const_generics(2)]
|
||||
pub unsafe fn _mm_insert_epi64<const INDEX: i32>(a: __m128i, val: i64) -> __m128i {
|
||||
static_assert_uimm_bits!(INDEX, 1);
|
||||
#[repr(C)]
|
||||
union A {
|
||||
a: __m128i,
|
||||
b: [i64; 2],
|
||||
}
|
||||
let mut a = A { a };
|
||||
a.b[INDEX as usize] = val;
|
||||
a.a
|
||||
transmute(simd_insert!(a.as_i64x2(), INDEX as u32, val))
|
||||
}
|
||||
|
||||
#[target_feature(enable = "avx2")]
|
||||
#[rustc_legacy_const_generics(2)]
|
||||
pub unsafe fn _mm256_insert_epi64<const INDEX: i32>(a: __m256i, val: i64) -> __m256i {
|
||||
static_assert_uimm_bits!(INDEX, 2);
|
||||
#[repr(C)]
|
||||
union A {
|
||||
a: __m256i,
|
||||
b: [i64; 4],
|
||||
}
|
||||
let mut a = A { a };
|
||||
a.b[INDEX as usize] = val;
|
||||
a.a
|
||||
transmute(simd_insert!(a.as_i64x4(), INDEX as u32, val))
|
||||
}
|
||||
}
|
||||
|
||||
#[cfg(target_arch = "x86_64")]
|
||||
mod x86_polyfill {
|
||||
pub use crate::core_arch::x86_64::{_mm256_insert_epi64, _mm_insert_epi64};
|
||||
|
|
|
|||
Loading…
Add table
Add a link
Reference in a new issue