This commit is contained in:
minybot 2020-12-25 16:27:57 -05:00 committed by GitHub
parent 111adc8ac0
commit 448a5d481d
No known key found for this signature in database
GPG key ID: 4AEE18F83AFDEB23
2 changed files with 4543 additions and 46 deletions

View file

@ -1,5 +1,35 @@
<summary>["AVX512BW"]</summary><p>
* [x] [`_mm512_loadu_epi16`]
* [_] [`_mm512_mask_loadu_epi16`]
* [_] [`_mm512_maskz_loadu_epi16`]
* [x] [`_mm_loadu_epi16`]
* [_] [`_mm_mask_loadu_epi16`]
* [_] [`_mm_maskz_loadu_epi16`]
* [x] [`_mm256_loadu_epi16`]
* [_] [`_mm256_mask_loadu_epi16`]
* [_] [`_mm256_maskz_loadu_epi16`]
* [x] [`_mm512_loadu_epi8`]
* [_] [`_mm512_mask_loadu_epi8`]
* [_] [`_mm512_maskz_loadu_epi8`]
* [x] [`_mm_loadu_epi8`]
* [_] [`_mm_mask_loadu_epi8`]
* [_] [`_mm_maskz_loadu_epi8`]
* [x] [`_mm256_loadu_epi8`]
* [_] [`_mm256_mask_loadu_epi8`]
* [_] [`_mm256_maskz_loadu_epi8`]
* [_] [`_mm512_mask_storeu_epi16`]
* [x] [`_mm512_storeu_epi16`]
* [_] [`_mm_mask_storeu_epi16`]
* [x] [`_mm_storeu_epi16`]
* [_] [`_mm256_mask_storeu_epi16`]
* [x] [`_mm256_storeu_epi16`]
* [_] [`_mm512_mask_storeu_epi8`]
* [x] [`_mm512_storeu_epi8`]
* [_] [`_mm_mask_storeu_epi8`]
* [x] [`_mm_storeu_epi8`]
* [_] [`_mm256_mask_storeu_epi8`]
* [x] [`_mm256_storeu_epi8`]
* [x] [`_mm512_abs_epi16`]
* [x] [`_mm512_mask_abs_epi16`]
* [x] [`_mm512_maskz_abs_epi16`]
@ -59,6 +89,10 @@
* [x] [`_mm512_alignr_epi8`]
* [x] [`_mm512_mask_alignr_epi8`]
* [x] [`_mm512_maskz_alignr_epi8`]
* [x] [`_mm_mask_alignr_epi8`]
* [x] [`_mm_maskz_alignr_epi8`]
* [x] [`_mm256_mask_alignr_epi8`]
* [x] [`_mm256_maskz_alignr_epi8`]
* [x] [`_mm512_avg_epu16`]
* [x] [`_mm512_mask_avg_epu16`]
* [x] [`_mm512_maskz_avg_epu16`]
@ -97,85 +131,231 @@
* [x] [`_mm512_bsrli_epi128`]
* [x] [`_mm512_cmp_epi16_mask`]
* [x] [`_mm512_mask_cmp_epi16_mask`]
* [x] [`_mm_cmp_epi16_mask`]
* [x] [`_mm_mask_cmp_epi16_mask`]
* [x] [`_mm256_cmp_epi16_mask`]
* [x] [`_mm256_mask_cmp_epi16_mask`]
* [x] [`_mm512_cmp_epi8_mask`]
* [x] [`_mm512_mask_cmp_epi8_mask`]
* [x] [`_mm_cmp_epi8_mask`]
* [x] [`_mm_mask_cmp_epi8_mask`]
* [x] [`_mm256_cmp_epi8_mask`]
* [x] [`_mm256_mask_cmp_epi8_mask`]
* [x] [`_mm512_cmp_epu16_mask`]
* [x] [`_mm512_mask_cmp_epu16_mask`]
* [x] [`_mm_cmp_epu16_mask`]
* [x] [`_mm_mask_cmp_epu16_mask`]
* [x] [`_mm256_cmp_epu16_mask`]
* [x] [`_mm256_mask_cmp_epu16_mask`]
* [x] [`_mm512_cmp_epu8_mask`]
* [x] [`_mm512_mask_cmp_epu8_mask`]
* [x] [`_mm_cmp_epu8_mask`]
* [x] [`_mm_mask_cmp_epu8_mask`]
* [x] [`_mm256_cmp_epu8_mask`]
* [x] [`_mm256_mask_cmp_epu8_mask`]
* [x] [`_mm512_cmpeq_epi16_mask`]
* [x] [`_mm512_mask_cmpeq_epi16_mask`]
* [x] [`_mm_cmpeq_epi16_mask`]
* [x] [`_mm_mask_cmpeq_epi16_mask`]
* [x] [`_mm256_cmpeq_epi16_mask`]
* [x] [`_mm256_mask_cmpeq_epi16_mask`]
* [x] [`_mm512_cmpeq_epi8_mask`]
* [x] [`_mm512_mask_cmpeq_epi8_mask`]
* [x] [`_mm_cmpeq_epi8_mask`]
* [x] [`_mm_mask_cmpeq_epi8_mask`]
* [x] [`_mm256_cmpeq_epi8_mask`]
* [x] [`_mm256_mask_cmpeq_epi8_mask`]
* [x] [`_mm512_cmpeq_epu16_mask`]
* [x] [`_mm512_mask_cmpeq_epu16_mask`]
* [x] [`_mm_cmpeq_epu16_mask`]
* [x] [`_mm_mask_cmpeq_epu16_mask`]
* [x] [`_mm256_cmpeq_epu16_mask`]
* [x] [`_mm256_mask_cmpeq_epu16_mask`]
* [x] [`_mm512_cmpeq_epu8_mask`]
* [x] [`_mm512_mask_cmpeq_epu8_mask`]
* [x] [`_mm_cmpeq_epu8_mask`]
* [x] [`_mm_mask_cmpeq_epu8_mask`]
* [x] [`_mm256_cmpeq_epu8_mask`]
* [x] [`_mm256_mask_cmpeq_epu8_mask`]
* [x] [`_mm512_cmpge_epi16_mask`]
* [x] [`_mm512_mask_cmpge_epi16_mask`]
* [x] [`_mm_cmpge_epi16_mask`]
* [x] [`_mm_mask_cmpge_epi16_mask`]
* [x] [`_mm256_cmpge_epi16_mask`]
* [x] [`_mm256_mask_cmpge_epi16_mask`]
* [x] [`_mm512_cmpge_epi8_mask`]
* [x] [`_mm512_mask_cmpge_epi8_mask`]
* [x] [`_mm_cmpge_epi8_mask`]
* [x] [`_mm_mask_cmpge_epi8_mask`]
* [x] [`_mm256_cmpge_epi8_mask`]
* [x] [`_mm256_mask_cmpge_epi8_mask`]
* [x] [`_mm512_cmpge_epu16_mask`]
* [x] [`_mm512_mask_cmpge_epu16_mask`]
* [x] [`_mm_cmpge_epu16_mask`]
* [x] [`_mm_mask_cmpge_epu16_mask`]
* [x] [`_mm256_cmpge_epu16_mask`]
* [x] [`_mm256_mask_cmpge_epu16_mask`]
* [x] [`_mm512_cmpge_epu8_mask`]
* [x] [`_mm512_mask_cmpge_epu8_mask`]
* [x] [`_mm_cmpge_epu8_mask`]
* [x] [`_mm_mask_cmpge_epu8_mask`]
* [x] [`_mm256_cmpge_epu8_mask`]
* [x] [`_mm256_mask_cmpge_epu8_mask`]
* [x] [`_mm512_cmpgt_epi16_mask`]
* [x] [`_mm512_mask_cmpgt_epi16_mask`]
* [x] [`_mm512_cmpgt_epi8_mask`]
* [x] [`_mm512_mask_cmpgt_epi8_mask`]
* [x] [`_mm_cmpgt_epi8_mask`]
* [x] [`_mm_mask_cmpgt_epi8_mask`]
* [x] [`_mm256_cmpgt_epi8_mask`]
* [x] [`_mm256_mask_cmpgt_epi8_mask`]
* [x] [`_mm512_cmpgt_epu16_mask`]
* [x] [`_mm512_mask_cmpgt_epu16_mask`]
* [x] [`_mm_cmpgt_epu16_mask`]
* [x] [`_mm_mask_cmpgt_epu16_mask`]
* [x] [`_mm256_cmpgt_epu16_mask`]
* [x] [`_mm256_mask_cmpgt_epu16_mask`]
* [x] [`_mm512_cmpgt_epu8_mask`]
* [x] [`_mm512_mask_cmpgt_epu8_mask`]
* [x] [`_mm_cmpgt_epu8_mask`]
* [x] [`_mm_mask_cmpgt_epu8_mask`]
* [x] [`_mm256_cmpgt_epu8_mask`]
* [x] [`_mm256_mask_cmpgt_epu8_mask`]
* [x] [`_mm512_cmple_epi16_mask`]
* [x] [`_mm512_mask_cmple_epi16_mask`]
* [x] [`_mm_cmpgt_epi16_mask`]
* [x] [`_mm_mask_cmpgt_epi16_mask`]
* [x] [`_mm256_cmpgt_epi16_mask`]
* [x] [`_mm256_mask_cmpgt_epi16_mask`]
* [x] [`_mm512_cmple_epi8_mask`]
* [x] [`_mm512_mask_cmple_epi8_mask`]
* [x] [`_mm_cmple_epi8_mask`]
* [x] [`_mm_mask_cmple_epi8_mask`]
* [x] [`_mm256_cmple_epi8_mask`]
* [x] [`_mm256_mask_cmple_epi8_mask`]
* [x] [`_mm512_cmple_epu16_mask`]
* [x] [`_mm512_mask_cmple_epu16_mask`]
* [x] [`_mm_cmple_epu16_mask`]
* [x] [`_mm_mask_cmple_epu16_mask`]
* [x] [`_mm256_cmple_epu16_mask`]
* [x] [`_mm256_mask_cmple_epu16_mask`]
* [x] [`_mm512_cmple_epu8_mask`]
* [x] [`_mm512_mask_cmple_epu8_mask`]
* [x] [`_mm_cmple_epu8_mask`]
* [x] [`_mm_mask_cmple_epu8_mask`]
* [x] [`_mm256_cmple_epu8_mask`]
* [x] [`_mm256_mask_cmple_epu8_mask`]
* [x] [`_mm512_cmplt_epi16_mask`]
* [x] [`_mm512_mask_cmplt_epi16_mask`]
* [x] [`_mm_cmple_epi16_mask`]
* [x] [`_mm_mask_cmple_epi16_mask`]
* [x] [`_mm256_cmple_epi16_mask`]
* [x] [`_mm256_mask_cmple_epi16_mask`]
* [x] [`_mm512_cmplt_epi8_mask`]
* [x] [`_mm512_mask_cmplt_epi8_mask`]
* [x] [`_mm_cmplt_epi8_mask`]
* [x] [`_mm_mask_cmplt_epi8_mask`]
* [x] [`_mm256_cmplt_epi8_mask`]
* [x] [`_mm256_mask_cmplt_epi8_mask`]
* [x] [`_mm512_cmplt_epu16_mask`]
* [x] [`_mm512_mask_cmplt_epu16_mask`]
* [x] [`_mm_cmplt_epu16_mask`]
* [x] [`_mm_mask_cmplt_epu16_mask`]
* [x] [`_mm256_cmplt_epu16_mask`]
* [x] [`_mm256_mask_cmplt_epu16_mask`]
* [x] [`_mm512_cmplt_epu8_mask`]
* [x] [`_mm512_mask_cmplt_epu8_mask`]
* [x] [`_mm_cmplt_epu8_mask`]
* [x] [`_mm_mask_cmplt_epu8_mask`]
* [x] [`_mm256_cmplt_epu8_mask`]
* [x] [`_mm256_mask_cmplt_epu8_mask`]
* [x] [`_mm512_cmpneq_epi16_mask`]
* [x] [`_mm512_mask_cmpneq_epi16_mask`]
* [x] [`_mm_cmpneq_epi16_mask`]
* [x] [`_mm_mask_cmpneq_epi16_mask`]
* [x] [`_mm256_cmpneq_epi16_mask`]
* [x] [`_mm256_mask_cmpneq_epi16_mask`]
* [x] [`_mm512_cmpneq_epi8_mask`]
* [x] [`_mm512_mask_cmpneq_epi8_mask`]
* [x] [`_mm_cmpneq_epi8_mask`]
* [x] [`_mm_mask_cmpneq_epi8_mask`]
* [x] [`_mm256_cmpneq_epi8_mask`]
* [x] [`_mm256_mask_cmpneq_epi8_mask`]
* [x] [`_mm512_cmpneq_epu16_mask`]
* [x] [`_mm512_mask_cmpneq_epu16_mask`]
* [x] [`_mm_cmpneq_epu16_mask`]
* [x] [`_mm_mask_cmpneq_epu16_mask`]
* [x] [`_mm256_cmpneq_epu16_mask`]
* [x] [`_mm256_mask_cmpneq_epu16_mask`]
* [x] [`_mm512_cmpneq_epu8_mask`]
* [x] [`_mm512_mask_cmpneq_epu8_mask`]
* [x] [`_mm_cmpneq_epu8_mask`]
* [x] [`_mm_mask_cmpneq_epu8_mask`]
* [x] [`_mm256_cmpneq_epu8_mask`]
* [x] [`_mm256_mask_cmpneq_epu8_mask`]
* [x] [`_mm512_cvtepi16_epi8`]
* [x] [`_mm512_mask_cvtepi16_epi8`]
* [x] [`_mm512_maskz_cvtepi16_epi8`]
* [_] [`_mm512_mask_cvtepi16_storeu_epi8`]
* [_] [`_mm_mask_cvtepi16_storeu_epi8`]
* [_] [`_mm256_mask_cvtepi16_storeu_epi8`]
* [x] [`_mm_cvtepi16_epi8`]
* [x] [`_mm_mask_cvtepi16_epi8`]
* [x] [`_mm_maskz_cvtepi16_epi8`]
* [x] [`_mm256_cvtepi16_epi8`]
* [x] [`_mm256_mask_cvtepi16_epi8`]
* [x] [`_mm256_maskz_cvtepi16_epi8`]
* [x] [`_mm512_cvtepi8_epi16`]
* [x] [`_mm512_mask_cvtepi8_epi16`]
* [x] [`_mm512_maskz_cvtepi8_epi16`]
* [x] [`_mm512_cvtepu8_epi16`]
* [x] [`_mm512_mask_cvtepu8_epi16`]
* [x] [`_mm512_maskz_cvtepu8_epi16`]
* [_] [`_cvtmask32_u32`]
* [_] [`_cvtmask64_u64`]
* [x] [`_mm_mask_cvtepi8_epi16`]
* [x] [`_mm_maskz_cvtepi8_epi16`]
* [x] [`_mm256_mask_cvtepi8_epi16`]
* [x] [`_mm256_maskz_cvtepi8_epi16`]
* [x] [`_mm512_cvtsepi16_epi8`]
* [x] [`_mm512_mask_cvtsepi16_epi8`]
* [x] [`_mm512_maskz_cvtsepi16_epi8`]
* [_] [`_mm512_mask_cvtsepi16_storeu_epi8`]
* [x] [`_mm_cvtsepi16_epi8`]
* [x] [`_mm_mask_cvtsepi16_epi8`]
* [x] [`_mm_maskz_cvtsepi16_epi8`]
* [x] [`_mm256_cvtsepi16_epi8`]
* [x] [`_mm256_mask_cvtsepi16_epi8`]
* [x] [`_mm256_maskz_cvtsepi16_epi8`]
* [_] [`_mm_mask_cvtsepi16_storeu_epi8`]
* [_] [`_mm256_mask_cvtsepi16_storeu_epi8`]
* [x] [`_mm512_cvtepu8_epi16`]
* [x] [`_mm512_mask_cvtepu8_epi16`]
* [x] [`_mm512_maskz_cvtepu8_epi16`]
* [x] [`_mm_mask_cvtepu8_epi16`]
* [x] [`_mm_maskz_cvtepu8_epi16`]
* [x] [`_mm256_mask_cvtepu8_epi16`]
* [x] [`_mm256_maskz_cvtepu8_epi16`]
* [_] [`_cvtmask32_u32`]
* [_] [`_cvtmask64_u64`]
* [_] [`_cvtu32_mask32`]
* [_] [`_cvtu64_mask64`]
* [x] [`_mm512_cvtusepi16_epi8`]
* [x] [`_mm512_mask_cvtusepi16_epi8`]
* [x] [`_mm512_maskz_cvtusepi16_epi8`]
* [_] [`_mm512_mask_cvtusepi16_storeu_epi8`]
* [x] [`_mm_cvtusepi16_epi8`]
* [x] [`_mm_mask_cvtusepi16_epi8`]
* [x] [`_mm_maskz_cvtusepi16_epi8`]
* [x] [`_mm256_cvtusepi16_epi8`]
* [x] [`_mm256_mask_cvtusepi16_epi8`]
* [x] [`_mm256_maskz_cvtusepi16_epi8`]
* [_] [`_mm_mask_cvtusepi16_storeu_epi8`]
* [_] [`_mm256_mask_cvtusepi16_storeu_epi8`]
* [x] [`_mm512_dbsad_epu8`]
* [x] [`_mm512_mask_dbsad_epu8`]
* [x] [`_mm512_maskz_dbsad_epu8`]
* [x] [`_mm_dbsad_epu8`]
* [x] [`_mm_mask_dbsad_epu8`]
* [x] [`_mm_maskz_dbsad_epu8`]
* [x] [`_mm256_dbsad_epu8`]
* [x] [`_mm256_mask_dbsad_epu8`]
* [x] [`_mm256_maskz_dbsad_epu8`]
* [x] [`_kadd_mask32`]
* [x] [`_kadd_mask64`]
* [x] [`_kand_mask32`]
@ -210,12 +390,6 @@
* [x] [`_kxor_mask64`]
* [x] [`_load_mask32`]
* [x] [`_load_mask64`]
* [x] [`_mm512_loadu_epi16`]
* [_] [`_mm512_mask_loadu_epi16`]
* [_] [`_mm512_maskz_loadu_epi16`]
* [x] [`_mm512_loadu_epi8`]
* [_] [`_mm512_mask_loadu_epi8`]
* [_] [`_mm512_maskz_loadu_epi8`]
* [x] [`_mm512_madd_epi16`]
* [x] [`_mm512_mask_madd_epi16`]
* [x] [`_mm512_maskz_madd_epi16`]
@ -299,9 +473,17 @@
* [x] [`_mm256_mask_mov_epi8`]
* [x] [`_mm256_maskz_mov_epi8`]
* [x] [`_mm512_movepi16_mask`]
* [x] [`_mm_movepi16_mask`]
* [x] [`_mm256_movepi16_mask`]
* [x] [`_mm512_movepi8_mask`]
* [x] [`_mm_movepi8_mask`]
* [x] [`_mm256_movepi8_mask`]
* [x] [`_mm512_movm_epi16`]
* [x] [`_mm_movm_epi16`]
* [x] [`_mm256_movm_epi16`]
* [x] [`_mm512_movm_epi8`]
* [x] [`_mm_movm_epi8`]
* [x] [`_mm256_movm_epi8`]
* [x] [`_mm512_mask_mulhi_epi16`]
* [x] [`_mm512_maskz_mulhi_epi16`]
* [x] [`_mm512_mulhi_epi16`]
@ -395,12 +577,24 @@
* [x] [`_mm512_mask_shuffle_epi8`]
* [x] [`_mm512_maskz_shuffle_epi8`]
* [x] [`_mm512_shuffle_epi8`]
* [x] [`_mm_mask_shuffle_epi8`]
* [x] [`_mm_maskz_shuffle_epi8`]
* [x] [`_mm256_mask_shuffle_epi8`]
* [x] [`_mm256_maskz_shuffle_epi8`]
* [x] [`_mm512_mask_shufflehi_epi16`]
* [x] [`_mm512_maskz_shufflehi_epi16`]
* [x] [`_mm512_shufflehi_epi16`]
* [x] [`_mm_mask_shufflehi_epi16`]
* [x] [`_mm_maskz_shufflehi_epi16`]
* [x] [`_mm256_mask_shufflehi_epi16`]
* [x] [`_mm256_maskz_shufflehi_epi16`]
* [x] [`_mm512_mask_shufflelo_epi16`]
* [x] [`_mm512_maskz_shufflelo_epi16`]
* [x] [`_mm512_shufflelo_epi16`]
* [x] [`_mm_mask_shufflelo_epi16`]
* [x] [`_mm_maskz_shufflelo_epi16`]
* [x] [`_mm256_mask_shufflelo_epi16`]
* [x] [`_mm256_maskz_shufflelo_epi16`]
* [x] [`_mm512_mask_sll_epi16`]
* [x] [`_mm512_maskz_sll_epi16`]
* [x] [`_mm512_sll_epi16`]
@ -441,12 +635,12 @@
* [x] [`_mm512_mask_srav_epi16`]
* [x] [`_mm512_maskz_srav_epi16`]
* [x] [`_mm512_srav_epi16`]
* [_] [`_mm_mask_srav_epi16`]
* [_] [`_mm_maskz_srav_epi16`]
* [_] [`_mm_srav_epi16`]
* [_] [`_mm256_mask_srav_epi16`]
* [_] [`_mm256_maskz_srav_epi16`]
* [_] [`_mm256_srav_epi16`]
* [x] [`_mm_mask_srav_epi16`]
* [x] [`_mm_maskz_srav_epi16`]
* [x] [`_mm_srav_epi16`]
* [x] [`_mm256_mask_srav_epi16`]
* [x] [`_mm256_maskz_srav_epi16`]
* [x] [`_mm256_srav_epi16`]
* [x] [`_mm512_mask_srl_epi16`]
* [x] [`_mm512_maskz_srl_epi16`]
* [x] [`_mm512_srl_epi16`]
@ -472,10 +666,6 @@
* [x] [`_mm256_srlv_epi16`]
* [x] [`_store_mask32`]
* [x] [`_store_mask64`]
* [_] [`_mm512_mask_storeu_epi16`]
* [x] [`_mm512_storeu_epi16`]
* [_] [`_mm512_mask_storeu_epi8`]
* [x] [`_mm512_storeu_epi8`]
* [x] [`_mm512_mask_sub_epi16`]
* [x] [`_mm512_maskz_sub_epi16`]
* [x] [`_mm512_sub_epi16`]
@ -520,12 +710,28 @@
* [x] [`_mm256_maskz_subs_epu8`]
* [x] [`_mm512_mask_test_epi16_mask`]
* [x] [`_mm512_test_epi16_mask`]
* [x] [`_mm_mask_test_epi16_mask`]
* [x] [`_mm_test_epi16_mask`]
* [x] [`_mm256_mask_test_epi16_mask`]
* [x] [`_mm256_test_epi16_mask`]
* [x] [`_mm512_mask_test_epi8_mask`]
* [x] [`_mm512_test_epi8_mask`]
* [x] [`_mm_mask_test_epi8_mask`]
* [x] [`_mm_test_epi8_mask`]
* [x] [`_mm256_mask_test_epi8_mask`]
* [x] [`_mm256_test_epi8_mask`]
* [x] [`_mm512_mask_testn_epi16_mask`]
* [x] [`_mm512_testn_epi16_mask`]
* [x] [`_mm_mask_testn_epi16_mask`]
* [x] [`_mm_testn_epi16_mask`]
* [x] [`_mm256_mask_testn_epi16_mask`]
* [x] [`_mm256_testn_epi16_mask`]
* [x] [`_mm512_mask_testn_epi8_mask`]
* [x] [`_mm512_testn_epi8_mask`]
* [x] [`_mm_mask_testn_epi8_mask`]
* [x] [`_mm_testn_epi8_mask`]
* [x] [`_mm256_mask_testn_epi8_mask`]
* [x] [`_mm256_testn_epi8_mask`]
* [x] [`_mm512_mask_unpackhi_epi16`]
* [x] [`_mm512_maskz_unpackhi_epi16`]
* [x] [`_mm512_unpackhi_epi16`]

File diff suppressed because it is too large Load diff