rocket-tools/riscv-gnu-toolchain/llvm.git - Unnamed repository; edit this file 'description' to name the repository.

Age	Commit message (Expand)	Author	Files	Lines
2 days	[AMDGPU] Mark address space cast from private to flat as divergent if target ...	Shilei Tian	2	-0/+49
4 days	[AMDGPU] gfx1250 v_wmma_scale[16]_f32_16x16x128_f8f6f4 codegen (#152036)	Stanislav Mekhanoshin	1	-0/+18
7 days	[AMDGPU] gfx1250 v_permlane_* instructions (#151749)	Stanislav Mekhanoshin	1	-0/+35
2025-07-21	AMDGPU: Support v_wmma_f32_16x16x128_f8f6f4 on gfx1250 (#149684)	Changpeng Fang	1	-0/+9
2025-07-15	AMDGPU: Remove a non-existent wmma instruction from gfx1250 (#148989)	Changpeng Fang	1	-8/+0
2025-07-15	AMDGPU: Support intrinsic selection for gfx1250 wmma instructions (#148957)	Changpeng Fang	1	-0/+240
2025-06-29	AMDGPU: Implement intrinsic/builtins for gfx1250 load transpose instructions ...	Changpeng Fang	1	-0/+72
2025-05-29	[Uniformity] Fixed control-div early stop (#139667)	Junjie Gu	6	-2/+392
2025-05-08	[AMDGPU] Add missing intrinsic declaration to intrinsics.ll. NFC. (#138954)	Stanislav Mekhanoshin	1	-0/+1
2025-04-30	[CodeGen] Port MachineUniformityAnalysis to new pass manager (#137578)	paperchalice	18	-45/+63
2025-02-26	[AMDGPU] Do not allow M0 as v_readfirstlane_b32 dst (#128851)	Pierre van Houtryve	2	-5/+5
2025-02-20	[AMDGPU] Add llvm.amdgcn.dead intrinsic (#123190)	Diana Picus	1	-1/+8
2025-01-24	MachineUniformityAnalysis: Improve isConstantOrUndefValuePhi (#112866)	Petar Avramovic	3	-20/+20
2025-01-07	[NVPTX] Switch front-ends and tests to ptx_kernel cc (#120806)	Alex MacLean	4	-22/+8
2024-12-02	AMDGPU: Allow f16/bf16 for DS_READ_TR16_B64 gfx950 builtins (#118297)	Matt Arsenault	1	-0/+22
2024-11-25	AMDGPU: Add support for load transpose instructions for gfx950 (#117378)	Matt Arsenault	1	-0/+44
2024-11-22	AMDGPU: Add v_permlane16_swap_b32 and v_permlane32_swap_b32 for gfx950 (#117260)	Matt Arsenault	1	-0/+16
2024-11-22	AMDGPU: Add v_smfmac_f32_32x32x64_fp8_fp8 for gfx950 (#117259)	Matt Arsenault	1	-0/+9
2024-11-22	AMDGPU: Add v_smfmac_f32_32x32x32x64_fp8_bf8 for gfx950 (#117258)	Matt Arsenault	1	-0/+9
2024-11-22	AMDGPU: Add v_smfmac_f32_32x32x64_bf8_fp8 for gfx950 (#117257)	Matt Arsenault	1	-0/+9
2024-11-22	AMDGPU: Add v_smfmac_f32_32x32x64_bf8_bf8 for gfx950 (#117256)	Matt Arsenault	1	-0/+9
2024-11-21	AMDGPU: Add v_smfmac_f32_16x16x128_fp8_fp8 for gfx950 (#117235)	Matt Arsenault	1	-0/+9
2024-11-21	AMDGPU: Add v_smfmac_f32_16x16x128_fp8_bf8 for gfx950 (#117234)	Matt Arsenault	1	-0/+9
2024-11-21	AMDGPU: Add v_smfmac_f32_16x16x128_bf8_fp8 for gfx950 (#117233)	Matt Arsenault	1	-0/+9
2024-11-21	AMDGPU: Add v_smfmac_f32_16x16x128_bf8_bf8 for gfx950 (#117232)	Matt Arsenault	1	-0/+8
2024-11-21	AMDGPU: Add v_smfmac_i32_32x32x64_i8 for gfx950 (#117214)	Matt Arsenault	1	-0/+9
2024-11-21	AMDGPU: Add v_smfmac_f32_16x16x64_bf16 for gfx950 (#117211)	Matt Arsenault	1	-0/+10
2024-11-21	AMDGPU: Add v_smfmac_f32_32x32x32_f16 for gfx950 (#117205)	Matt Arsenault	1	-0/+9
2024-11-21	AMDGPU: Add v_smfmac_f32_16x16x64_f16 for gfx950 (#117202)	Matt Arsenault	1	-0/+9
2024-11-21	AMDGPU: Add v_mfma_f32_16x16x32_bf16 for gfx950 (#117053)	Matt Arsenault	1	-0/+9
2024-11-21	AMDGPU: Add v_mfma_i32_32x32x32_i8 for gfx950 (#117052)	Matt Arsenault	1	-0/+9
2024-11-21	AMDGPU: Add v_mfma_i32_16x16x64_i8 for gfx950 (#116728)	Matt Arsenault	1	-0/+8
2024-11-21	AMDGPU: Define v_mfma_f32_{16x16x128\|32x32x64}_f8f6f4 instructions (#116723)	Matt Arsenault	1	-0/+20
2024-11-18	AMDGPU: Define v_mfma_f32_32x32x16_bf16 for gfx950 (#116679)	Matt Arsenault	1	-0/+8
2024-11-18	AMDGPU: Add first gfx950 mfma instructions (#116312)	Matt Arsenault	1	-0/+17
2024-10-12	[LLVM] New NoDivergenceSource function attribute (#111832)	Tim Renouf	1	-0/+16
2024-09-27	[AMDGPU] Overload resource descriptor in image intrinsics. (#107255)	sstipano	1	-43/+43
2024-08-06	AMDGPU: Add some leaf intrinsics to isAlwaysUniform (#101925)	Matt Arsenault	1	-0/+33
2024-08-05	[AMDGPU] Mark workgroup_id intrinsics always uniform (#102042)	Stanislav Mekhanoshin	1	-0/+27
2024-07-18	AMDGPU: Add back half and bfloat support for global_load_tr16 pats (#99540)	Changpeng Fang	1	-0/+36
2024-06-26	[AMDGPU] Extend permlane16, permlanex16 and permlane64 intrinsic lowering for...	Vikram Hegde	1	-6/+6
2024-06-25	[AMDGPU] Extend readlane, writelane and readfirstlane intrinsic lowering for ...	Vikram Hegde	1	-3/+3
2024-06-18	AMDGPU: Support local atomicrmw fmin/fmax for float/double (#95590)	Matt Arsenault	1	-4/+5
2024-06-10	[RFC][AMDGPU] Remove old llvm.amdgcn.buffer.* and tbuffer intrinsics (#93801)	Jay Foad	1	-100/+0
2024-05-29	[AMDGPU] Fix filecheck annotation typos	Jay Foad	1	-1/+1
2024-05-06	[AMDGPU] don't mark control-flow intrinsics as convergent (#90026)	Sameer Sahasrabuddhe	3	-26/+26
2024-03-25	AMDGPU: Rename intrinsics and remove f16/bf16 versions for load transpose (#8...	Changpeng Fang	1	-57/+13
2024-02-05	[Analysis] Convert tests to opaque pointers (NFC)	Nikita Popov	3	-6/+6
2024-01-30	[AMDGPU]: Fix type signatures for wmma intrinsics, NFC (#80087)	Changpeng Fang	1	-18/+18
2024-01-24	[AMDGPU] Add GFX12 WMMA and SWMMAC instructions (#77795)	Mirko Brkušanin	1	-18/+117