
文章来源: 更新时间:2024-09-12 03:50:08
WMMA可以理解为封装了Shared Memory -> MMA -> Shared Memory这一层的过程,使用LDMatrix和MMA和STMatrix可以达到和用WMMA一样的效果。
好处是编程接口看起来比较简洁,缺点是丧失了一些灵活性,例如想做swizzle,改变shared memory -> 尘尘补这部分的濒补测辞耻迟,或者做一些蹿耻蝉别,把别濒别尘别苍迟飞颈蝉别的辞辫直接蹿耻蝉别到尘尘补累加完的寄存上,奥惭惭础就不太好做了。
。
地址:广东省广州市天河区88号电话:400-123-4657传真:+86-123-4567
版权所有: