首先楼主知道像素填充率指的是GPU每秒内可以渲染到屏幕并写入显存的像素数量, 像素填充率以百万像素每秒或千兆像素每秒为单位,通过GPU的时钟频率乘以光栅单元的数量就可以获得像素填充率的理论值。
但这样计算出来的只是理论值,实际上会有其他因素限制显卡ROPS性能的发挥和像素填充率吗?
例如N卡GPC单元的数量我听说就会限制ROPS性能和像素填充率的发挥,这种情况好像在开普勒架构就有出现过,例如开普勒架构的每个GPC单元在每个时钟频率可以输出8个像素,GK104核心是4组GPC单元,所以32个光栅单元就可以全部发挥出来。
而GK110核心虽然最大可以有48个光栅单元,但是它的GPC单元只有5组,那样就会将GPU限制为每个时钟40个像素,也就是GPC单元的限制可能会导致GK110核心的光栅单元以40+8的模式来进行工作,多出来的8个光栅单元虽然有时候可能会起不到作用,但还是可以起到辅助作用的,例如MSAA多重采样抗锯齿,因为MSAA不需要光栅化的附加数据。
如果这种情况是真的的话,那么1060是不是也存在这种情况?因为GP106的GPC单元只有2组,帕斯卡架构的GPC单元每个时钟可以输出16个像素,2组GPC单元就只能让32个ROPS发挥出性能,另外16个只能在不需要光栅化的附加数据的情况下才能起到作用吗?
但这样计算出来的只是理论值,实际上会有其他因素限制显卡ROPS性能的发挥和像素填充率吗?
例如N卡GPC单元的数量我听说就会限制ROPS性能和像素填充率的发挥,这种情况好像在开普勒架构就有出现过,例如开普勒架构的每个GPC单元在每个时钟频率可以输出8个像素,GK104核心是4组GPC单元,所以32个光栅单元就可以全部发挥出来。
而GK110核心虽然最大可以有48个光栅单元,但是它的GPC单元只有5组,那样就会将GPU限制为每个时钟40个像素,也就是GPC单元的限制可能会导致GK110核心的光栅单元以40+8的模式来进行工作,多出来的8个光栅单元虽然有时候可能会起不到作用,但还是可以起到辅助作用的,例如MSAA多重采样抗锯齿,因为MSAA不需要光栅化的附加数据。
如果这种情况是真的的话,那么1060是不是也存在这种情况?因为GP106的GPC单元只有2组,帕斯卡架构的GPC单元每个时钟可以输出16个像素,2组GPC单元就只能让32个ROPS发挥出性能,另外16个只能在不需要光栅化的附加数据的情况下才能起到作用吗?