12600k和12700k是12代13代中少有的小核簇三缓残废型号,小核几乎不可用(另外还包括12450h、13400f)
英特尔三缓机制:每个大核独享一个3MB三级缓存节点,每4个小核组成一个小核簇,每个小核簇共享一个3MB的三级缓存节点,然后所有三级缓存通过ring总线串在一起,为多核协同交换信息提供支持,每个核心三缓大小与ring频率共同决定了多核协同的效率。这里有个有意思的现象,移动端18MB的13500h和16MB的7840h在网游中的表现一个天一个地,前者能接近大哥13650hx的表现,而后者和7745hx差距极大,这其中除了有英特尔内存控制的优势(极大缓解三缓压力),很重要的一点是13500h三缓虽小却是满血,4个大核每个3mb,2个小核簇每个3mb,相比桌面端一点没少,而8大核的zen4完整架构应该是7745hx/7700x那样的每个4MB,到了zen4移动端7840h这里变成了每个2MB的残血架构。
应用与游戏的多核机制:多核是用来应对单核不够强的妥协手段,核与核之间的通信存在延迟,当延迟到达一定极限时,加核失去作用。拿游戏举例,大部分游戏,只能调用8个线程,一些新游戏(drictx12)可以支持到16个线程(但其实12个线程就能达成16线程98%的帧数)。绝大部分普通软件都是2~8线程。能调用16个以上线程的,一般是渲染,程序编译,视频编码等机械性的应用,这些对延迟不敏感,但这些场景其实更适合用比CPU更大规模的GPU,比如渲染,4060即可达到7950x 5~6倍的速度,比如显卡的编码加速,个人认为这些场景最终会过渡到GPU。总之在有限的线程内强才是真正的强,像AMD 7950x/7945hx那种双ccd胶水核心个人是很不屑的,本质上是两个CPU拼在一起,延迟爆炸,一到游戏、专业应用就变回8核处理器,纯粹为跑分而生,对,大家最常用的cinebench undefined跑分就是一个渲染器,根本不考虑核心间的延迟,和实际使用场景相去甚远。
小核是否有用及英特尔设计小核的思路:英特尔本质是要在消费级领域用1个真正的CPU解决问题,保证所有节点延迟可控,而不是像AMD那样把行业级的多ccd方案强行搬到消费领域进行虚假的跑分宣传(AMD也在拨乱反正,从zen4这代主推的8核16线程单ccd 7840h,7745hx,7700x,7800x3d,到下代的单ccd大小核zen4c)。英特尔4个小核组成一个小核簇,而一个小核簇面积与一个大核相当,后者性能等效2个小核。很多人把小核当成小核,其实4个小核组成的小核簇才是真正的大核,它是一个性能/面积比极高的物理层面超线程核心,只是它无法合并提供足够强的单核性能。小核心的本质就是物理超线程,超线程本质就是把溢出未加以利用的单核性能分到一个虚拟出来的核心中,其效果在多线程场景下是不如物理超线程的,只要超线程有用,小核心就有用,而且更有用
为什么经常觉得小核没用?大部分软件,12个线程就吃满了,而Windows中CPU的排序是大核心在前,小核心在后,对于主流的6大核CPU来说小核心轮不到使用
为什么部分游戏关小核能提升帧数?因为减少发热,让前面用上的核心频率更高,“有限核心内性能更强”或者因为关小核ring频提高,前面用上的核心互联互通更强,多核效率提高。又或者——摆脱了拖油瓶——回到主题126和127——
126和127的三缓分别是20、25MB,前者6p4e,后者8p4e,你算一下就会发现,前者大核心每个3MB,剩下一个小核簇只剩了2MB了,12700k更离谱,去掉8×3MB后,小核簇只剩了1MB!这两个CPU的小核互通非常差!
在12代中,经常发现关小核提帧数,在13代中却恰恰相反,就是因为12600k和12700k的这番骚操作,导致小核簇成为了孤岛、木桶的短板,导致前面的飞快的大核都要慢下来等它,反而拖垮了整体的速度,可以说小核风评被害,一大半是126、127的功劳。
结合我这边12600k,12700k,12900hx,13500h的实测以及网络上12650h测试,在战地2042中(少有的多核调用超过16线程的游戏,保证小核参与调用),画质拉1080p最低保证CPU是瓶颈,12600k默认140帧,关小核160帧12700k默认160帧,关小核210帧(此时显卡瓶颈)12900hx默认200帧(显卡4060瓶颈)12650h默认200帧(显卡4060瓶颈)13500h默认200帧(显卡4060瓶颈)
同样6p4e,12650h大核4.1g,12600k大核4.5g,12600k被反超
同样16线程,13500h 4p8e 大核4.6g,12600k 6p4e 大核4.5g,12600k被反超
英特尔三缓机制:每个大核独享一个3MB三级缓存节点,每4个小核组成一个小核簇,每个小核簇共享一个3MB的三级缓存节点,然后所有三级缓存通过ring总线串在一起,为多核协同交换信息提供支持,每个核心三缓大小与ring频率共同决定了多核协同的效率。这里有个有意思的现象,移动端18MB的13500h和16MB的7840h在网游中的表现一个天一个地,前者能接近大哥13650hx的表现,而后者和7745hx差距极大,这其中除了有英特尔内存控制的优势(极大缓解三缓压力),很重要的一点是13500h三缓虽小却是满血,4个大核每个3mb,2个小核簇每个3mb,相比桌面端一点没少,而8大核的zen4完整架构应该是7745hx/7700x那样的每个4MB,到了zen4移动端7840h这里变成了每个2MB的残血架构。
应用与游戏的多核机制:多核是用来应对单核不够强的妥协手段,核与核之间的通信存在延迟,当延迟到达一定极限时,加核失去作用。拿游戏举例,大部分游戏,只能调用8个线程,一些新游戏(drictx12)可以支持到16个线程(但其实12个线程就能达成16线程98%的帧数)。绝大部分普通软件都是2~8线程。能调用16个以上线程的,一般是渲染,程序编译,视频编码等机械性的应用,这些对延迟不敏感,但这些场景其实更适合用比CPU更大规模的GPU,比如渲染,4060即可达到7950x 5~6倍的速度,比如显卡的编码加速,个人认为这些场景最终会过渡到GPU。总之在有限的线程内强才是真正的强,像AMD 7950x/7945hx那种双ccd胶水核心个人是很不屑的,本质上是两个CPU拼在一起,延迟爆炸,一到游戏、专业应用就变回8核处理器,纯粹为跑分而生,对,大家最常用的cinebench undefined跑分就是一个渲染器,根本不考虑核心间的延迟,和实际使用场景相去甚远。
小核是否有用及英特尔设计小核的思路:英特尔本质是要在消费级领域用1个真正的CPU解决问题,保证所有节点延迟可控,而不是像AMD那样把行业级的多ccd方案强行搬到消费领域进行虚假的跑分宣传(AMD也在拨乱反正,从zen4这代主推的8核16线程单ccd 7840h,7745hx,7700x,7800x3d,到下代的单ccd大小核zen4c)。英特尔4个小核组成一个小核簇,而一个小核簇面积与一个大核相当,后者性能等效2个小核。很多人把小核当成小核,其实4个小核组成的小核簇才是真正的大核,它是一个性能/面积比极高的物理层面超线程核心,只是它无法合并提供足够强的单核性能。小核心的本质就是物理超线程,超线程本质就是把溢出未加以利用的单核性能分到一个虚拟出来的核心中,其效果在多线程场景下是不如物理超线程的,只要超线程有用,小核心就有用,而且更有用
为什么经常觉得小核没用?大部分软件,12个线程就吃满了,而Windows中CPU的排序是大核心在前,小核心在后,对于主流的6大核CPU来说小核心轮不到使用
为什么部分游戏关小核能提升帧数?因为减少发热,让前面用上的核心频率更高,“有限核心内性能更强”或者因为关小核ring频提高,前面用上的核心互联互通更强,多核效率提高。又或者——摆脱了拖油瓶——回到主题126和127——
126和127的三缓分别是20、25MB,前者6p4e,后者8p4e,你算一下就会发现,前者大核心每个3MB,剩下一个小核簇只剩了2MB了,12700k更离谱,去掉8×3MB后,小核簇只剩了1MB!这两个CPU的小核互通非常差!
在12代中,经常发现关小核提帧数,在13代中却恰恰相反,就是因为12600k和12700k的这番骚操作,导致小核簇成为了孤岛、木桶的短板,导致前面的飞快的大核都要慢下来等它,反而拖垮了整体的速度,可以说小核风评被害,一大半是126、127的功劳。
结合我这边12600k,12700k,12900hx,13500h的实测以及网络上12650h测试,在战地2042中(少有的多核调用超过16线程的游戏,保证小核参与调用),画质拉1080p最低保证CPU是瓶颈,12600k默认140帧,关小核160帧12700k默认160帧,关小核210帧(此时显卡瓶颈)12900hx默认200帧(显卡4060瓶颈)12650h默认200帧(显卡4060瓶颈)13500h默认200帧(显卡4060瓶颈)
同样6p4e,12650h大核4.1g,12600k大核4.5g,12600k被反超
同样16线程,13500h 4p8e 大核4.6g,12600k 6p4e 大核4.5g,12600k被反超