apple M1 单核速度横扫intel

googlebot2 14天前 12

关键没风扇, apple软件真是神优化,

最新回复 (47)
  • googlebot2 发表于 2020-11-18 08:49
    你显然对软件优化认识的肤浅,  
    指令集都是一些特殊指令来提高效率的,需要软件编译器来翻译,
    这都是乔布斯托梦告诉你的吧?
    我的确对软件优化认识的比较肤浅,
    但你这么无知,就不要在网上乱发垃圾信息了。。
  • jasper 14天前
    引用 3
    底层都不一样比什么啊?
    全看钱到不到位优化用不用心
  • jasper 14天前
    引用 4
    googlebot2 发表于 2020-11-18 09:09
    我几十年前从z80汇编开始的,
    那可真有够丢人,,
    到现在都能说出来这种话。
    你是觉得专门做cpu的Intel更懂指令集还是半路出家什么都做的apple更懂?
  • 楼主 googlebot2 14天前
    引用 5
    贱人就是矫情 发表于 2020-11-18 08:44
    ???CPU的指令集是软件优化??
    你显然对软件优化认识的肤浅,  
    指令集都是一些特殊指令来提高效率的,需要软件编译器来翻译,
    apple这次把x86机器码翻译成arm机器码,搞了优化,
  • 楼主 googlebot2 14天前
    引用 6
    hxuf 发表于 2020-11-18 08:38
    你忽略了各种指令集。
    你的指令集本质是软件优化,  apple做的更好,
  • 楼主 googlebot2 14天前
    引用 7
    这个M1估计就10w的功耗,打败intel 100w的cpu,
    这个绝对是 革 命,
  • jasper 14天前
    引用 8
    thaizxj 发表于 2020-11-18 08:47
    照你这么说,指令集还可以通过后续软件更新加进去了?
    自以为是的小白就这样,整天半瓶水见风就是雨想搞个大新闻
  • llmwxt 14天前
    引用 9
    嗯嗯,很强,很多测评了!
  • zgs 14天前
    引用 10
    ARM架构
    你说的横扫是相对的
    7-8000价位win本感觉碾压M1还是没得问题
  • 楼主 googlebot2 14天前
    引用 11
    geekbench是第三方软件,算法是一样的,
  • hxuf 14天前
    引用 12
    googlebot2 发表于 2020-11-18 08:38
    geekbench是第三方软件,算法是一样的,
    你忽略了各种指令集。
  • qinghe187100 14天前
    引用 13
    然而买不起
  • 楼主 googlebot2 14天前
    引用 14
    qinghe187100 发表于 2020-11-18 08:41
    然而买不起
    mini不贵,还没风扇,我准备买个灌水,
  • hxuf 14天前
    引用 15
    googlebot2 发表于 2020-11-18 08:40
    你的指令集本质是软件优化,  apple做的更好,
    这个就不一定了。就看一年后的表现了。
  • 引用 16
    googlebot2 发表于 2020-11-18 08:40
    你的指令集本质是软件优化,  apple做的更好,
    ???CPU的指令集是软件优化??
  • jasper 14天前
    引用 17
    arm能装个Windows嘛?能LOL cyberpunk嘛?
    什么?都不能?
    那你扯什么犊子
  • Pastech 14天前
    引用 18
    googlebot2 发表于 2020-11-18 08:40
    你的指令集本质是软件优化,  apple做的更好,
    神tm指令集是软件优化
  • thaizxj 14天前
    引用 19
    贱人就是矫情 发表于 2020-11-18 08:44
    ???CPU的指令集是软件优化??
    照你这么说,指令集还可以通过后续软件更新加进去了?
  • jasper 14天前
    引用 20
    thaizxj 发表于 2020-11-18 08:47
    照你这么说,指令集还可以通过后续软件更新加进去了?
    自以为是的小白就这样,整天半瓶水见风就是雨想搞个大新闻
  • BWH 14天前
    引用 21
    googlebot2 发表于 2020-11-18 08:40
    你的指令集本质是软件优化,  apple做的更好,
    见解独到,苹果自建指令集,好久把我a13优化个x86指令集,我好在iPhone上dd一个win10
  • 楼主 googlebot2 14天前
    引用 22
    贱人就是矫情 发表于 2020-11-18 08:44
    ???CPU的指令集是软件优化??
    你显然对软件优化认识的肤浅,  
    指令集都是一些特殊指令来提高效率的,需要软件编译器来翻译,
    apple这次把x86机器码翻译成arm机器码,搞了优化,
  • 引用 23
    googlebot2 发表于 2020-11-18 08:49
    你显然对软件优化认识的肤浅,  
    指令集都是一些特殊指令来提高效率的,需要软件编译器来翻译,
    这都是乔布斯托梦告诉你的吧?
    我的确对软件优化认识的比较肤浅,
    但你这么无知,就不要在网上乱发垃圾信息了。。
  • 楼主 googlebot2 14天前
    引用 24
    贱人就是矫情 发表于 2020-11-18 08:52
    这都是乔布斯托梦告诉你的吧?
    我的确对软件优化认识的比较肤浅,
    但你这么无知,就不要在网上乱发垃圾 ...
    如果你不懂汇编语言,就不要乱说了,
  • 站稳扶好 14天前
    引用 25
    googlebot2 发表于 2020-11-18 08:55
    如果你不懂汇编语言,就不要乱说了,
    看样子楼主的技术已经超过了98%Intel员工
  • thaizxj 14天前
    引用 26
    googlebot2 发表于 2020-11-18 08:55
    如果你不懂汇编语言,就不要乱说了,
    大神,帮我做个AVX-512指令集的更新包加到我4代I5里吧
  • 楼主 googlebot2 14天前
    引用 27
    apple是把x86的机器码翻译成arm的机器码, 应该包括intel各种指令集,这个不是软件优化? 芯片里跑的代码不是软件?
    10w的arm cpu取得100瓦intel cpu的速度,
  • 引用 28
    googlebot2 发表于 2020-11-18 08:55
    如果你不懂汇编语言,就不要乱说了,
    行了,你已经有那味了!
    [没人比我更懂指令集+软件优化+汇编!!!]
    其实你可以试着学下如果使用搜索引擎,不是很难。
  • 楼主 googlebot2 14天前
    引用 29
    thaizxj 发表于 2020-11-18 09:00
    大神,帮我做个AVX-512指令集的更新包加到我4代I5里吧
    apple肯定可以做到, 如何翻译机器码,
  • grate 14天前
    引用 30
    googlebot2 发表于 2020-11-18 08:49
    你显然对软件优化认识的肤浅,  
    指令集都是一些特殊指令来提高效率的,需要软件编译器来翻译,
    指令集是cpu硬件定死的,例如x86 risc等
  • 楼主 googlebot2 14天前
    引用 31
    贱人就是矫情 发表于 2020-11-18 09:03
    行了,你已经有那味了!
    [没人比我更懂指令集+软件优化+汇编!!!]
    我几十年前从z80汇编开始的,
  • grate 14天前
    引用 32
    googlebot2 发表于 2020-11-18 08:49
    你显然对软件优化认识的肤浅,  
    指令集都是一些特殊指令来提高效率的,需要软件编译器来翻译,
    你说的是跨平台的程序翻译,不是指令集优化,老铁
  • ry-ss 14天前
    引用 33
    无非是挑指令集跑呗.......
    说起来你们可能不信   但是10900K  3900x这些旗舰CPU  和865 麒麟9000这些带NPU的跑特定算法的时候   功耗200W的CPU能被十几W的手机SOC甩个三四倍差距.
    而大部分CPU计算图形还不如一百五十块的750ti
  • jasper 14天前
    引用 34
    googlebot2 发表于 2020-11-18 09:09
    我几十年前从z80汇编开始的,
    那可真有够丢人,,
    到现在都能说出来这种话。
    你是觉得专门做cpu的Intel更懂指令集还是半路出家什么都做的apple更懂?
  • 楼主 googlebot2 14天前
    引用 35
    ry-ss 发表于 2020-11-18 09:10
    无非是挑指令集跑呗.......
    说起来你们可能不信   但是10900K  3900x这些旗舰CPU  和865 麒麟9000这些带NPU ...
    gpu仅仅是跑图像算法,  M1牛的是跑x86的代码,
  • 气味 14天前
    引用 36
    继续忽悠
  • 若白 14天前
    引用 37
    googlebot2 发表于 2020-11-18 08:55
    如果你不懂汇编语言,就不要乱说了,
    指令集加速, 有的需要写代码的时候主动调用...
    其实是内联汇编...
    有的是编译器帮你做这一步...
    但指令集真不只是软件优化, 我用了avx2的代码, 放到不支持avx2的cpu上就是跑不起来...
    寄存器数量都不一样跑个鸡儿...
  • reruin 14天前
    引用 38
    很想知道 PD 在M1上的适配情况。
  • wmfy808 14天前
    引用 39
    googlebot2 发表于 2020-11-18 09:09
    我几十年前从z80汇编开始的,
    Arm指令是精简指令,被阉割的体无完肤了,精简指令意味着什么?,然本一条指令可以搞定的事,现在需要10几条指令完成,何来的效率。
    例如,如果您在应用程序中需要某种按字节的内存比较块(由编译器生成,跳过详细信息),则这可能是这样的 x86
    repe cmpsb         /* repeat while equal compare string bytewise */
    而在ARM最短形式上可能看起来像(没有错误检查等)
    top:
    ldrb r2, [r0, #1]! /* load a byte from address in r0 into r2, increment r0 after */
    ldrb r3, [r1, #1]! /* load a byte from address in r1 into r3, increment r1 after */
    subs r2, r3, r2    /* subtract r2 fro
  • 小白鸡 14天前
    引用 40
    试试多线程?
  • jeaslau 14天前
    引用 41
    又跑不了x86,装不了win我怎么装x?
  • grate 14天前
    引用 42
    jasper 发表于 2020-11-18 09:13
    那可真有够丢人,,
    到现在都能说出来这种话。
    你这个就无厘头了,技术在进步,芯片行业也能靠资历过日子?
  • jasper 14天前
    引用 43
    grate 发表于 2020-11-18 09:31
    你这个就无厘头了,技术在进步,芯片行业也能靠资历过日子?
    芯片可是硬实力,领先多少年就是领先多少年,造不出他就是造不出来
  • 小白鸡 14天前
    引用 44
    特意摘了一篇,来给楼主做科普...
    另外告诉楼主一句,苹果不是慈善机构,假如CPU真那么强的话,你觉得还会给你那么便宜的价格?
    到了这里你就应该明白为什么RISC和CISC之间不好直接比较性能了,因为它们之间的设计思路差异太大。这样的思路导致了CISC和RISC分道扬镳——前者更加专注于高性能但同时高功耗的实现,而后者则专注于小尺寸低功耗领域。实际上也有很多事情CISC更加合适,而另外一些事情则是RISC更加合适,比如在执行高密度的运算任务的时候CISC就更具备优势,而在执行简单重复劳动的时候RISC就能占到上风,比如假设我们是在举办吃饭大赛,那么CISC只需要不停的喊“吃饭吃饭吃饭”就行了,而RISC则要一遍一遍重复吃饭流程,负责喊话的人如果嘴巴不够快(即内存带宽不够大),那么RISC就很难吃的过CISC。但是如果我们只是要两个人把饭舀出来,那么CISC就麻烦得多,因为CISC里没有这么简单的舀饭动作,而RISC就只需要不停喊“舀饭舀饭舀饭”就OK。
    这就是CISC和RISC之间的区别。但是在实际情况中问题要比这复杂许许多多,因为各个阵营的设计者都想要提升自家架构的性能。这里面最普遍的就是所谓的“发射”概念。什么叫发射?发射就是同时可以执行多少指令的意思,例如双发射就意味着CPU可以同时拾取两条指令,三发射则自然就是三条了。现代高级处理器已经很少有单发射的实现,例如Cortex A8和A9都是双发射的RISC,而Cortex A15则是三发射。ATOM是双发射CISC,Core系列甚至做到了四发射——这个方面大家倒是不相上下,但是不要忘了CISC的指令更加复杂,也就意味着指令更加强大,还是吃饭的例子,CISC只需要1个指令,而RISC需要5个,那么在内存带宽相同的情况下,CISC能达到的性能是要超过RISC的(就吃饭而言是5倍),而实际中CISC的Core i处理器内存带宽已经超过了100GB/s,而ARM还在为10GB/s而苦苦奋斗,一个更加吃带宽的架构,带宽却只有别人的十分之一,性能自然会受到非常大的制约。为什么说ARM和X86不好比,这也是很重要的一个原因,因为不同的应用对带宽需求是不同的。一旦遇到带宽瓶颈,哪怕ARM处理器已经达到了很高的运算性能,实际上根本发挥不出来,自然也就会落败了。
    说到这儿大家应该也已经明白CISC和RISC的区别和特色了。简而言之,CISC实际上是以增加处理器本身复杂度作为代价,去换取更高的性能,而RISC则是将复杂度交给了编译器,牺牲了程序大小和指令带宽,换取了简单和低功耗的硬件实现。但如果事情就这样发展下去,为了提升性能,CISC的处理器将越来越大,而RISC需要的内存带宽则会突破天际,这都是受到技术限制的。所以进十多年来,关于CISC和RISC的区分已经慢慢的在模糊,例如自P6体系(即Pentium Pro)以来,作为CISC代表的X86架构引入了微码概念,与此对应的,处理器内部也增加了所谓的译码器,负责将传统的CISC指令“拆包”为更加短小的微码(uOPs)。一条CISC指令进来以后,会被译码器拆分为数量不等的微码,然后送入处理器的执行管线——这实际上可以理解为RISC内核+CISC解码器。而RISC也引入了指令集这个就逻辑角度而言非常不精简的东西,来增加运算性能。正常而言,一条X86指令会被拆解为2~4个uOPs,平均来看就是3个,因此同样的指令密度下,目前X86的实际指令执行能力应该大约是ARM的3倍左右。不过不要忘了这是基于“同样指令密度”下的一个假设,实际上X86可以达到的指令密度是十倍甚至百倍于ARM的。
    最后一个需要考虑的地方就是指令集。这个东西的引入,是为了加速处理器在某些特定应用上性能而设计的,已经有了几十年的历史了。而实际上在目前的应用环境内,起到决定作用的很多时候是指令集而不是CPU核心。X86架构的强大,很多时候也源于指令集的强大,比如我们知道的ATOM,虽然它的X86核心非常羸弱,但是由于它支持SSE3,在很多时候性能甚至可以超过核心性能远远强大于它的Pentium M,这就是指令集的威力。目前X86指令集已经从MMX,发展到了SSE,AVX,而ARM依然还只有简单而基础的NEON。它们之间不成比例的差距造成了实际应用中成百上千倍的性能落差,例如即便是现今最强大的ARM内核依然还在为软解1080p H.264而奋斗,但一颗普通的中端Core i处理器却可以用接近十倍播放速度的速度去压缩1080p H.264视频。至少在这点上,说PC处理器的性能百倍于ARM是无可辩驳的,而实际中这样的例子比比皆是。这也是为什么我在之前说平均下来ARM只有X86几十分之一的性能的原因。
  • gyjys43043 14天前
    引用 45
    理论上ARM的性能是没办法跟X86抗衡的,但是今天看了一篇评测,说是M1在解压缩和编译这种密集运算的情况下,也超过了I7 10代处理器。
    个人觉得还要再观望观望。现在各种评测满天飞,但还没有用户拿到真正的产品。只有等用户实际的体验过,才知道这款CPU到底性能如何
  • ry-ss 14天前
    引用 46
    googlebot2 发表于 2020-11-18 09:16
    gpu仅仅是跑图像算法,  M1牛的是跑x86的代码,
    算法那是中间层 应用层的事情了   除了汇编 其他语言都是跨平台的  有编译器就能跑不分X86 ARM 或者是其他指令集
  • imes 14天前
    引用 47
    googlebot2 发表于 2020-11-18 08:38
    geekbench是第三方软件,算法是一样的,
    不能这么比
    比如我拿去测aes速度,arm肯定比不上x86。我要是压片h265,那x86就比不上有架构优势的arm
    更何况geekbench**不干净,跑分的时候X86起不来
  • 勇气不足 14天前
    引用 48
    ry-ss 发表于 2020-11-18 09:10
    无非是挑指令集跑呗.......
    说起来你们可能不信   但是10900K  3900x这些旗舰CPU  和865 麒麟9000这些带NPU ...
    cpu和gpu还是分工不一样的,不能单纯比较
    gpu生来就是做计算,cpu除了计算还要负责控制协调其他部件
    另外楼主真是闭眼瞎吹
  • 游客
    49
返回