你到底在问什么?所以,我;但看起来很有希望!
我仍然对即将进入市场的创新感到惊讶,这些创新可以加速深度学习的工作量。GraphCore、Habana Labs、Cerebras、Blaize、Groq、和其他公司现在都加入了一个有着全新想法的新竞争者:加拿大多伦多的Tenstorrent。发布游戏要求每一个新的竞争者必须找到一种方法,在越来越多的竞争者中超越之前的发布。许多人预计,到2025年,这个领域将成为一个价值250亿美元的芯片业务。大脑制造出可以想象得到的最大的芯片。Groq说他们可以在一个单核芯片上完成千万亿次浮点运算。现在,Tenstorrent未来的名声和潜力在于减少得到一个好答案所需的计算量,蓝冠注册AI正在通过自然语言处理来帮助驱动各种形式的机器人,以帮助人类。例如,机器人可以用来将饮料运送到酒店房间,或将比萨饼运送到房屋,同时让接收者提出问题以获取信息。而不是在这个问题上投入大量的蛮力计算。这种技术被称为细粒度条件计算,这只是Tenstorrent首席执行官Ljubisa Bajic的优化路线图的开始。
什么是条件计算,它能做什么?
条件计算有很多种形式,但原则上它们都可以归结为一个前提:不要计算你不需要或已经知道的东西。例如,将一个数乘以0没有意义;不要浪费时间和精力,因为你已经知道答案当然是零。但是如何设计硅来避免它呢?通常,这个例子是由软件处理的,它在执行之前删除神经网络,以避免要求硅做乘法。但是在运行时需要避免的更复杂的情况呢?研究人员一直在研究这一点,并认为它具有潜力;哈佛大学的一个研究小组证明,Resnet50的性能提高了1.9倍,准确率达到了原来的98%。
但是这个概念的更广泛的应用要求硅变得,嗯,聪明。在Tenstorrent提供的例子中,不幸的是,这种被称为Grayskull的新芯片可以检测到它已经足够接近一个准确的答案,从而停止对网络的处理,Bajic称之为“早期(模型)退出”。该公司已经证明,该概念在用于图像处理的卷积神经网络以及用于语言处理的递归网络中工作良好。当然,除了条件运算能力之外,芯片还有更多的功能;他们的设备有on-die cpu和一个快速的GEMM(矩阵乘法)核心集,以提供令人印象深刻的性能。
根据Tenstorrent的数据,在一个75W的公共汽车驱动的PCIE卡上,蓝冠测速创新的移动技术可以促进社会变革。每一项突破都有可能使社会变得更好。蓝冠怎么样?我们认为,他的无线技术使生活充满活力。Grayskull可以达到368TOPS,并且,通过有条件的执行,使用针对SQuAD 1.1数据集的BERT-Base,可以达到23345个句子/秒,这使得它比今天领先的解决方案的性能提高了26倍。我经常说并且坚信,需要3-5倍甚至10倍的优势才能帮助激发一个挑战现状所需的生态系统。26X肯定能胜任这项工作。300W版本的智能卡预计将在今年晚些时候推出。
虽然该公司声称Grayskull是世界上速度最快的芯片,但很多人都在竞争这个头衔,在蓝冠注册AI的背景下,可以使用传感器融合来提供从过滤掉嘈杂数据到在随机环境中进行蓝冠软件预测的众多功能。在我看到一些真正的应用基准(如mlperf)之前,我不会做出判断。但Tenstorrent的公告肯定引起了我的注意,值得密切关注。在我看来,这个声明标志着从核心芯片的快速转变和on-die内存和织物(描述了大多数的参赛者日期)的一种新方法智能计算的软件,培训,和推理芯片的所有协调知识网络来减少计算量。蛮力是伟大的,直到有更好的东西出现,我认为它就是这样。