原文链接:https://mp.weixin.qq.com/s/mFu7bZEychOnsddHmTmLmw
华尔街日报(WSJ)引述知情人士消息称,对中国大陆人工智能(AI)技术实力日益成长的担忧,促使拜登政府考虑对中国实施新一波AI芯片出口管制。

据统计NVIDIA当前在售的AI加速卡至少有9款型号,其中高性能的有4款,分别是V100、A800、A100及H100。价格方面,V100加速卡至少10000美元,按当前的汇率,约合6.9万元人民币;A800售价12000美元,约合人民币8.7万元,市场一度炒高到10万元人民币;A100售价在1.5万美元,约合人民币10.8万元;H100加速卡是NVIDIA当前最强的,售价3.65万美元,约合26.4万元人民币。
消息显示,由于市场需求暴涨,导致英伟达面向中国市场推出的替代版本A800和H800的市场价格比原始厂商建议零售价高出了40%,并且新订单交期可能延长到了12月份。
黄仁勋:美中对峙恐重伤美国科技业
国产厂商成色几何?
高性能GPU缺货,正成为限制中国AI研发的最直接因素之一。
就市场来看,据Verified Market Research数据显示,从2021年到2030年,GPU将以33.3%的年复合成长率,从330亿美元成长至4773亿美元。大算力芯片领域主要有两个玩家,英伟达和 AMD。从市占率来说,英伟达远超 AMD。根据 John Peddie Research 的数据,英伟达占据了GPU市场约 86% 的份额。行业早已苦垄断久矣!
时至今日,发展自主芯片已经不再是一个有争议的选择题,而是必须要去做的事情。目前国内GPU芯片的研发,处于一个怎样的水平呢?
华为海思
昇腾代表业界最强AI算力。思半导体成立于2004年10月,是华为的全资子公司。得益于母公司的强势全力支持和持续的高研发投入,海思已成为全球领先的Fabless半导体公司,产品覆盖智慧视觉、AIoT、智慧媒体、智慧交通及汽车电子、显示、手机终端、数据中心及光收发器等多个领域。
昇腾系列——面向“端、边、云”全栈全场景AI芯片,代表着业界最强AI算力,采用华为自研的达芬奇架构,对标国际巨头谷歌英伟达。2018年,华为提出了全栈全场景AI解决方案并发布了两款AI芯片,昇腾910和昇腾310,其计算核心采用华为自研的面向AI计算特征的“达芬奇架构”。昇腾910是单芯片计算密度最大的芯片,对标英伟达V100和谷歌TPUv3,比V100的标称算力125TOPS高出约一倍,而昇腾310芯片的最大功耗仅8W,是极致高效计算低功耗AI芯片。基于昇腾系列AI处理器,华为推出Atlas全系列、全息感知产品,覆盖端侧、边缘侧和数据中心侧。
寒武纪
AI芯片独角兽,中国ASIC路线先行者。寒武纪成立于2016年,是全球AI芯片领域第一个独角兽初创公司,研发团队成员主要来自于中科院,董事长陈天石曾任中科院计算所研究员。作为AI芯片领域的独角兽,寒武纪曾与华为携手打造全球首款手机AI芯片,近年来通过专注打造云端产品线构建技术壁垒。
地平线
国内车载芯片领头羊。地平线成立于2015年,是一家注重软硬件结合的AI创业公司,致力于开发边缘AI芯片及相关解决方案,由Intel、嘉实资本、高瓴资本领投。
提出嵌入式AI芯片架构BPU,坚持“芯片+算法+工具链”完整解决方案。2017年12月,地平线自主设计研发了中国首款嵌入式人工智能视觉芯片——旭日系列和征程系列,基于自研BPU架构,通过软硬结合打造极致性能。目前,地平线是业界唯一能够提供覆盖从L2到L4全场景整车智能芯片方案的人工智能平台型企业。
海光信息
海光信息基于通用GPGPU架构,推出深度计算处理器DCU,其DCU协处理器全面兼容ROCm GPU计算生态。
据悉,ROCm和CUDA在生态、编程环境等方面高度相似,CUDA用户可以以较低代价快速迁移至ROCm平台,因此ROCm也被称为“类CUDA”,主要部署在服务器集群或数据中心,为应用程序提供高性能、高能效比的算力,支撑高复杂度和高吞吐量的数据处理任务。
目前公司的系列产品“深算一号”已经实现商业化应用,主要应用于大数据处理、人工智能、商业计算等应用领域。海光DCU系列产品已于2021年实现商业化应用。
燧原科技(腾讯系)
燧原科技成立于2018年,公司创始人赵立东曾任紫光通信科技集团有限公司副总裁、AMD计算事业部高级总监;COO张亚林曾任AMD资深芯片经理、技术总监。
邃思2.0是迄今中国最大的AI计算芯片。公司成立以来,已相继推出云端AI训练芯片邃思1.0/2.0、云端AI训练加速卡云燧T1x/T2x和AI推理加速卡云燧i1x/i2x,以及配套的“驭算”软件编程平台TopsRider和“鉴算”推理加速引擎TopsInference。公司2021年在世界人工智能大会期间发布的邃思2.0是迄今中国最大的AI计算芯片。
昆仑芯(百度系)
昆仑芯成立于2011年,前身为百度智能芯片及架构部,于2021年4月完成独立融资。公司团队成员多数成员来自百度、高通、Marvell、Tesla等行业头部公司,22年完成A轮融资。
百度基于自研XPU架构,致力打造通用AI芯片,赋能互联网、工业制造、智慧金融、智慧交通等多个领域。百度从2011年开始就基于FPGA实现AI加速公司于2018年正式开始AI芯片研发并在2020年实现昆仑芯1代芯片大规模部署,2021年8月昆仑芯2代产品实现量产。
平头哥(阿里系)
平头哥成立于2018年,由阿里全资收购的中天微与达摩院芯片研发团队合并而来,公司技术团队由原中天微、高通、AMD、华为海思等拥有丰富研发经验的人员构成。
作为拥有国内公有云市场最大份额的企业,阿里自研AI芯片投入最多、决心极大,致力于云端一体化芯片和AIoT芯片产品。2019年平头哥在云栖大会上发布AI推理芯片含光800,为TSMC12nm工艺制程,采用平头哥自研架构和达摩院算法,算力相当于10个GPU,性能峰值算力达820 TOPS。含光800 AI芯片专用于云端视觉处理,可在视觉图像识别/分类/搜索、医疗影像、城市监控等领域发挥作用。
景嘉微
中国第一家GPU制造商,景嘉微2015年该公司推出了第一代GPU,称为JM5400,采用65nm CMOS工艺制造;2018年8月,景嘉微推出第二代产品JM7200,主要应用于商务台式机;2021年12月,公司推出第三代14nm高性能GPU—JH920,该芯片采用14nm工艺,支持OpenGL4.0、OpenCL 3.0、Vulkan 1.1等。关键指标上,JH920像素填充率为32G Pixels/s,FP32浮点性能为1.5Tflops,功耗为30W。
旗下全资子公司景美JM7201芯⽚和标准显卡已成为主要国产整机型号的基本配置,并在金融、电力、轨交、教育等众多⾏业实现规模应⽤。
龙芯
2022年7月19日,新一代龙芯3号系列处理器配套桥片7A2000正式发布,完成了GPU驱动、显示需求和系统配套组件的研发,可满足日常桌面办公使用需求,提高产品性价比和商业竞争力。
GPU核心频率达到400-500Mhz,基于OpenGL 2.1和OpenGL ES 2.0规范实现,集成DDR4显存控制器,显存频率达到2000Mhz-2400Mhz,最大支持16GB,典型分辨率1920X1080@60Hz 最高支持2560x1440@30Hz,glmark2性能超过300 fps,glxgears 性能超过1800 fps。
龙芯中科透露,目前已启动第二代龙芯图形处理器架构LG200系列图形处理器核的研制。
兆芯
在核显级GPU领域,兆芯2019年发布了兆芯KX-6000,其核显与S3的C645规格和性能类似,甚至连驱动都能共用,3Dmark成绩为250分左右,当时集成的是C-960 GPU。
芯动科技
2021年11月正式发布了其用于服务器和桌面应用的风华一号GPU。它率先实现5-10TFLOPS的渲染能力,率先实现图形API支持超过OpenGL 4.0等;
2022年8月,芯动科技又推出了针对于桌面市场的“风华2号”GPU,“风华2号”渲染能力突出,GPU像素填充率48GPixel/s,FP32单精度浮点性能1.5TFLOPS,AI运算(INT8)性能12.5TOPS,实测功耗4至15W,支持OpenGL4.3、DX11、Vulkan等API;
目前“风华3号”已基本完成研发,将为国内用户提供超大算力光追等酷炫性能。
天数智芯
2021年3月31日,上海天数智芯对外正式发布了7nm的天垓100芯片及天垓100加速卡,实现了国内通用GPU从0到1的突破。天数智芯其首款7nm制程的云端推理通用GPU产品“智铠100”,该芯片已于今年5月点亮,将于2022年第四季度正式发布,年底量产。
2022年5月8日,天数智芯第二款产品7nm云边推理芯片“智铠100”成功点亮,产品迭代开发和商业应用领先国内同行。
摩尔线程
在短短18个月内,就发布了全新统一系统架构MUSA和全能GPU产品“苏堤”等系列新品。
基于MUSA统一系统架构GPU苏堤,摩尔线程推出了第一代桌面级显卡MTT S60,它采用12nm制程,包含2048个MUSA核心,单精度算力最高可达6TFlops;以及面向数据中心级多功能GPU产品MTT S2000,MTT S2000采用12nm制程,使用4096个MUSA核心。
登临科技
2020年6月,登临科技Goldwasser系列产品在台积电12nm工艺上Full Mask 量产成功。包括边缘计算产品 Goldwasser UL,功率25-35W,INT8 算力 32-64TOPS;半高半长的服务器计算卡 Goldwasser L,功耗 40-70W,提供 128-256TOPS 算力;另有一种全高全长的 Goldwasser XL,输出 512TOPS 算力。
沐曦
2022年1月,沐曦首款7nm工艺的异构GPU产品启动流片,预计将于2023年初实现规模量产。
沐曦致力于为异构计算提供安全可靠的通用GPU芯片及解决方案,推出MXN系列GPU(曦思)用于AI推理,MXC系列GPU(曦云)用于AI训练,以及MXG系列GPU(曦彩)用于图形渲染,满足数据中心对“高能效”和“高通用性”的算力需求。
壁仞科技
2022年8月10日,壁仞科技就推出了首款通用GPU产品BR100系列,采用7nm制程,并创新性应用Chiplet与2.5D CoWoS封装技术,创出全球算力纪录。据透露,其16位浮点算力达到1000T以上、8位定点算力达到2000T以上,单芯片峰值算力达到PFLOPS级别,以“每秒1千万亿次的计算”算力纪录,超过了英伟达目前在售的旗舰计算产品A100 GPU的3倍,强势对标英伟达H100。
瀚博半导体
去年,瀚博半导体发布了面向云端的通用AI推理芯片SV102芯片,其特点是推理性能高(单芯片INT8峰值计算能力200TOPS,还支持FP16/BF16数据类型),延迟低,视频解码性能。支持64路1080p(解码格式支持H.264、H.265、AVS2)。
芯瞳半导体
2020年8月,芯瞳半导体第一代GPU芯片GenBu01问世。enBu01显卡平均功耗3W,为应用提供超长续航能力,满足对功耗有特殊需求的场景;满足国产操作系统2D显示、3D渲染需求,支持OpenGL 4.3图形标准、1080P高清显示、多窗口显示、具有VGA和HDMI双路显示输出接口等,集成1GB DDR3存储等。
据悉,芯瞳半导体的第二代芯片正在研发阶段,预期2023年完成市场化应用。
智绘微
2020年10月,智绘微电子成功推出第一款GPU芯片IDM919。采用高性能SIMT指令实现架构和可编程统一着色器架构,不仅可用于2D和3D图像渲染,也可以用于高性能计算等。
经过最新一轮的融资后,智绘微电子将提升旗下第二代GPU芯片IDM929流片进度和第三代GPU芯片IDM939的研发进度。
结语
近年来,国内虽然有不少国产GPU加速芯片及AI芯片厂商,比如壁仞科技、沐熙集成电路、摩尔线程、海光信息、寒武纪等,但是在整体的性能上与NVIDIA和AMD仍有较大差距,无法替代这部分的市场需求。虽然对于这些国产AI芯片厂商来说,美国的新的AI芯片限制政策是一个利好消息,但是对于国内依赖于高性能AI芯片提供AI硬件的厂商、以及提供AI服务的互联网厂商及一些AI技术厂商来说则是一个利空,毕竟如果缺少了强大的AI芯片的支撑,那么其AI技术的发展及所能够提供的AI服务也将受到负面影响。
受该传闻影响,今天A股市场AI芯片概念股集体大涨,海光信息开盘大涨6.23%、寒武纪开盘大涨6.76%、景嘉微开盘大涨5.18%。AI服务器厂商浪潮信息则开盘跌停。
参考资料:
1、传美国将升级对AI芯片出口限制:NVIDIA A800/H800也将受影响?芯智讯
2、AI“军火商”英伟达赢麻了,但其最强大的“武器”对中国禁售!自主可控新鲜事
3、美媒:美国考虑对华出口AI芯片实施新限制 半导体产业纵横
4、中国AI芯片企业的追击(深度) 计算机文艺复兴
Copyright © 2005-2021 网信安全世界版权所有