使用“扫一扫”即可将网页分享至朋友圈。
Imagination 推出性能达 600 TOPS 终极
曾经统治手机GPUIP市场的Imagination,历经变动之后,目前在移动GPUIP市场占有率有36%,汽车GPUIP市占率43%。近来,Imagination近期发布的一系列新品不仅是其实力的展现,也足以让同行们增加对这位老对手的关注。11月13日,Imagination发布了耗时两年研发的最新的第三代神经网络加速器(NNA)产品IMGSeries4,其全新的多核架构可提供600TOPS(每秒万亿次操作)甚至更高的超高性能,主要面向先进驾驶辅助系统(ADAS)和自动驾驶应用。以低功耗产品见长Imagination推出高性能的终极AI加速器,会给在自动驾驶汽车芯片市场占有领导地位的Nvidia多大的冲击?耗时两年打造的终极AI加速器Imagination在AI火热的2017年推出首代神经网络加速器(NNA)PowerVR2NX,单核性能从1TOPS到4.1TOPS。紧接着,2018年PowerVR3NX发布,单核性能从0.6TOPS到10TOPS,多核产品性能从20TOPS到160TOPS。性能增强的同时,Imagination的NNA主要面向的市场也从2NX时的移动设备和汽车市场,进一步拓展到智能相机监控、消费电子(尤其是数字电视)、低功耗IoT智能设备领域。时隔两年之后,Imagination才推出第三代NNA产品4NX。4NX系列的单核性能进一步提升,每个单核能以不到1瓦的功耗提供12.5TOPS的性能。相比前两代NNA,新一代产品强调的是全新多核架构,这个新的多核架构支持在多个内核之间对工作负载进行灵活的分配和同步,从而实现更高性能。ImaginationTechnologies产品管理部门总监GilbertoRodriguez介绍,“我们的软件提供了精细的控制能力,并通过对多个工作负载进行批处理、拆分和调度而提高了灵活性,可以在任意数量的内核上使用。Series4可为每个集群配置2个、4个、6个或者8个内核。1个8内核的集群可以提供100TOPS的算力,配有6个8核集群的解决方案就可以提供600TOPS的算力。”据悉,在AI推理方面,Series4NNA的性能比嵌入式GPU快20倍以上,比嵌入式CPU快1000倍。至于为什么要推出如此高性能的AI加速器,GilbertoRodriguez表示,“ADAS和自动驾驶对芯片有很高的算力需求,比如L2+的驾驶员检测或语音/手势控制需要10TOPS的性能,L3-L4级别的自动驾驶有50-100TOPS的性能需求,L5级别的自动驾驶性能需求超过500TOPS。”“虽然市场上已经有满足自动驾驶需求的AI芯片,但功耗不够理想。所以,我们花两年时间去了解和评估客户需求,基于我们的前两代低功耗的产品,推出了高性能低功耗的4NX系列产品,并且将自动驾驶作为主打市场,也可以应用于数据中心和桌面级GPU。”ImaginationTechnologies视觉和人工智能部门高级总监AndrewGrant表示。600TOPS的高性能如何兼顾低功耗?需要指出的是,4NX系列的8内核集群要实现100TOPS的性能,超过30TOPS/Watt的性能功耗比,以及超过12TOPS/mm^2的性能密度是要在5nm节点实现。GilbertoRodriguez也提到,如果要用多个集群实现更高算力,Imagination可以提供多集群的协同机制,但也需要客户在应用层进行一些设计。多核灵活架构带来的可扩展性让4NX可以实现高性能,但对于高性能芯片而言,功耗的控制也非常关键,特别是AI芯片。AI芯片需要处理大量的数据,并且数据的搬运耗费的功耗远大于数据处理,因此,高性能AI芯片必须想办法尽量减少数据的搬运,同时降低延迟和节省带宽。对于延迟的降低,Imagination采用的方法是单核组成2核、4核、6核或8核的多核集群中,所有内核可以相互协作,并行处理一个任务,降低处理延迟,缩短响应时间。当然,集群中和多核既可以共同执行一个批处理任务,也可以分别运行各自不同的网络,也就是各个内核能够独立运行。核数的增加带来性能提升的同时降低延迟不同的核独立运行4NX更大的亮点在于其节省带宽的TensorTiling(Imagination’sTensorTiling,ITT)技术,这是Imagination正在申请专利的技术,也是4系列中新增的功能。TensorTiling技术利用本地数据的依赖性将中间数据保存在片上存储器中,最大限度地减少将数据传输至外部存储器,相比上代产品,将带宽降低多达90%。具体而言,神经网络的多层以融合内核的形式运行在加速器的硬件流水线里,融合内核之间的特征图(FeatureMap)需要通过外部存储进行交换。Tiling技术是充分利用紧耦合的SRAM来融合更多的层,更多的层被融合之后,就减少了需要通过外部存储交换的特征图,进而达到提升效率,节省带宽的目的。还需要说明一下TensorTiling技术中的批处理和拆分,批处理是分配适合批处理的大量的小型网络任务到每个独立工作的NNA单核,能够提升并行处理能力。拆分则是任务在多个维度被拆分,所有NNA单核共同执行一个推理任务,减少网络推理延迟的同时,在理想情况下协同并行处理的吞吐量与独立并发处理的相同,非常适合网络层很大的网络。当然,TensorTiling的拆分是通过Imagination提供的编译器来完成,不需要开发者手动完成,并且利用NNA的性能分析工具能够对AI任务进行更好地调度和分配。那TensorTiling在节省带宽的同时能否减少数据的搬移?GilbertoRodriguez对雷锋网(公众号:雷锋网)表示,“答案是肯定的。一方面,TensorTiling让待处理数据通过内存带宽的传输减少,另一方面,重复利用的神经网络权重给处理器核的传输次数也减少,这让就可以有效减少数据搬运。”硬件上层的工具链方面,Imagination的离线和在线工具组成的工作流程可以让开发者更快实现部署。Nvidia在自动驾驶领域将迎来新对手?Nvidia在2015年就推出了车载计算平台,此后持续迭代,目前在自动驾驶芯片市场已经处于优势地位。不过,擅长桌面级GPU的Nvidia能够提供高性能,但功耗可能对于电池供电的电动汽车不够友好。这也是在对功耗要求比较严格的移动端有优势的Imagination的机会所在。与Nvidia有所不同,Imagination是IP提供商,并不会直接提供芯片。因此,Imagination可以与领先的汽车行业颠覆者、一级供应商、整车厂(OEM)和汽车系统级芯片(SoC)厂商合作,推出有竞争力的产品。为了帮助合作伙伴更好进入这一市场更快推出车规级产品,此次推出的NX4还包含IP级别的安全功能且设计流程符合ISO26262标准。ISO26262是旨在解决汽车电子产品风险的行业安全标准。新推出的4系列NNA可以在不影响性能的情况下,安全地进行神经网络推理。硬件安全机制可以保护编译后的网络、网络的执行和数据处理管道。AndrewGrant透露,已经开始提供授权,并将于2020年12月在市场上全面供应。授权的客户目前已经不止一家。这就意味着,自动驾驶芯片市场将会迎来更多有竞争力的产品。雷锋网认为,Imagination更强的GPU和NNA产品组合将会帮助更多想要进入这一市场的公司推出更有竞争力的产品。上个月,Imagination发布了最新一代的IMGB系列高性能GPUIP,这款多核架构GPUIP4个系列内核有33种配置。更通用的GPU和更专用的AI加速器,显然可以给高性能计算带来更多的选择。有意思的是,Nvidia目前也拥有性能强劲的GPU和AI加速TensorCore的组合。ABIResearch预计,到2027年左右,对ADAS的需求将增长两倍,但汽车行业已然将目光投向了更远的全自动驾驶汽车和自动驾驶出租车,从L2和L3级ADAS向L4和L5级全自动驾驶演进的过程中,高性能、低延迟和高能效的结合将是关键所在。巨大的市场机会之下,两家芯片产品优势类似的公司,会如何竞争?
“广东财经网”的新闻页面文章、图片、音频、视频等稿件均为自媒体人、第三方机构发布或转载。如稿件涉及版权等问题,请与
我们联系删除或处理,客服邮箱1098101642@qq.com,稿件内容仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同
其观点或证实其内容的真实性。
- 声音提醒
- 60秒后自动更新
【民政部回应何时恢复婚姻登记】民政部社会事务司二级巡视员杨宗涛表示,婚姻登记场所是人群聚集场所,部分地区暂停婚姻登记工作是对人民群众安全负责。未停止登记的地方推广用电话、网络、qq群预约登记,控制登记人数,分批分段登记,减少人员聚集和在登记机关停留时间。已停止婚姻登记地方将根据当地疫情控制情况逐渐恢复。
15:54欧洲央行副行长金多斯:欧洲央行还没有达到逆转利率。宽松政策的副作用更明显了。
15:54财经网站Forexlive分析师Justin Low评瑞士1月CPI月率:尽管通胀年率保持稳定,但核心通胀率有所下降,这一点令人更加担忧。这只是进一步巩固了瑞士央行维持现有货币政策不变,并可能在未来寻求更多宽松措施的观点。
15:54【武汉两大批发市场商户开业率超过80%】商务部市场建设司司长朱小良10日称,目前武汉生活必需品供应基本正常,除冷鲜肉、鲜叶菜等少数品种存在结构性短缺外,大部分重要生活物资供应充足,未发生明显抢购或脱销断档情况。当地白沙洲和四季美两大批发市场正常营业,商户开业率超过80%,日交易量上升至3000吨以上。(国是直通车)
15:53【日本2019年经常项目顺差增长4.4%】日本财务省10日发布的国际收支初步统计报告显示,主要受外国人入境游消费扩大影响,2019年日本经常项目顺差增长4.4%。报告显示,2019年日本经常项目顺差为20.06万亿日元(1美元约合109.8日元)。其中,商品贸易方面,由于液化天然气价格下跌等因素,进口下降5.6%至75.56万亿日元;由于汽车部件及钢铁等产品出口减少,出口下降6.3%至76.12万亿日元。货物贸易顺差减少53.8%,为5536亿日元。(新华社)
15:53欧元兑美元EUR/USD短线波动不大,现报1.0952。
15:53瑞士1月CPI年率:0.2%,前值:0.2%,预期:0.1%;瑞士1月CPI月率:-0.2%,前值:0%,预期:-0.2%。
15:52英镑兑美元GBP/USD短线走低13点,现报1.2890。
15:52【宁德时代“供电”国产特斯拉 有望拉低售价20%】全国乘联会秘书长崔东树分析认为,“随着特斯拉国产化率提升和产能爬坡,未来特斯拉国产车型的价格下探空间还是很大的。”他预计今年下半年,国产Model 3车型的售价就有望降至25万元,降幅接近20%。(新京报)
15:51【内蒙古:对不裁员或少裁员企业返还上年度50%失业保险费】据内蒙古新型冠状病毒肺炎疫情防控工作指挥部消息,疫情期间,内蒙古对不裁员或少裁员的企业返还上年度实际缴纳失业保险费的50%,对面临暂时性经营困难的中小企业,返还标准提高到上年度6个月企业及其职工缴纳社会保险费的50%。
15:51【商务部:2019年服务进出口总额54152.9亿元 同比增长2.8%】商务部新闻发言人表示,2019年,在服务贸易创新发展试点等政策的激励下,我国服务贸易总体保持平稳向上态势,逆差明显下降,结构显著优化,高质量发展成效初步显现。全年服务进出口总额54152.9亿元(人民币,下同),同比增长2.8%。其中,出口总额19564.0亿元,同比增长8.9%;进口总额34588.9亿元,同比减少0.4%。(第一财经)
15:51【振华股份:疫情导致下游客户开工推迟 产品库存上升】振华化学公告,公司目前生产经营稳定,所有产能均正常开工,原材料采购能基本满足生产需要,由于疫情导致下游客户开工推迟,公司出货量减少,产品库存有所上升。公司将根据客户需求、疫情及市场变化,适度调整生产经营策略,尽可能保持生产经营的稳定。
15:50环旭电子2月10日晚间公告,公司2020年1月合并营业收入为23.27亿元,较去年同期的合并营业收入减少27.83%,较2019年12月合并营业收入环比减少37.23%。
15:49精测电子:与京东方集团签订了多份销售合同,合同累计金额达到6.96亿元。
17:12华夏银行:银保监会同意本公司在全国银行间债券市场发行不超过100亿元人民币的金融债券,募集资金全部用于绿色信贷。
17:03