您现在所在的位置: » ag体育真人>ag体育网投平台>皇冠现金下注,Cadence国内展示两款AI芯片IP,瞄准自动驾驶/安防/AI语音

皇冠现金下注,Cadence国内展示两款AI芯片IP,瞄准自动驾驶/安防/AI语音

2020-01-09 15:25:36 阅读量:4897

皇冠现金下注,Cadence国内展示两款AI芯片IP,瞄准自动驾驶/安防/AI语音

皇冠现金下注,智东西(公众号:zhidxcom)文 | 心缘

智东西11月13日消息,今天,全球芯片及电子系统设计自动化(eda)软件巨头cadence首次在国内发布tensilica系列的两款新品: tensilica dna 100处理器ip和tensilica hifi 5音频/语音数字信号处理器ip。此前,dna 100于9月19日在德国发布,hifi 5 dsp于10月31日在美国发布。

其中,tensilica dna 100是cadence首款深度神经网络加速器ai处理器ip,将于今年12月向部分客户提供,预计明年第一季度全面上市。tensilica hifi 5 dsp是cadence首款为高性能远场处理和ai语音识别处理量身优化的ip核,在基于神经网络的语音识别算法上提供高达4倍的改进。

cadence公司ip事业部tensilica资深产品总监lazaar louis、cadence公司ip事业部tensilica技术营销总监yipeng liu来到中国,与cadence公司亚太区ip业务总监陈会馨一同介绍了两款新品。

tensilica dna 100处理器是cadence首款深度神经网络加速器(dna)ai处理器ip,具有灵活可扩展的特点,能够满足小到0.5大至数百teramac(tmac)的各种需求的扩展,为终端侧(on-device)ai提供高性能与高能效。

以汽车动力等应用为例,汽车拥有大量传感器,包括雷达、摄像头、激光雷达和超声波等,对推理性能需求越来越高。标准dsp主要用于做信号处理,而数据相关任务将被移交给神经网络加速器,比如dna 100就负责处理感知和决策制定任务。

cadence表示,较其他采用相似阵列尺寸大小的乘法累加运算(mac)解决方案,dna 100处理器性能提升达4.7倍,在功率方面每瓦特性能提升高达2.3倍。

神经网络(nn)的特征在于权重和激活的固有稀疏度,加载和乘以零会造成其他处理器中不必要的mac消耗。

dna 100处理器的专用硬件计算引擎移除了上述两项任务,只计算非零激活和权重,利用稀疏度提高能效并降低计算量。

神经网络再训练有助于增加网络中的稀疏度,并通过dna 100处理器的稀疏计算引擎实现更高的性能。

dna 100处理器能够利用更小的阵列实现最大吞吐量。例如,在4k mac配置环境下,resnet 50推理性能预计能实现高达每秒2550帧(fps)和3.4tmac/w(在16nm工艺),而竞争对手只能达到每秒538帧。

dna 100处理器非常适用于自动驾驶汽车、adas、安防监控、机器人、无人机、ar/vr、智能手机、智能家居和物联网领域的设备端nn推理应用。

此外,dna 100处理器还配备了完整的ai软件平台,兼容最新版本的tensilica神经网络编译器,支持caffe、tensorflow等多种ai框架,cadence最近还宣布它将支持facebook的跨硬件平台机器学习编译器glow。

tensilica神经网络编译器利用一套全面优化的nn库函数,将任何nn映射为可执行和高度优化的高性能代码。因此,dna 100处理器具有支持分类、对象检测、分割、重复和回归等多种不同网络类型的软件生态系统。

dna 100处理器还支持android神经​​网络(ann)api,用于android设备中的设备ai推理。

dna 100处理器在所有nn层运行,包括卷积、完全连接、lstm、lrn和池化。单个dna 100处理器可以轻松地从0.5扩展到12个有效tmac,并可以通过堆叠多个dna 100处理器以实现数百tmac,可用于最计算密集型设备端的nn应用。

为了以防dna 100处理器内部硬件引擎当前不支持的新nn层,dna 100处理器还集成了tensilica dsp,同时使用tensilica指令扩展(tie)指令提供tensilica xtensa核心的可扩展性和可编程性。

由于dna 100处理器拥有独立的直接存储器访问(dma),因此无需新增控制器即可运行其他控制代码。

dna 100处理器将于2018年12月面向部分客户提供,预计2019年第一季度将全面上市。

tensilica hifi 5音频/语音数字信号处理器(dsp)ip是 cadence tensilica hifi dsp系列的新品,也是cadence首款为高性能远场处理和ai语音识别处理量身优化的ip核,该产品主攻市场有智能家居、汽车车载、蓝牙耳机等。

与hifi 4 dsp相比,这款hifi 5 dsp为音频处理提供了2倍的计算能力,为nn处理提升了4倍的计算能力。

tensilica hifi dsp系列是全球最广泛使用的音频/声音/语音处理器,截至目前在全球有超过125家生态合作伙伴,tensilica hifi dsp每年出货量超过10亿。

hifi 5 dsp的关键特性包括:

1、采用5个超长指令字(vliw) 插槽架构,支持每循环发布2个128-bit负载。

2、对比hifi 4 dsp,预处理和后处理的mac性能提高2倍,包括支持每周期8个32×32-bit macs或16个16×16-bit macs,可选每周期8个单精度浮点macs。

3、对比hifi 4 dsp,nn处理mac性能提高4倍,包括每周期32个16×8或16×4 macs、可选每周期16个半精度浮点macs。

4、全新hifi nn库为nn处理(尤其是语音任务)提供了一组专门优化的库函数。这些库函数可以轻松集成到主流机器学习框架中集成。

5、完全兼容hifi产品线拥有的超过300个hifi优化的音频语音编解码器以及语音增强软件包。

此外,cadence还会提供tensilica hifi dsp nn库等一系列软件。

随着语音助手的普及,语音控制用户界面对智能产品制造商们愈发重要,他们需要更先进的dsp算法以消除噪音并隔离扬声器的声音干扰。此外,因为对延迟、隐私问题的担忧,基于神经网络的语音识别算法更多是在本地而非云端来执行任务。

为了应对在能耗敏感型设备上搭载nn远场处理和语音识别算法带来的计算挑战,ambiq micro成为cadence hifi 5 dsp的第一家被授权方。

结语:边缘计算升温带动行业智能

在ai的浪潮之下,边缘设备的ai处理器应用快速增长,但更低的延迟、更好的隐私、更快的处理速度、更自然的语音ui交互等各种越来越高的需求正在增加设备上的处理工作负荷。

针对智能产品滋生的痛点,cadence正在以其独特的优势深入ai市场,为围绕着视觉和语音处理的边缘ai推理和应用提供更多底层的助力,在ai行业中扮演越来越重要的角色。