启英泰伦推出第三代智能语音芯片：实现端侧自然语言处理，覆盖端云融合语音应用

2022-08-01 10:25:35 互联网

7月28日下午，人工智能（AI）语音芯片公司「启英泰伦」发布第三代智能语音芯片，包括CI130X和CI230X两大系列，内置第三代自研技术平台BNPU（脑神经网络处理器），广泛覆盖高性能、低成本端侧语音和端云融合语音等应用。

BNPU作为启英泰伦构建智能语音芯片产品的底层核心，如今已升级到第三代，除了延续其在二代语音识别ASR、声纹识别等方面的技术优势外，还支持单麦深度学习降噪技术、命令词自学习2.0版本。

更重要的是，它实现了两大核心技术突破，一是增加了离线自然语言语义处理，支持离线NLP；二是增加双麦深度人声分离技术，无需记住任何命令词，同时具备识别能力和理解能力，支持用户以自然的方式随心和设备交互。

启英泰伦的产品+技术演进路线

与上一代产品相比，第三代芯片拥有更高算力、高度集成、性能新高三大特点。

· 算力方面，CI130X系列芯片采用BNPU 3.0和支持DSP指令扩展的RISC CPU双核架构，主频为240MHz，拥有更灵活的计算性能、更强的可编程性，支持高并行向量运算，同时还有640KB系统SRAM。

· 集成度方面，该系列芯片集成了双路ADC、两路MIC接口、三路LDO以及常见的MCU通用接口等，可满足各类语音识别应用。

· 性能方面，第三代芯片几乎可以装载所有前端信号处理算法，支持端侧TTS（从文本到语音）。

CI1306芯片框图及应用

启英泰伦创始人兼CEO何云鹏谈道，语音设备的应用环节和场景十分复杂，不同设备工作的分贝强度也有所差异，既要普遍适应不同环境，也要适应不同用户的个性化表达方式和表达特点。

因此，第三代芯片根据不同应用和客户需求，将CI130X和CI230X两大系列进行了系列化封装。

在语音处理能力上，CI1301、CI1302、CI1303系列支持离线远场语音识别，准确率超98%，支持更强的噪声适应和口音泛化能力，并支持语音降噪、深度学习降噪、回声消除、本地自学习等算法；CI1303和CI1306则在声源定位、波束成形、盲源分离等传统算法上增加了端侧NLP；CI2305和CI2306的语音处理能力分别与CI1302、CI1306相同，其中CI2306支持离线语音+在线语音+AIoT功能。

整体来看，第三代芯片解决方案不管是针对厨房烟机、扫地机器人等70dB以上的高噪环境，还是客厅电视类人声、会场、卖场等多人场景，都能实现良好的识别和适应性。

启英泰伦的第三代智能语音芯片特点

除此之外，启英泰伦为了帮助客户实现敏捷开发，加速产品落地，还推出了新一代语音AI平台，拥有在线开发、在线支持、在线资料、算法API接口四大模块，支持零代码开发、即时生成NLP模型、本地语音合成/开发等功能，并支持10000个用户同时开发。

启英泰伦语音AI平台框架

从2015年成立至今，启英泰伦直接或者间接服务的B端客户已超过5000家，平台开发者超过1万名，在校AI学员超过10万名，离线语音方案行业的年装机量则超过2000万，呈快速增长之势。

何云鹏提到，启英泰伦的发展战略分为三个阶段。在第一个阶段，首先解决自然的人机交互，“这是机器人发展的前提条件和基础，语音语言是最自然直接的交互方式。”他说，公司通过第一阶段努力，要让所有设备得到语音交互的升级，在设备终端就进行十分便捷的自然交互，让设备听得清、听得懂。

在第二阶段，则是让所有终端设备高度智能化，更好地为人们提供服务，其主要技术特征在于具备多模态感知交互，以及能够在端侧进行理解和决策，甚至还能自我成长学习。

随着机器人在人们生活中普及，也将进入到更高级的阶段，何云鹏将其称之为“守护精灵”。其技术特点是将智能语音从所有智能设备中抽象出来，成为人们日常生活的全方位管家、百科老师、健康卫士，甚至是知心朋友。“我们的终极目标是打造跨设备、跨时空，打破虚拟世界和现实世界壁垒的产品。”他说。