NEWS
AI玩具机器人、儿童益智玩具等最新动态

AI玩具市场爆发 语音交互成主要突破口

日期:2025-08-18 作者:AI玩具汇



在AI大模型飞速发展的当下,AI玩具正以破竹之势席卷全球玩具市场,成为行业创新的新焦点。大量AI玩具产品在2024年下半年面市,今年春节后更是迎来爆发式增长,电商平台数据显示,一家公司的AI玩具一天内销售额就突破52万元,拼多多上6家以上的店铺AI玩具销量也已超百万件。

在这场AI玩具增长热潮中,芯片方案作为AI玩具产业链的重要一环,有望收获业绩增长新机会。各大芯片厂商、模组厂商也敏锐捕捉到这一市场机遇,开始积极布局。AI给玩具具体带来了哪些突破性的新功能,AI玩具将需要哪些芯片,现在能提供AI玩具芯片方案的有哪些企业?本文将进行详细分析。

市场十倍扩容,AI玩具未来十年持续爆发

AI玩具市场正经历着前所未有的爆发式增长,根据Frost&Sullivan和pmarket research数据,2023年全球AI玩具市场规模为132.5亿美元,2024年市场增速超36%,到2028年这一市场规模有望增长至253.3亿美元,年复合增长率高达15%。

美国著名分析师Harry S.Dent,Jr曾表示,”一项新技术或者一个新兴产业,在渗透率达到10%之前被称之为导入期。“如今AI玩具的发展已从导入期进入爆发期,数据显示2023年AI玩具渗透率已进入12%

根据技术创新扩散理论,当技术渗透率达10%-20%且年增速超30%时,标志进入爆发期。由此可见,AI玩具行业的爆发不会在这短短的几年内结束,未来十年都将持续处于爆发期。

美国是全球第一大玩具市场,AI玩具技术发展相对较早。而中国去年才进入AI玩具发展元年,尚处于市场早期,AI玩具市场规模有望实现更快速的增长,且美国儿童每年人均玩具消费额比中国儿童多6倍,2025年一季度中国智能玩具出口额同比大幅增长35%,俄罗斯、东南亚、美国成主力市场,未来中国AI玩具出口市场空间非常广阔。

AI玩具实则是“AI+玩具”的融合创新产品。它的爆发得益于生成式AI技术,大语言模型的快速发展以及边缘计算芯片的普及。2022年底OpenAI发布ChatGPT之后,不到一年,国内就涌现了大量新AI大模型,数量高达238个。

在过去玩具更多只是功能型产品,而接入AI大模型后,玩具升级为能答疑、能对话、能陪玩的“情感互动型”产品,这使得AI玩具的毛利率从传统玩具的20%迅速提升至60%-70%,成为盈利超高的新赛道。所以,现在AI玩具定价为普通玩具几倍到几十倍不等。

在应用领域方面,教育场景的AI玩具需求也在快速飙升,AI编程机器人、AR互动教材等产品已切入早教市场,为多家头部企业贡献超20%的营收,毛利率高达40%以上。知名品牌学而思已推出99元AI编程机器人,在拼多多平台上“识字神器”月销超20万单。

虽然玩具最大的目标群体是儿童和青少年,但AI为玩具注入情感交互能力后,AI陪伴型的玩具在成人也广受欢迎。数据显示,具备声音复刻功能的AI玩偶复购率达28%,某创新产品3个月销量破10万,短视频平台每月销售额破千万。

政策上,教育部也在北京、上海等10城试点“AI教育玩具进校园”的计划。产业链上,上游芯片和模组厂商也陆续推出应用在AI玩具中的解决方案,降低硬件厂商在端侧部署高性能AI的门槛。这些因素都在驱动AI玩具市场持续爆发。

我爱音频网持续关注AI玩具行业的发展。作为专注音频行业的媒体,我爱音频网一直致力于为行业、品牌和消费者之间搭建沟通的桥梁,助力AI音频市场健康稳定发展。

由我爱音频网主办的「2025亚洲AI音频大会」,定于2025年9月19日(周五)在深圳举行,届时将汇聚产业链上下游的企业和专业人士,展示行业内的创新成果与前沿思想,加强市场间的紧密合作,共同推进行业的持续发展和进步。

从基础语音对话向跳舞、游戏陪玩、高度拟人化、自主学习功能升级

“未来每个玩具都将是AI驱动的,就像今天的手机都具备摄像头一样。生成式AI让玩具不再是冰冷的塑料,而是能理解情感、激发创造力的伙伴。”黄仁勋表示。

的确如此,AI技术让原本功能单一乏味的玩具,焕发了更多趣味性、实用性、情感性的新功能。现在AI玩具的价格从百元左右到数千元,随着价格的升高,搭载的功能也逐渐升级。我爱音频网整理了目前热门的AI玩具产品,如下图所示:

基础款的AI玩具,可以通过AI大模型进行智能对话互动。如淘宝上售价399元的火火兔AI早教机器人,它就通过AI大模型实现AI对话、模仿爸妈音色讲故事、创作故事、记录前文对话内容进行连续对话的功能。

AI大模型对话时长更短、不支持声音克隆的基础版AI玩具,售价更低一些,如Folo Toy仙人掌,卖258元。

中端款的AI玩具,会在AI大模型对话功能的基础上,给玩具增加灵动双眼、情绪识别、手势识别、趣味打断、主动聊天,更高级一些的还有游戏、跳舞的功能。

例如比较热门的汤姆猫AI陪伴机器人,淘宝售价1499元。它有20多种表情,灵动的耳朵和灵动的双眼,向孩子传达玩具的不同情绪,从而进行情感互动;同一个问题,可以多次探讨;外语流利,可以让孩子在双语环境在对话交互。

接入ChatGPT的EMO PET机器人玩具,售价2888元。但它相比汤姆猫AI陪伴机器人,拥有更多的AI功能,比如AI绘画、飞行棋等游戏陪玩,还能跳各种舞蹈,配备的表情和动作有100+种,非常“活”。

高端款的AI玩具,是多模态驱动的情感交互载体。它通过多模态AI技术,将文本、语音、图像和情感等多种输入方式结合,能够实现高度拟人化地实时感知用户的情绪并作出回应。新一代近距离无线连接技术“星闪”,在多模态交互方面也具有独特的技术优势,它推动AI玩具从单机功能向多设备联动升级。

如高端市场的标杆级产品LOVOT Solo智能情感机器人,在拟人化情感交互方面,通过视觉感知、触觉反馈、语音交互多模态感知系统,实时识别小孩位置、面部表情及手势,并感知拥抱、对抚摸力度作出响应。

LOVOT在基础“快乐、悲伤、兴奋、恐惧”等基础情绪上,还能通过算法动态混合生成更复杂情绪,不同情绪状态还能与小孩互动,如孤独时主动靠近孩子并发出“哀鸣”声,具有高度拟人化的交互陪伴功能。

它还具有自主学习能力,可以通过学习家庭环境的构造,智能规避障碍物,记录儿童高频活动区域,优化移动路径。

主控芯片方案百花齐放,部分已获爆款AI玩具采用

AI玩具产业链上游为IP运营及软硬件供应,硬件包括芯片、传感器、扬声器、麦克风、电池等。

芯片方案是AI玩具发展的核心引擎,从底层架构到功能实现、功能升级,全方位驱动着AI玩具行业变革。在AI玩具当中,需要用到SoC系统级芯片、AI加速芯片、通信芯片、传感器芯片,电源管理芯片和存储芯片也是不能少的。无线通信芯片、3D视觉传感器等核心芯片的技术壁垒相对较高。

SoC系统级芯片通常会将MCU、音频处理、蓝牙无线连接等芯片集成到一颗芯片上,作为AI玩具的主控芯片。低功耗 SoC 芯片通过集成高算力异构计算单元与轻量化算法框架,可以实现高效本地 AI 推理能力。该技术大幅缩短中小厂商产品研发周期,将传统 AI 硬件开发所需的 5-8 个月时长,缩短至仅2周的极速交付。

现在AI玩具的主控方案主要有乐鑫科技ESP32系列、全志科技R128、炬芯科技ATS3703系列、杰理AC791N、博通集成BK7252N/BK7258、瑞芯微RK3576等。

乐鑫科技ESP32系列

乐鑫科技ESP32系列中应用于AI玩具的芯片主要是ESP32-P4和ESP32-S3。其中ESP32-S3搭载Xtensa LX7双核处理器,主频高达240MHz,具备向量指令加速功能,支持本地运行轻量化AI模型。并提供45个GPIO、USB OTG、SPI、I2S等接口,可以同时驱动摄像头、麦克风阵列、电机控制器,满足AI玩具的多模态交互需求。还支持更大、高速的八通道SPI闪存,以及高等级的安全防护功能。

字节跳动的“显眼包”AI玩具的主控方案就是采用乐鑫科技的ESP32-S3。为了抓住AI玩具市场的红利,乐鑫科技与字节跳动展开深度合作,双方联合发布了“AI+硬件智悦计划”,共同探索AI硬件在玩具领域的应用。此外,乐鑫科技还与火山引擎合作,推广豆包大模型在IoT设备的应用方案,为AI玩具智能化提供有力支持。还获OpenAI开源项目和微软IoT编程语言支持。

全志科技R128

全志科技R128是一款高度集成的无线音频主控芯片,它集成了RISC-V XuanTie C906 CPU、HiFi5 DSP、Arm® Star-MC1 MCU,具有强大的运算性能和AI语音交互能力。且集成了3个差分ADC和2个差分DAC,可支持麦克风阵列语音识别、立体声播放。还支持WLAN 2.4G+Bluetooth V5.0双无线通信协议,网络连接高效稳定。

在软件资源方面,全志科技R128通过接入先进的AI大模型,可以实现语音交互、情绪识别、连续对话以及中英双语互动等功能;还接入了喜马拉雅语音资源库,儿童可以使用上面万物百科、歌曲、童话故事等海量音频内容。

此前,我爱音频网详细拆解了爆款的“AI童伴 | 会说话的汤姆猫”玩具,在内部的主板上发现其主控芯片采用的就是ALLWINNER全志R128-S3芯片方案。这款AI玩具具有语音对话、多轮对话、中英互动、知识问答、学说话、讲故事、游戏互动、讲笑话等丰富功能。

炬芯科技ATS3703/ATS3503/ATS3603

炬芯科技很早便开始布局AI玩具市场,聚焦在儿童早教智能机器人领域,2016年、2017年推出ATS3503、ATS3603、ATS3703,覆盖低、中、高端应用场景。

ATS3503主攻WiFi故事机市场,在原有传统单机故事机的基础上增加了互联网的智能体验,同时加入了语音识别、智能联网等功能。而ATS3603则专注在绘本故事机市场,拥有语音识别、语音对讲等功能。

ATS3703定位更高端的市场,搭载了较强的智能语音技术、图像识别技术,集成四核CPU,具有独立的3D GPU,还有丰富的接口,可以帮助儿童机器人实现智能问答、语音控制、视频聊天功能,并支持人脸识别、趣味拍照、Flash游戏等功能,具有更高级的智能交互体验。据我爱音频网了解,“巴巴腾”、“智伴1S机器人”、“鲁奇亚陪伴机器人X7”三款儿童机器人均采用的是炬芯科技上面的主控芯片方案。

杰理AC791N系列

杰理科技也有丰富的芯片方案支持AI玩具。官网显示,杰理科技有针对双语学习机市场应用的AC7911BA、AC7911BB、AC7916AB芯片方案,可以支持在线阅读、英文儿歌和国学名著播放、WiFi蓝牙二合一、支持大尺寸彩屏显示、支持离线在线两种模式。AC7911BB芯片方案也适用于绘本故事机,内置有语音功能,支持语音识别算法。现在一些毛绒AI玩具也开始采用杰理的AC791N系列主控方案。

博通集成BK7252N/BK7258

BK7258是一款高度集成的单频支持2.4GHz WiFi6和蓝牙5.4连接的主控方案,采用32位ARM MCU处理器。BK7252N是一款Wi-Fi Audio/Video SOC芯片,集成MCU + CODEC + WIFI + Bluetooth® Low Energy 4.2,可以应用于绘本智能机器人。博通集成与奥嘟比携手,将火山引擎豆包AI大模型融入玩具,搭载这两款芯片推出玩具AI智能套件,实现了设备端实时低延迟的语音大模型交互,为玩具赋予“思考”的能力。

瑞芯微RK3576、RK1808、RK2108

RK2108集成NPU神经网络单元,支持手势识别、情感反馈等复杂交互,具有低成本优势,是入门级智能玩具的首选方案。RK1808覆盖从基础交互到高阶AI功能的智能终端市场需求,集成NPU神经网络单元,支持手势识别、情感反馈等复杂交互,成本也相对较低,适用入门级智能玩具。

去年三月,瑞芯微推出新一代AI玩具主控方案RK3576。今年瑞芯微将这款创新方案带去CES大展上重点推广。RK3576方案性能上有不小的升级,速度提升了2.5倍,支持Google GTV,最高支持8K 30FPS视频解码和基于AI面部和语音识别的PTZ屏幕旋转;支持AI-PQ增强和声分离技术;内置有大语言模型;双独立显示器,为用户提供了多屏体验,总体可实现视频通话、远程看护、远近场语音交互、AI数字人、表情机器人等多种AI智能功能。

在政策红利、大模型降本、芯片技术升级的三重驱动下,AI玩具市场有望持续保持高增长,低价传统玩具在AI技术加持下将摇身一变几百块到几千块,随着AI玩具从大模型对话基础功能向跳舞、游戏陪玩、情绪识别等高度拟人化功能升级,消费者对高价情感AI玩具也表现了更高的买单意愿。

芯片方案是决定AI玩具功能差异化的关键。但布局也不能激进,硬件厂商需要找准差异化的方向,现在AI玩具基本都接入的相同AI大模型,基础功能上同质化较高,上述提到的一些高度拟人化的功能,技术可行性仍较低,如何更好提升AI玩具体验,需要芯片厂商进一步深入思考。