炒股就看,权威,专业,及时,全面,助您挖掘潜力主题机会!
(来源:雷峰网)
“美国VC正全力押注「Physical AI」,他们将当前视为AI硬件的「iPhone时刻」。”
作者丨席星
编辑丨刘伟
“在硅谷,创业者们在垂直场景里挖掘真实需求。而在国内,一个陪伴概念火了,立即涌出几百个模仿者。”腾展科技创始人魏松祥(Steve Wei)道破了中美AI硬件创业的本质差异。
这位亲历WebEx从创业到32亿美元收购的连续创业者,如今在AI翻译硬件领域找到了新的战场。在他看来,中美市场的分化正愈发明显:美国创业者深耕企业级市场,中国团队狂卷消费级赛道。
“做海外ToB业务,需要深度理解当地产业生态,这对中国企业来说是最高难度的挑战。”魏松祥坦言。这种认知差距直接反映在创新路径上——美国团队专注垂直场景的原创需求,而国内创业者大多陷入“概念复制”的跟风模式。
资本正在加剧这一趋势。美国VC将AI硬件视为下一个“iPhone时刻”,如今供应链成熟、开发成本可控,投资人甚至愿意为早期创意开出支票。这种热度从硅谷蔓延至全球,催生了AI硬件创业的黄金窗口期。
而开源大模型的普及正在重塑战局。“中国最好的模型是DeepSeek和通义千问,初创公司自研基础模型反而是固步自封。”魏松祥直言。这种技术平权让大小企业在算法层面站上同一起跑线,初创公司更应该把精力放在场景落地,而非重复造轮子。
在细分领域,AI硬件正展现出巨大潜力。目前美国医疗系统仍普遍采用人工翻译,每分钟成本超1美元,而AI翻译软件服务年费仅60美元,成本优势显著。
除了医疗,法律咨询、水电维修等场景同样存在跨语言沟通需求。不过魏松祥也强调,这些零散场景需要更精准的产品定位,深入理解当地生态成为出海企业的必修课。
热潮之下也有暗流涌动。录音卡片等品类虽在美国热卖,但同时也暗藏法律风险。而AI时代的产品定价逻辑也面临重构——传统SaaS包月制因“二八效应”失灵,分级收费成为必然。
面对五年的黄金窗口期,中国创业者需要清醒认识到:供应链优势终将消退,唯有深耕垂直场景,才能在AI硬件浪潮中站稳脚跟。
以下为雷峰网·鲸犀与Steve的对话内容,鲸犀做了不改变原意的编辑与整理。
01
AI硬件“iPhone”时刻已到,中美全力押注
雷峰网·鲸犀:中美在AI硬件创业上存在差异吗?
Steve:我今天刚参加了一场基金举办的行业会议,其中参会的七八家公司都在硅谷做AI硬件产品,了解之后觉得差异还是有的。在创业者认知上,美国团队更倾向于原创,他们基于自身经验洞察到独特的垂直场景来定义产品;而国内则更常见"跟风"模式,比如一个陪伴概念出现,就会涌现几百家相似的项目。
在商业模式的选择上,美国创业者更多聚焦企业级市场,软件和硬件都以ToB业务为主,而中国市场ToB业务规模相对有限,这种差异直接影响了创新路径。中国企业做海外ToC产品相对可行,通过电商平台销售就能快速验证需求,但若要切入海外ToB市场,则需要深入理解当地企业的运作方式,难度高了好几个量级。
在资本态度上,美国VC正全力押注"Physical AI",他们将当前视为AI硬件的"iPhone时刻",苹果手机刚出来时兴起了一股APP开发热潮,现在则是AI硬件开发潮。如今技术和供应链都已成熟,开发成本可控,投资人也更愿意下注,以前是什么公司都投一投,现在主要投AI硬件。
雷峰网·鲸犀:从“传译电话AI Phone”的纯软件服务,到如今推出AI翻译耳机,转型原因是什么?
Steve:转型的动因其实非常简单,就是我自己需要用到这类翻译产品。之前去医院做肠胃镜,面对复杂的医学术语,要么请人工翻译但价格偏贵,要么直接沟通但鸡同鸭讲。所以当AI翻译技术足够成熟的时候,我作为创业者第一反应就是需求有没有普适性,第二反应就是市场大不大。这两点确定了,那就开干。
公司最初的业务是通过“AI Phone”提供AI翻译通话服务,用户体验还不错,但纯软件形式存在局限——用户需要先下载应用,并且在面对面翻译时,手机单设备收音导致体验不够自然。因此公司2023年全面转向AI业务,2024年决定布局AI硬件产品。去医院做肠胃镜刚好给了我具体使用场景的灵感,所以迅速研发并推出了我们自己的AI翻译耳机。
雷峰网·鲸犀:全面转向AI业务并布局自己的AI硬件产品,是否受到大环境的影响?
Steve:确实,我们转向AI硬件与大趋势是吻合的。今天参加的基金会议主题叫"All in Physical AI",这与我们的方向不谋而合。在AI时代之前,硬件产品的交互能力有限,技术不够成熟。但现在AI技术让所有硬件都能变得更智能,这意味着可以将过去所有的硬件产品都用AI重新定义,实现真正的智能化。
很多过去通过软件实现的功能,现在用硬件形式可以提供更好的用户体验。这也是美国VC正在大规模投资AI硬件的原因——AI硬件比纯软件有着更大的发展前景和价值创造空间。我们也认同这一判断,目前除了AI翻译耳机,还有好几款AI硬件产品在研发进程中。
雷峰网·鲸犀:从AI Phone到现在的AI硬件,发现贵公司似乎擅长在免费或低成本模式中发现巨大商机,这个观察准确吗?
Steve:这个观察已经不符合当前情况了。AI Phone早期的免费模式是因为当时所处的就是搞免费的时代,收费做不起来。但现在千万不要做免费的东西,好的产品就应该大大方方的收费,而且应该收得更贵些。
目前我们虽然维持“AI Phone”60美元年费不变,但也在试图把成本降下来。早年投资的GPU服务器和自建机房现在发挥了关键作用——当我们把模型部署在自己的硬件上时,相当于消除了按Token付费的云端成本。这笔前瞻性的基础设施投入,如今成为了我们保持价格竞争力的重要优势。
雷峰网·鲸犀:除了翻译耳机,还在开发哪些AI硬件产品?目前的进展如何?
Steve:我们正在研发AI陪伴类产品,但这确实比预想的更具挑战。虽然做个基础版本很容易,但要真正实现有情感的陪伴体验难度很大——开发了快两年,已经迭代了三个版本,但还没有达到我满意的质量。
我们的策略是软件先行:先打造出真正能产生陪伴感的软件体验,再推进硬件开发。软件预计今年底完成,产品计划明年年中面世。作为硬件领域的新手,我们在通信和翻译这类老本行上进展较快,而其他全新领域的产品需要更长的学习周期。目前多款产品都在积极推进中,预计明年初能在CES展会上正式亮相。
雷峰网·鲸犀: 那是否会考虑开发录音卡片这类产品?
Steve:卡片式的录音产品我们不会考虑。虽然Plaud的录音卡片在美国销量很不错,但在我看来,这类产品实际上处于法律灰色地带。美国多个州的法律明确规定,录音必须征得对方同意,所以苹果手机在打电话时录音会发出提醒,而卡片式录音的隐蔽特性恰恰绕过了这个法律要求。
在美国市场,录音卡片的核心使用场景一般是销售人员偷偷记录与客户的对话,用于后续的销售分析。虽然需求确实存在,但法律风险过高——一旦发生集体诉讼,可能会对公司造成毁灭性打击。举个例子,有公司做在线会议的录音外挂,业务做得还不小,不仅实现录音,还能基于个人视角生成会议摘要。但我听说最近被人起诉了,就是因为录音没有征得参会人员的同意。所以这类产品或者外挂一旦被对方知道了是非常麻烦的,美国的律师费可不便宜。
雷峰网·鲸犀: 在未来的产品规划中,是否会融入视觉、手势等多模态交互来提升翻译体验?
Steve:多模态确实是我们重点布局的方向。目前我们的语音翻译已经相当成熟,但在展会、商务洽谈等场景中,单一语音翻译存在明显局限——比如面对展板文字或演讲内容时,就需要视觉能力的补充。
关于硬件形态,AI眼镜自然成为我们探索的路径。当前市面上通用型的AI眼镜在翻译精准度和佩戴舒适度上还有提升空间,但在特定场景下(如参加国际展会),相信用户是愿意为了实时翻译而暂时接受不太舒服的佩戴体验的。我们去年就已经启动AI眼镜的相关调研,不过在眼镜本身上不会有太高的创新,主要从翻译的角度去做更多的优化工作。
作为一家成熟企业,我们的产品演进始终遵循场景需求驱动。从翻译耳机到未来的AI眼镜,每一步拓展都是为了解决用户在真实环境中遇到的具体问题。
雷峰网·鲸犀:未来的AI硬件产品是面向Tob还是Toc?
Steve:虽然我们的翻译软件在ToC领域已经积累了超300万美国用户,尤其在医疗等专业场景解决了移民群体的实际痛点,但ToB市场具有更大规模潜力。目前国内外同步推进B端业务,海外针对医疗机构,国内主攻外贸企业。但海外的的投入度会比国内更大,主要市场还是在海外,超300万的软件用户也基本上都是美国用户。
雷峰网·鲸犀:如何看待通用AI硬件产品与垂直AI硬件产品的市场占比分布?
Steve:这个问题需要按品类具体分析,很难一概而论。不同领域的市场结构差异很大:比如在人形领域,垂直细分市场的规模很可能远超通用型产品。但在耳机行业,苹果这类通用产品显然占据主导,垂直细分市场的规模相对较小。因此,垂直和通用的市场占比完全取决于具体品类特性,需要结合行业特点进行判断。
02
纯自研就是固步自封,开源模型打底才是硬道理
雷峰网·鲸犀:在进入AI翻译耳机市场时,如何与、华为等厂商实现差异化竞争?
Steve:AI硬件产品,硬件只是载体,真正的竞争力体现在软件和模型对特定需求的理解。当前行业一个重要的趋势是,很少有公司会从头训练基础模型,大家都普遍采用优秀的开源模型。这实际上创造了一个相对公平的竞争环境——在软件层面,大厂商并没有什么先天优势。如果初创企业还把资源消耗在基础模型研发上,反而是固步自封。
我们的核心差异在于对垂直场景的深度挖掘。虽然中国已经实现了政务服务的线上化转型,但美国还停留在电话沟通的阶段。针对这个场景,我们开发了超越单纯翻译的增值服务:帮助美国移民用户应对移民局电话系统(IVR),或为外贸客户提供“AI军师”功能,在通话后自动分析对方核心诉求和潜在意图。
这些深度定制的功能往往比翻译本身更具价值。我们不再强调翻译准确率、延迟这些技术参数,用户也不太关心这些,他们真正关心的是"这个产品能否帮我搞定这通重要的国际电话"。如果跟用户讲我们的产品能帮他们搞定,用户就会觉得“哇,太牛了”。
这种对垂直场景的深度耕耘,正是大厂无暇顾及的方向——他们做通用功能,我们做深度解决方案。如果只做基础翻译,只会直接陷入与巨头的同质化竞争。
雷峰网·鲸犀:随着端侧AI算力的爆发,如何看待AI硬件“端云协同”的未来?哪些能力必须放在端侧,哪些更适合云端?
Steve:从硬件的角度来讲,我认为绝大部分模型应该走向端侧,尽量少放在云端,一旦走向云端就不可靠。从成本来看,调用公有云的成本并不低,把模型跑在本地就可以把这笔费用减掉。但这并不是决定性的因素,最关键的还是可靠性和性能。从实际体验来看,美国网络覆盖远不如中国,就连斯坦福周边这种极好的地段也会存在没信号的情况,很多地方连手机信号都不稳定。如果硬件依赖云端,在关键时刻断网那就完蛋了。
所以从可靠性上来讲一定得放在端侧,从反应速度来讲更需要放在端侧。因为端侧响应是即时的,而云端传输必然存在延迟。现在模型压缩技术进步很快,像4B参数模型在端侧已经能很好处理多模态任务,可以满足绝大多数AI硬件的需求。
所以开源生态对AI硬件发展至关重要,近两年大模型厂商先后开源实际上是AI硬件能快速兴起的决定性因素。正是DeepSeek这类开源模型的出现,让很多创业者发现了产品可能性。毕竟基座模型的训练成本可不低,开源让创新门槛大幅降低。
雷峰网·鲸犀: 在AI硬件开发中,如何看待自研底层模型与基于开源模型微调这两种技术路径的选择?
Steve:原则上,我们不建议企业自研底层模型,这需要巨大的投入且难以超越现有开源方案。理想路径是优选开源模型,有自身数据的话再进行微调。
在实际操作中,我们形成了三分天下的技术架构:约三分之一直接使用优质开源模型,三分之一基于业务数据进行微调,另外三分之一则针对特定场景自研专用模型。比如我们的意图识别模型,就因为通用模型响应速度无法满足实时通话需求,并且成本还特别高,所以不得不选择自研。
这种混合架构的形成,源于我们在产品深化过程中遇到的具体问题。当一个产品要做到极致时,就会发现没有哪个通用模型能解决所有问题。不同环节需要不同的技术方案,这正是深耕垂直领域必须面对的技术挑战。
雷峰网·鲸犀:那如何看待科大讯飞自研的星火大模型?
Steve:科大讯飞是一家有自己使命的公司,他们的自我评价也挺高。所以不管是从面子还是其它层面,必须得拥有自己的模型。但我还是坚持我一开始的看法,自研大模型不一定是个正确的选择,因为市面上最好的大模型一定是经过市场验证的、大家耳熟能详的大模型厂商。
雷峰网·鲸犀:您曾形容WebEx早期的团队是“很底层的一堆‘土人’”,但靠顶尖的产品和技术把对手都干趴下了。 在当前AI应用竞争白热化的环境下,大量资金涌入营销领域,这个策略在当今市场是否依然适用?
Steve:观点不仅依然适用,而且比以往更加凸显其价值。在AI时代,技术权重正在持续提升。以DeepSeek和通义千问为例,几乎未做市场推广,但在硅谷火得一塌糊涂,仅凭产品力就在全球获得认可,这印证了优秀技术本身就能创造价值。同时他们还选择了开源,开源就是最强的marketing。
但需要区分的是,ToB和ToC市场存在本质差异。ToC产品一般有两种情况,要么一炮而红的极端个例,要么需要不断地市场投入。但ToB领域客户具备专业判断力,更看重产品实质价值。以新能源汽车行业为例,特斯拉在技术领先时占据优势,但当中国厂商在技术和功能上实现赶超后,特斯拉的市场份额不断流失。
现在马斯克走的是另外一条途径——自动驾驶FSD,在目前属于断代领先的技术,中国一时半会想要赶上有点难,这也将成为汽车行业竞争的下一个核心战场。这充分说明,持续的技术创新才是企业最核心的护城河。随着技术迭代加速,产品力的重要性只会越来越凸显。
03
20%的重度用户,让企业亏得一塌糊涂
雷峰网·鲸犀:当前500元以下的AI耳机已占据超60%市场份额,公司将AI翻译耳机定价1500多元底气何在?
Steve:最近硅谷一直在热议AI产品的定价问题,因为传统的定价模式在这个领域面临很大挑战。在AI时代,我们发现传统的SaaS固定订阅模式已经不再适用。由于存在明显的二八效应——20%的重度用户使用量可能是常规用户的十倍之多,如果继续采用固定月费制,这些重度用户会让企业亏得一塌糊涂。这正是目前许多美国AI Coding公司面临的困境:虽然ARR(年度经常性收入)很高,但大部分收入都支付给了模型公司。因此,行业已经开始转向分级收费模式,在基础套餐之外设置使用额度限制,超额需要支付额外费用。
具体到我们的产品,我们的AI Phone软件服务在美国的年费是60美元,两年使用期就接近900元人民币。硬件定价实际上是包含了软件价值的打包价格。其次,华强北许多耳机厂商生产成本极低,共用第三方廉价软件方案,授权费仅需10元,这根本无法支撑高质量的AI翻译服务。我们使用自研模型和GPU集群,需要承担实实在在的Token消耗成本,整体评估下来我们的毛利润挺低的。
从市场竞争角度看,美国市场的翻译耳机大多数Made in China,我们的定价在高端市场区间内是合理的,与科大讯飞、华为等品牌处于同一价位段。而500元以下的低价产品,跟他们做对比的话难免拉低品牌的层次。
雷峰网·鲸犀:当前的定价毛利润比较低,是想通过性价比先占据一波市场吗?
Steve:说实话,我们卖硬件不如卖软件利润高。硬件的渠道成本并不低,加上电商平台的营销成本、增值税等等,所以卖硬件本身这件事情是不太挣钱的,下场来做是因为想要给用户更好的体验感,必须通过硬件的产品形态来实现。
雷峰网·鲸犀:如何看待自家的AI翻译耳机与苹果AirPods Pro 3这类消费级通用翻译耳机的竞争关系?是否意味着AI硬件未来会更早地在垂直领域爆发?
Steve:在我看来,AI硬件确实会优先在垂直领域取得突破。正如我今天看到的七八家硬件公司,都聚焦在特定的垂直细分领域。垂直场景能提供更极致的用户体验,给用户创造很明显很直接的价值,越是通用的其实越难搞。以热度很高的人形机器人为例,通用型机器人可能还需要十年技术沉淀,但应用于工业流水线的垂直机型已经能产生实际价值。
同样,在翻译领域,我们的核心竞争力在于深度整合垂直场景——除了基础翻译,还提供通话策略分析、跨文化沟通建议等高附加值服务,让用户获得超越单纯翻译的完整解决方案。这与苹果通用型耳机的定位形成明显差异,我们追求的是在专业场景中的不可替代性。
雷峰网·鲸犀:翻译延迟、嘈杂环境下的识别准确度欠佳以及小语种支持不足,仍是目前AI耳机普遍存在的痛点,如何解决这些问题?
Steve:针对现有的技术挑战,在小语种方面,我们主动放弃全面覆盖,专注于主流语言市场,跟主打通用型产品的苹果不一样,必须覆盖全球市场。举个例子,十个阿拉伯国家说的阿拉伯语都不一样,就没有比它更难搞的小语种,若要完整覆盖投入产出比极低。作为创业公司,要集中资源服务核心用户群体,不该去做的就不要去做,该做的一定要做好。
在噪声处理方面,我们发现世界上最好的通用语音识别模型在嘈杂环境中错误率会从5%飙升至20%以上,100句话里面有20句以上都是错的。我们不得不自研模型微调技术,专门收集了通话噪声数据加入训练,将噪声环境下的错误率成功降低至9%左右,比基础模型提升了近一倍的性能。我们还建立了持续优化机制,每3-6个月收集用户反馈中的错误案例,不断迭代模型,翻译准确性会越来越高。
雷峰网·鲸犀:近年来,开放式耳机被许多厂商视为承载AI功能的理想硬件形态之一,是否认同这一趋势?
Steve:我认为选择什么样的形态完全取决于具体的用户场景。以翻译耳机为例,挂耳式会远远好于入耳式。在美国等国家,驾驶时佩戴入耳式耳机是违法的,它会隔绝环境声音带来安全隐患。而我们的用户经常需要在驾车时进行通话,挂耳式是唯一合规且安全的选择。
此外,在面对面翻译时,最佳体验是双方各戴一只耳机。入耳式存在卫生顾虑,多数用户不愿使用他人佩戴过的入耳设备,挂耳式完美解决了这个问题。相比之下,音乐耳机会优先考虑佩戴舒适度和隔音效果,而翻译耳机必须优先满足实际使用场景的功能性需求。每种耳机形态都有其最适合的应用场景,我们的设计决策始终围绕用户真实的使用环境展开。
雷峰网·鲸犀:腾展科技在AI翻译耳机领域的核心竞争力主要体现在哪些方面?
Steve:做电话通信起家让我们积累了大量独特的通话数据,是我们独有的“语言资产”,就像一个巨大的护城河,不是简单花钱就能买到的。如果只是调用公共API,做个基础demo确实不难,两个月就能做出来,但产品水准只能达到3-4分。
想要做到7分就非常有挑战性了,到目前为止还没有人能做到9分,包括我们自己。我们通过自建模型和持续优化,现在能做到7.5分左右,后期应该能到8.5分左右。值得一提的是,我们采取硬件与软件分开迭代的策略。硬件已经成熟量产,但背后的模型和软件每天都在更新升级。
雷峰网·鲸犀:除了外贸和翻译,您认为AI硬件在哪些垂直领域还有重要机遇?
Steve:美国的翻译市场很大,医疗翻译是我们重点关注的赛道。美国医疗系统目前仍普遍采用人工翻译,成本高达每分钟1美元以上,看一次病一小时的话就要花60美金,而我们的年度服务费才60美元,存在两个数量级的成本优势。之前AI的翻译质量做的没那么高,包括交互体验都不太行,但现在具备了替换的可能性。这个市场的突破点在于:美国医生大多独立执业,拥有采购决策权,这比从医院层面切入更为高效。
医疗翻译只是起点,我们发现在法律咨询、水电维修等领域同样存在类似的跨语言沟通需求。不过这些场景较为零散,需要更精准的产品定位。深入理解当地行业生态,正是做好海外ToB业务的关键所在。
04
从“中国制造”转向“中国智造”还有五年窗口期
雷峰网·鲸犀:有说法称出海的利润率可达70%-80%,这个数字准确吗?
Steve:这个比例需要分阶段看待。在业务初期,由于平台分成和获客成本,实际利润率远低于这个数字。以美国市场为例,用户支付的1美元中,苹果等平台会分走30%,Facebook等广告渠道的获客成本可能再占40%,最终企业毛利仅在30%左右。
但随着业务进入稳定期,情况会发生显著变化。如果产品具备持续竞争力且用户续费率较高,经过5年左右的积累,确实可能实现70%-80%的毛利率。这是因为早期投入的市场费用会大幅降低,存量用户的订阅收入将成为主要来源。
以我们公司的"AI Phone"产品为例,经过多年运营,现在年收入过亿且基本不再需要额外市场投入。但必须强调的是,这种高利润率建立在产品长期价值和用户忠诚度的基础上,并非所有出海软件都能达到这个水平。
雷峰网·鲸犀:您作为连续成功的创业者,之前的经历为现在带来了哪些宝贵经验?
Steve:说实话,我非常反对经验主义。每家公司面临的市场、客户和团队都完全不同,过去的成功经验往往不适用于新环境。即使是马云管理公司的那套理念套到我们这样的小公司上肯定也不灵,如果天天去听马云的鸡汤,那公司只会越搞越糟糕。
我们在这方面有过深刻教训。在开发AI产品初期,不管是产品设计,还是开发测试,我们沿用移动互联网时代的方法论,结果发现全面失败。比如测试环节:传统产品测试关注“功能是否工作”,而AI产品需要评估“效果好坏程度”。我们花了近一年时间才意识到必须建立全新的AI Native工作流程,这个认知代价高达上亿元。
雷峰网·鲸犀:对于当前希望出海的中国AI硬件初创企业,您认为相比您早年创业时,他们面临的最大机遇和挑战是什么?
Steve:当前是出海创业的黄金时代。美国资本正大力投资AI硬件领域,这为颠覆传统产品和创造新品类提供了绝佳机会。中国企业现在可以做出技术含量更高的产品,而不再局限于过去的充电宝、插座等低附加值商品。
在挑战方面,我最近学到的新概念"tariff native"很能说明问题——企业从创立之初就要将关税因素纳入供应链设计和商业架构中,不能寄希望于稳定的关税政策。这意味着创业者需要前置性规划全球供应链,确保在任何关税政策变动下都能保持竞争力。这种系统性风险管控能力,已成为当下出海企业的必备素质。
雷峰网·鲸犀:基于您横跨中美科技圈三十年的经验,当前中国创业者出海最常见的认知误区是什么?您会给他们什么建议?
Steve:我认为当前是中国AI硬件创业者出海的黄金窗口期。现在美国资本正大力支持AI硬件创新,这为我们创造了难得的机遇。但必须清醒认识到,这个窗口期可能只有5年左右。
随着中美产业格局变化,美国正在建立自己的供应链体系。一旦他们的供应链成熟,中国制造的成本优势就会减弱。因此我的建议很明确:要把握当下这个时间窗口,充分利用中国在供应链成本和效率上的现有优势,快速行动。现在正是将中国制造升级为中国智造的最佳时机。
2024年9月,雷峰网·鲸犀·鲸犀出海百人谈栏目正式启动,诚邀对行业有独特洞察的公司、机构及个人的加入。有意者可添加本文作者微信nebula-yee(请备注“百人谈”,注明所在公司)。如果你有任何有关出海感兴趣的话题,欢迎在评论区留言。