裸舞推特

裸舞推特 你的位置:裸舞推特 > 谷物肉系列 >

亚洲色图 校园春色 对话智元首席科学家罗剑岚:中国的具身智能圈媲好意思国愈加“求实”

发布日期:2025-04-06 06:30    点击次数:105

亚洲色图 校园春色 对话智元首席科学家罗剑岚:中国的具身智能圈媲好意思国愈加“求实”

亚洲色图 校园春色

出品|虎嗅科技组

作家|宋想杭

剪辑|苗正卿

头图|电影《效法游戏》

归国两个月后,罗剑岚加入智元。这是他探索国内具身智能的一个起首。

从机器东说念主不再称之为"机器东说念主",而是被叫作念"具身智能"运转,这个赛说念也冉冉年青化。王兴兴、彭志辉、王鹤、杨丰瑜,如今国内的具身智能圈仍是是 90 后、致使 00 后的主场。似乎改名换姓后,东说念主也变年青了。和上述创业者相通,从伯克利回来的罗剑岚亦然一位 90 后。但不同的是,他的贪念不在于拿融资、创业、找钱。也许是特性使然,罗剑岚归国后依然坚抓了他过往的科研道路。

2015 年,是罗剑岚在机器东说念主鸿沟商议更早的起首。在后续的十年时辰里,他有 8 年王人在作念学术商议,先后就读于伯克利的博士和博士后学位。而在重返伯克利就读博士后之前,他还有两年的时辰是在谷歌渡过,分手担任 Google X 和 Google DeepMind 商议科学家。在此时间,他还交流开荒了全球首个超东说念主类的机器东说念主真机强化学习系统。

尽管在具身智能鸿沟,对于走 IL(效法学习)道路如故 RL(强化学习)道路,不对永远存在,但罗剑岚却是又名坚韧的 RL 拥护者。他的主张是,除非效法学习准确率能达到 100%,不然在现实宇宙的不笃定性是极大的。而实践情况是准确率达到 99.9% 王人是简直不可能的。

回到国内,罗剑岚在作念科研与追念产业界之间,选拔了一条折中的道路。他决定加入智元担任首席科学家,并牵头组建了"智元具身商议中心",还作念了稚辉君的共事。

与罗剑岚归国的初志相吻合,这个"智元具身商议中心"并非传统道理道理上的商议机构,而是一个集结基础商议和产业落地之间的桥梁。在罗剑岚的口中,"它并不是为了发 paper 而存在的,这个事情不需要我在智元作念,具身商议中心存在的道理道理是用问题鼓励科研,它的导向是去处罚实践问题,最遑急的是,在这个商议中心里,基础商议和产业落地莫得严格的界限"。

而罗剑岚口中的界限也正是中好意思在具身智能鸿沟最大的区别所在。同期,它亦然朱啸虎口中具身智能存在泡沫的根源。

咱们不成老是在一个个榜单和视频的 demo 里看到具身智能的越过,具身智能惟有诈欺到具体的产业中,转为实践坐褥力,才能让东说念主感受到它的越过。千里浸在学术界多年的罗剑岚,也并不摈斥朱啸虎的不雅念。从某种进度上,朱啸虎代表着现实主义,但这种现实主义也正是遮盖在具身智能这种基础商议与产业落地脱节的现实之下。

在与罗剑岚对话的经由中,他流显现了一种十分 open 的立场。他说,"透顶不错领路朱啸虎作为投资东说念主的立场",但同期这并不代表应该废弃基础商议。当下,众人对朱啸虎的不雅点存在一种误读,致使解读成对具身智能的唱衰。实践上赶巧相背,他反而在指示企业,具身智能鸿沟果然需要处罚的是基础商议与产业落地之间的 gap 问题。

但这种 gap 在好意思国的具身智能圈要愈加严重。"和国内不同,好意思国的氛围太过于偏重基础商议,可能他们不卷吧",罗剑岚对虎嗅说说念。但这同期亦然国内具身智能的魔力所在,"国内有许多作念硬件的公司,况兼交易化也会更快一步,这很有益于填补基础商议与产业落地之间的 gap。" 罗剑岚告诉虎嗅。

实践上,国内的具身智能圈,一直王人萦绕着两种氛围,一种是聚拢了 UC 伯克利和斯坦福等东说念主才的学术派,一种是聚拢了华为、小米等东说念主才的大厂派。但在罗剑岚身上,却既看得到属于学术派的放浪主义格调,也有来惬心厂派的求实格调。此次归国,罗剑岚更多是带着问题回来的。

在具身智能鸿沟,目下最大的困难如故在 manipulation(操控)身上,等闲来讲即是准确应酬外部宇宙的无穷性、不笃定性。这亦然目下各界王人在攻克的要点。

而在智元,罗剑岚想用一种"以问题驱动科研"的格式延续完成他的科研职责,同期这里亦然他从科研追念到产业界的运转。

三级片在线

以下为虎嗅与智元首席科学家罗剑岚对话实录,有改造:

虎嗅:你在伯克利时间,对国内具身智能公司有过战斗吗?那时你奈何看国内这些公司的?

罗剑岚 : 2016、17 年的时候,那时产业化处于比较早期阶段,更多是硬件导向或者是偏作事类的机器东说念主,果然存眷具身智能和通用机器东说念主的还并未几。那时还莫得这个观念,无数王人叫机器东说念主。

国际也仅仅有几家机构在作念,包括 Google 在内。那时众人对于把 learning 移到机器东说念主上这件事一直是抓怀疑立场的。阿谁时候国内偏传和谐些,AI 作念得少。但这一两年,国内至少从阵容上看媲好意思国要大得多。

虎嗅:是因为交易化的原因吗?

罗剑岚 : 国内可能会比较存眷这个词。比较之下,国内更易得回场景和数据,使用效用也会相对较高。但好意思国会更坚抓时期的经久探索。

虎嗅:归国之后,为什么莫得选拔我方创业,而是加入到一产品身智能公司作念首席科学家?

罗剑岚 : 在产业界作念科研需要一套落地的系统,这波及到跨学科跨层级的系统性配合。目下这个阶段,我但愿专注在我擅长的事情上,而不是一运转就堕入团队建设、融资、工程化这些事情上。

虎嗅:你说跨学科配合。但国际跨学科会不会走得更往前一些?

罗剑岚 : 我倒合计中国天生的泥土或基因会比较好少许,比如好意思国,第一他没硬件,第二好意思国 AI 东说念主才密度十分高,是以众人会更多基础在 AI 商议上。但比较之下,在国内恰好相背,国内更容易找到机器东说念主所需要硬件实质、算法等等。

虎嗅 : 那智元最诱导你的点在哪?

罗剑岚 : 它是全栈的公司,也即是说硬件、软件、算法王人是闭环的。这和我的理念十分相符。

虎嗅:你的理念是什么?

罗剑岚 : 我觉顺应今许多机器东说念主的问题是,当今在硬件、软件、算法上头工程和科研莫得统统迭代。你不成把它手脚念其他的 AI 主张,即是你有一个 benchmark,有一个 dataset,你在上头刷刷点,找一个场景。我比你好 10% 就好了。这样莫得反应实践的施展,也不客不雅公道。

虎嗅:你在智元牵头组建的"智元具身商议中心",这个商议中心是如何的存在?比如它的组织架构和颓落性。

罗剑岚:目下还在抓续招聘。它是一个集结基础商议,到果然不错被部署到真实系统的中台。他不会只发论文,这可能仅仅盘算推算之一;但更遑急是鼓励具身系统才能的演进,以及部署到真实宇宙中。它是内嵌式的科研中台,具有相对的颓落性,不错探索新的科研范式,同期也会和咱们产品工程这类部门是保抓强联动,幸免脱节。

虎嗅:那在这个商议中心里,它的基础商议和落所在面会有一个比例吗?

罗剑岚:这是个好问题。我合计机器东说念主鸿沟有一个挺大的问题,即是在别的鸿沟比说大说话模子,最新的商议效用是简直不错立时滚动到商用上,众人不错看得见摸得着,不错用起来。但机器东说念主商议却许多停留在了纸上,拍个视频发到网上说我方比别东说念主好 10%,然后就莫得后续了,也莫得东说念主适当落地。

是以你说的这个比例问题,在咱们的商议中心里我不会设一个就十分   boundary   的界限,我不会把基础商议和落地分开来。我合计机器东说念主作为系统性的学科,它是不错被临了 push 到果然诈欺上的,而不是留在 demo 和论文,然后谁也非论的景况,是以举座会是比较流动的景况。

虎嗅:在国际的话,基础商议和产业落地的这个界限会有多重?

罗剑岚:我觉在机器东说念主鸿沟,国际比较无语的少许是,他们若是想落地比较难找场景。受制于一些客不雅身分,他们的制造业和作事业相对较少。这并不是他们不想作念。还有少许是好意思国环境会包容少许,统统机制会更饱读吹众人去作念比较经久的探索,况兼成本十分充裕,他们对失败的容忍率也比较高,这也导致了在具身智能鸿沟许多问题莫得落地。

虎嗅 : 是以,"用问题驱动科研"这亦然你回到国内要作念的主要事情吗?

罗剑岚 : 对,我合计好的时期商议能滚动为坐褥力亦然一件十分兴隆东说念主心的事情。

虎嗅:DeepSeek 这波高涨之后,国表里对 RL 继承度会更高吗?

罗剑岚:对, DeepSeek 或 GPT-O1 会让众人看到 RL 的后劲。之前 RL 火起来如故在 2016 年 AlphaGo 那波,但因为自后没找到诈欺,又千里寂了一会。然后 2023 年众人看到大说话模子的时候又好了,再到当今众人仿佛又看到了 RL 的后劲。本年图灵奖也颁给了 RL 鸿沟的两位宗匠。

我对 RL 的看法是这样,它是一个归纳法和演绎法的区别。归纳法是你当今看到的神情,他当今是什么,以后也就会是什么。但演绎是,你字据它底层的逻辑去推理。因为若是仅仅 supervise learning (监督学习)的话,莫得办法作念优化,也莫得办法作念多步的推理。但 RL 在原则上是一个比 supervise learning 更合理的 framework(框架)。若是它出问题了,也不一定是它自身的问题,即使真有的话,咱们应该让它变得更好,而不是看到问题就认为它不行了。

虎嗅:当今在具身智能鸿沟,坚抓 RL 的会许多吗?

罗剑岚 : 我觉顺应今作念 locomotion,也即是作念转移的笃信用的比较多了。但 manipulation (操控)的话,这个波及到真实宇宙,众人还在探索阶段吧,

虎嗅:为什么会这样说?这个 locomotion 和 manipulation 具体体当今什么所在?

罗剑岚 : 因为 locomotion 更多存眷的是你我方的行为。比如狗往前走,机器东说念主 往前走,你只消限制好我方模子的准确性就不错了。但 manipulation 更多对于外部宇宙,除非你的仿真器大要效法统统宇宙,但这是个很难的事情。

在曩昔二三十年的机器学习的阅历和熏陶中告诉咱们,在一个 AI 系统里,若是有一个部分不跟着数据的 scale(增加)从而性能 scale(提高),那么这部分临了就会酿成这个系统的瓶颈。仿真器是咱们用手遐想的,不跟着统统系统的提高而提高,临了咱们学出来的计谋就不会超越仿真器的自身。

虎嗅:是以在 manipulation 还存在很大问题的情况下,你合计具身智能接下来的发展主张应该是什么?

罗剑岚 : 我合计接下来几年亚洲色图 校园春色,咱们不要说作念万能机器东说念主,而是作念有效的机器东说念主,处罚一个任务可能太 specialize (专用)了,但至少不错处罚 4、5 个场景内部的任务。我也不存眷他到底是不是东说念主形。