美國再迎來基于 AI 大模型技術(shù)的人形機(jī)器人新公司。

鈦媒體APP 7月13日?qǐng)?bào)道,總部位于匹茲堡的人形機(jī)器人初創(chuàng)公司Skild AI宣布,公司完成了總額3億美元(約合人民幣21.75億元)A 輪融資,投后估值高達(dá)15億美元。這筆融資主要用于技術(shù)研發(fā)、產(chǎn)品打磨、團(tuán)隊(duì)搭建以及商業(yè)化的部署。

值得一題的是,參與Skild AI的投資人陣容也非常強(qiáng)大,涵蓋科技界、頂尖風(fēng)投甚至學(xué)術(shù)機(jī)構(gòu),貝索斯、紅杉資本和孫正義的軟銀都出現(xiàn)在領(lǐng)投名單中。具體來說,包括Coatue、CRV、Felicis Ventures、General Catalyst、Menlo Ventures、SV Angel、卡內(nèi)基梅隆大學(xué)、紅杉資本(Sequoia)、美國光速創(chuàng)投、貝索斯探險(xiǎn)和日本軟銀集團(tuán)等。

實(shí)際上,Skild AI的兩位創(chuàng)始人均來自卡內(nèi)基梅隆大學(xué),在自監(jiān)督和自適應(yīng)機(jī)器人領(lǐng)域有超過25年的經(jīng)驗(yàn),團(tuán)隊(duì)也來自谷歌、Meta、特斯拉、英偉達(dá)、亞馬遜、卡內(nèi)基梅隆大學(xué)和斯坦福大學(xué)等科技巨頭及院校,其利用比其競(jìng)爭對(duì)手大1000倍的數(shù)據(jù)集訓(xùn)練模型,實(shí)現(xiàn)一種通用的智能系統(tǒng),可以接入不同機(jī)器人,讓他們立刻獲得一些基本能力,如爬坡、跨過障礙、識(shí)別和撿起物品。

紅杉資本合伙人 Stephanie Zhan直言,無論是在物流、車廠試點(diǎn)的人形機(jī)器人,還是四足機(jī)器狗,都要有腦子。過去,“腦子”要定制,但現(xiàn)在有了大模型和Skild AI,世界機(jī)器人已經(jīng)有了通用化和泛化實(shí)力。

AI 時(shí)代的“新 iPhone 時(shí)刻”正在進(jìn)入人形機(jī)器人世界。

為實(shí)現(xiàn)物理世界的AGI,兩位美國大學(xué)教授構(gòu)建大規(guī)模數(shù)據(jù)集

Skild AI成立于2023年5月,由兩位前美國卡內(nèi)基梅隆大學(xué)教授 Abhinav Gupta 和 Deepak Pathak創(chuàng)立,他們也曾是 Meta 的 AI 研究人員,公司長期目標(biāo)是開發(fā)扎根于物理世界的通用人工智能 (AGI),以打造一個(gè)通用、靈活、智能的人形機(jī)器人產(chǎn)品。

人才方面,Skild AI團(tuán)隊(duì)主要來自 Meta、特斯拉、英偉達(dá)、亞馬遜、谷歌以及卡內(nèi)基梅隆大學(xué)、斯坦福大學(xué)、加州大學(xué)伯克利分校和UIUC等名校。

技術(shù)層面,Skild AI正在構(gòu)建一個(gè)共享的通用大腦,為機(jī)器人提供一種基礎(chǔ)模型,作為“通用大腦”。而Skild Brain是一個(gè)可擴(kuò)展的機(jī)器人基礎(chǔ)模型,具備使用性和靈活性的能力,能夠使機(jī)器人在不同硬件、場(chǎng)景、任務(wù)之間自適應(yīng)。

這個(gè)“通用大腦”可以與包括人形機(jī)器人在內(nèi)的任何類型機(jī)器人進(jìn)行集成,以通用AI技術(shù)使機(jī)器人執(zhí)行動(dòng)作,從而在不同場(chǎng)景中處理各種任務(wù),可以在家庭和工業(yè)環(huán)境中靈巧地操縱物體,可以在任何物理環(huán)境中導(dǎo)航。如攀爬陡峭的斜坡、繞過前進(jìn)道路上的障礙物以及識(shí)別和拾取物品。

這種獨(dú)家技術(shù),一個(gè)是Deepak Pathak讀博時(shí)開發(fā)的一種向機(jī)器人灌輸“人工好奇心”的方法。當(dāng)機(jī)器人對(duì)自己行為的結(jié)果感到不確定時(shí),它就會(huì)變得更“好奇”,愿意探索更多場(chǎng)景,帶回更多數(shù)據(jù),增加學(xué)習(xí)的廣度和深度。Pathak 還設(shè)計(jì)了一種方法,可以將人類給GPT等大模型下的命令(如打開一罐牛奶),轉(zhuǎn)化為實(shí)際動(dòng)作。

除了這些與物理世界交互和操作的真實(shí)數(shù)據(jù),團(tuán)隊(duì)還結(jié)合從模擬環(huán)境中收集的數(shù)據(jù),提供大量、特別是在頻繁重復(fù)場(chǎng)景中的資料和反饋。另外,在2022年,兩位創(chuàng)始人還通過各種機(jī)器學(xué)習(xí)和不同源數(shù)據(jù)中學(xué)習(xí)等手段,整合到一個(gè)連貫系統(tǒng)中,大大提高了模型的學(xué)習(xí)效率和適應(yīng)能力。

值得一提的是,爬樓梯是一個(gè)復(fù)雜的平衡問題,通常需要針對(duì)特定環(huán)境編程和訓(xùn)練,但 Skild AI 的模型能讓機(jī)器人迅速學(xué)習(xí)和適應(yīng)新環(huán)境,完成任務(wù)。而且,基于Skild AI技術(shù)的機(jī)器人展現(xiàn)出一種“涌現(xiàn)能力”,可以自學(xué)習(xí)實(shí)現(xiàn)更多動(dòng)作捕捉。

“我們的模型表明,它可以適用于不同的機(jī)器人、場(chǎng)景和任務(wù)?!盤athak 表示。

模型泛化能力和涌現(xiàn)能力,離不開所謂“規(guī)??涨啊?、文本、圖像和視頻組成的龐大數(shù)據(jù)集。因此,這種獨(dú)特能力背后,Skill AI的核心在于其模型訓(xùn)練所使用的海量數(shù)據(jù)。

Skill AI團(tuán)隊(duì)透露,相比競(jìng)爭對(duì)手,其數(shù)據(jù)點(diǎn)至少多出1000倍,這一優(yōu)勢(shì)使得Skill AI的模型能夠更好地理解和適應(yīng)復(fù)雜多變的物理世界。

據(jù)悉,Skill AI的通用機(jī)器人技術(shù)有望為醫(yī)療、建筑、倉儲(chǔ)和制造業(yè)等行業(yè)提供解決方案,從而讓機(jī)器人能夠與人類一起執(zhí)行新任務(wù),或部分環(huán)境下代替人類工作,可以有效緩解勞動(dòng)力短缺和提升工作效率。

據(jù)maginative報(bào)道,Pathak認(rèn)為,目前美國面臨著日益嚴(yán)重的勞動(dòng)力短缺問題,預(yù)計(jì)到 2030 年將有 210 萬個(gè)制造業(yè)崗位空缺。Skild.ai 的技術(shù)可以幫助實(shí)現(xiàn)危險(xiǎn)或勞動(dòng)密集型任務(wù)的自動(dòng)化生產(chǎn)。

作為此次投資人,光速創(chuàng)投合伙人Raviraj Jain表示,Skill AI能夠通過將基礎(chǔ)模型的核心原則應(yīng)用于現(xiàn)實(shí)世界,推動(dòng)機(jī)器人技術(shù)的進(jìn)步,推動(dòng)人形機(jī)器人的發(fā)展。這也顯示了他對(duì)Skill AI技術(shù)創(chuàng)新能力、產(chǎn)品能力、和市場(chǎng)前瞻性的高度認(rèn)可,也是對(duì)人形機(jī)器人未來發(fā)展的認(rèn)可。

千億新市場(chǎng)來襲,人形機(jī)器人行業(yè)正迎來OpenAI式顛覆

人形機(jī)器人市場(chǎng)正迎來快速增長。

根據(jù)Markets and Markets數(shù)據(jù)顯示,全球人形機(jī)器人市場(chǎng)規(guī)模預(yù)計(jì)將由2023年的18億美元,提升至2028年的138億美元,年復(fù)合增速約50.2%。高盛則預(yù)測(cè),到2035年,全球人形機(jī)器人市場(chǎng)規(guī)模或?qū)⑦_(dá)到1540億美元。

另據(jù)國內(nèi)公開研報(bào)顯示,預(yù)計(jì)到2026年,中國人形機(jī)器人產(chǎn)業(yè)規(guī)模將超過200億元。

Stephanie Zhan指出,“GPT-3 時(shí)刻即將降臨機(jī)器人世界。它將引發(fā)一場(chǎng)巨大的轉(zhuǎn)變,將類似于我們?cè)跀?shù)字智能領(lǐng)域所見的進(jìn)步帶入物理世界。”

隨著全球人口老齡化加劇、勞動(dòng)力成本和需求不斷上升,以及基于AI 大模型技術(shù)的不斷進(jìn)步,包括人形機(jī)器人在內(nèi)的智能設(shè)備迎來新的市場(chǎng)機(jī)會(huì),有望顯著提升制造業(yè)的生產(chǎn)效率和競(jìng)爭力。

值得一提的是,大模型通過其強(qiáng)大的推理能力和上下文理解能力,提升人形機(jī)器人功能的可見性和現(xiàn)實(shí)具象性。通過融合視覺、語音、文本等多模態(tài)信息,增強(qiáng)了人形機(jī)器人的感知和決策能力,從而使人形機(jī)器人能夠更好地理解和感知現(xiàn)實(shí)世界,提升其智能化水平。

不過,當(dāng)前 AI 機(jī)器人市場(chǎng)也存在三個(gè)核心問題。

一是以Skild AI為例的機(jī)器人產(chǎn)品正面臨著市場(chǎng)激烈競(jìng)爭。其中,特斯拉擎天柱正在快速進(jìn)化,馬斯克透露年底會(huì)迎來重大更新;OpenAI 最近恢復(fù)了其機(jī)器人團(tuán)隊(duì),為機(jī)器人公司提供基礎(chǔ)模型;英偉達(dá)也開始發(fā)力機(jī)器人技術(shù);此外億萬富翁 CEO Brett Adcock 掌舵的人形機(jī)器人公司 Figure AI 和 OpenAI 衍生公司Covariant正在為機(jī)器人構(gòu)建 ChatGPT,并已籌集了超過 2 億美元。

二是盈利難。整體來看,人形機(jī)器人造價(jià)高,成本動(dòng)輒幾十萬元,消費(fèi)者和企業(yè)望而卻步。智元機(jī)器人負(fù)責(zé)人曾對(duì)鈦媒體App表示,人形機(jī)器人成本要控制在20萬元人民幣以下才能大規(guī)模生產(chǎn)。但是目前,特斯拉的擎天柱僅材料費(fèi)用就需要4萬美元(約合29萬元);而國內(nèi)的人形機(jī)器人成本更高,比如小米鐵大(Cyber One),每臺(tái)成本達(dá)60-70萬元,因此,目前人形機(jī)器人尚無法實(shí)現(xiàn)大規(guī)模量產(chǎn),更多是在To B制造端進(jìn)行小規(guī)模應(yīng)用。

三是人形機(jī)器人的技術(shù)還不成熟,無法在精細(xì)工作上完全替代人類,距離量產(chǎn)仍遠(yuǎn)。無論是“幻覺”問題,還是機(jī)器人摔倒,都讓人們對(duì)于機(jī)器人技術(shù)保持質(zhì)疑態(tài)度。

而Skild AI設(shè)想了一個(gè)類似 OpenAI 的未來:通過微調(diào),就可以在 Skild 基礎(chǔ)模型上構(gòu)建不同的用例和產(chǎn)品。

這正是他們顛覆機(jī)器人行業(yè)的方式。最終,他們希望抵達(dá)機(jī)器人 AGI,人們可以在物理世界中,與之互動(dòng)。

今年2月,高盛將2035年全球機(jī)器人市場(chǎng)的規(guī)模預(yù)期上調(diào)至380億美元,預(yù)計(jì)出貨量將增長4倍,達(dá)到140萬臺(tái)。

特斯拉CEO馬斯克在2022年特斯拉人工智能日(AI Day)表示:“人形機(jī)器人需求量有望達(dá)到100億臺(tái)—200億臺(tái),人類對(duì)人形機(jī)器人的需求甚至?xí)h(yuǎn)遠(yuǎn)超過汽車?!?/strong>

如今,資本市場(chǎng)已率先升溫。2024年至今,國內(nèi)的人形機(jī)器人行業(yè)投融資事件激增至超過22起,融資金額超過70億元,同比增長300%以上。

其中,美國美國人形機(jī)器人初創(chuàng)公司Figure AI憑借6.75億美元(折合人民幣約49億元),成為2024年上半年全球最大一筆的融資。由此可以看出,人形機(jī)器人市場(chǎng)正在加速發(fā)展。

而在國內(nèi),宇樹科技則憑借近10億元人民幣融資,引領(lǐng)國內(nèi)人形機(jī)器人賽道融資。

總的來說,人形機(jī)器人具有解決勞動(dòng)力短缺、提高工作效率和生活質(zhì)量方面的潛力。新技術(shù)的推動(dòng)為人形機(jī)器人帶來廣泛的應(yīng)用前景,這些機(jī)器人在未來有望成為家庭、醫(yī)療、教育、工業(yè)制造等多個(gè)領(lǐng)域的重要助手。同時(shí),不少投資人認(rèn)為,通過租賃、銷售、服務(wù)等多種商業(yè)模式,人形機(jī)器人企業(yè)有望為社會(huì)提供更多價(jià)值。

分享到

nina

相關(guān)推薦