波士頓動力的「大黃狗」Spot 可以說是網紅機器人的典范。 - s. |" u0 n0 u* c/ J' @% O& i3 T
會巡邏、會搬磚、會跳舞 Spot 自誕生以來就吸引了全世界機器人愛好者的目光,誰能拒絕像這樣一條動作靈活、姿態憨厚,還會賣萌的機器狗呢。 5 S; ?6 ?, H' j
7 ], Z t% j* N2 Y1 a5 G+ k6 _
經過多年的發展,賣萌已經不再是 Spot 的「主業」,根據波士頓動力的介紹,Spot 現在能幫助人類完成一些特定場景下的工作,例如在跨洋輪船上檢測儀表、參與地勢復雜的勘測或救援工作等等。
6 `3 L! r; y+ k4 G7 ] L
8 n+ [' j1 @! n! |5 n+ b% \
如果給 Spot 這么靈活的身軀,裝上一個像 ChatGPT 這么聰明的大腦,會發生什么?
7 P4 d6 G# ~1 L1 A
人工智能專家 Santiago Valdarrama 還真做出來了這么一條擁有「最強大腦」的 Spot。 9 v/ t9 B0 k2 `( N5 X
用 ChatGPT 大幅簡化人機交互
' |- o$ r; ]5 o# ^( |" ]4 s
Santiago 在 Twitter 上分享了他與改造版 Spot 互動的視頻,這可能是史上第一條會講話、會聊天的機器狗。 % r0 J0 G4 u3 a, T
在演示視頻中可以看到,Spot 并不僅僅是裝了個「Siri」那么簡單,當它在回答人類問題時,它的身體也會隨著語句的內容和語調一起擺動,看上去就像是科幻片中的 Wall-E 走進了現實。
5 @/ }$ u6 h. w# e5 _% s
5 \5 U3 R( X/ v, c5 h
當你問到一些「Yes Or No」的簡單問題時,它還會用「點頭」「搖頭」等身體語言代替語音來回答你,由此可見 Spot 遠不是內置了一個智能音箱那么簡單。
6 i9 s7 m/ ]& p( T C
+ l/ o6 x5 ^$ u. ]/ t
接入 ChatGPT 后,Spot 最大的變化就是聽得懂人話,并且能夠和使用者用自然語言交流。
( G- {6 ^! _0 F5 t3 v3 i5 e
Santiago 演示了一個場景,他跟 Spot 說因為它太礙事導致房間太擁擠了,讓它往后稍稍,話音剛落 Spot 就理解了 Santiago 的意思,往后退了幾步。 怎么樣,是不是已經有科幻電影中呼喚機器人工作那味了。
5 b/ }3 y0 M' g& U/ u H, u
過去操作 Spot 需要用類似無人機的大型遙控器或者用電腦輸入復雜的指令,而現在 ChatGPT 的加入賦予了 Spot 強大的自然語言理解能力,動動嘴就能與機器人交互。
. X3 h) V* k; K; P/ O4 j
在這個過程中,ChatGPT 擔任了人類與機器人之間的翻譯,把人類輸入的「人話」變成機器能看懂的指令,再把機器人的反饋用實際行為或者「人話」表達出來。
7 ^/ B/ S4 h" I
4 E4 w n, f7 |/ O1 `9 k
Santiago 介紹,他們把 Spot 的文件輸進了 ChatGPT,并向其解釋了文件的結構以及如何讀取這個文件,從而實現了與 Spot 語音對話和操作。
$ }; G! t" ^1 i9 S! b0 B" D
操作員與 Spot 之間的交互被大幅簡化,人們可以直接問它:「你的電量還有多少?」,然后 Spot 就會用語音的方式回答,這其中用到了 Google 文字轉語音的技術,再把 ChatGPT 的答復經 Spot 的「口」講出來。 3 k' F. d) R- A! B6 `
% N9 D( I* L4 C! b' S& k
Spot(或者說內置的 ChatGPT)會根據實際情況來回答問題,例如當你問它接下來要完成什么任務時,它會根據設定好的任務列表來作答,這在很大程度上避免了 ChatGPT 編造事實的情況。 + H( y% U' _8 w5 |5 l/ a/ Z
當操作者給 Spot 下達像轉向 90 度、前進 1 米這樣的命令時,Spot 會聯動內部的傳感器和定位系統,精準地響應這些命令,不會說因為「大腦過于發達」而失去控制。 - y5 J9 ]/ @! ~# l7 e
& W T) Z1 w) j& s( N6 J1 ~- C
有趣的是,當你問它「你是誰?」的問題時,它會回答「我是 OpenAI。」,而不是機器狗 Spot。 ' I9 J$ h. S+ p
Santiago 所在的公司 Levatas 是一家與波士頓動力合作的 AI 公司,為企業提供專業解決方案,幫助企業探索如何利用機器人解決實際問題。 V5 G' f" w$ ~; E. ^6 u6 x
Santiago 認為,給 Spot 裝上 ChatGPT 最大的實際意義,是把原本只有技術人員才能處理的復雜數據變成了任何人都能看得懂、聽得懂的自然語言。 ; c8 }' M5 c1 T
% O1 ^3 L* ?% o K8 `0 G0 v* d
機器人每次在執行任務前,都要輸入冗長的指令集;在結束工作后,還會產生大量的數據,只有最專業的技術人員才能從這些數據中分析出問題。 2 Y) m3 t2 N( E0 j- _( w1 B
但現在通過 ChatGPT,簡單的兩句話就能搞定。 5 T# H: w- S( i: T. i8 f
當機器人的操作門檻變低之后,機器人的使用場景就會隨之變得豐富起來。
9 \( A1 }7 V/ U9 r1 @- F |