Microsoftin tutkijat käyttävät ChatGPT:tä ohjatakseen robotteja ja droneja

robot-hand.jpg

OpenAI:n ChatGPT osaa paitsi tuottaa yhtenäisiä tekstivastauksia luonnollisiin kieliin kohdistuviin kysymyksiin, se voi myös olla mukana ihmisen ja robotin välisissä vuorovaikutuksissa ja käyttää sensoritietoja koodin kirjoittamiseen robottien toiminnalle.

Microsoft teki hiljattain tutkimuksen "nähdäkseen pystyykö ChatGPT ajattelemaan pelkän tekstin ulkopuolella ja pääsemään järkeviin tuloksiin fyysisen maailman avulla, jotta se voi auttaa robotiikkatehtävissä." Tavoitteena oli nähdä, voiko ihmisiä käyttää ChatGPT:tä ohjaamaan robotteja ilman ohjelmointikielten oppimista tai robotiikkajärjestelmien ymmärtämistä.

Syvempänä: Nämä asiantuntijat kilpailevat suojellakseen tekoälyä hakkeroinnilta. Aika käy vähiin

"Tärkein haaste tässä on opettaa ChatGPT: lle, kuinka ratkaista ongelmia ottaen huomioon fysiikan lait, toimintaympäristön kontekstin ja kuinka robotin fyysiset toimet voivat muuttaa maailman tilaa", Microsoft Autonomous Systems and Robotics Researchin tiimi mainitsee blogikirjoituksessaan.

Microsoftin tutkijat tutkivat ChatGPT:n kykyä generoida koodia, lähinnä Pythonia, robotiikkakohtauksissa, kuten nollaratkaisusuunnittelu ja koodin generointi, sen jälkeen kun ChatGPT:lle annettiin pääsy objektin havaitsemis- ja objektin etäisyys dataan sovellusliittymien kautta.

ChatGPT pystyy tuottamaan koodia, koska se on koulutettu suurella määrällä koodia ja kirjoitettua tekstiä. Järjestelmä on osoittautunut kykeneväksi ratkaisemaan koodausongelmia ja korjaamaan ohjelmia, lisättynä ainutlaatuisella kyvyllä vastata dialogiin ja pyytä kysymyksiä selventämiseksi. On myös Codex, OpenAI:n GPT-3-pohjainen malli, joka muodostaa perustan GitHubin Copilot-pariohjelmointipalvelulle, joka automaattisesti täydentää koodia kehittäjille useilla kielillä.

Lisäksi: Mikä on ChatGPT? Tässä kaikki mitä sinun tarvitsee tietää

Näiden vuoropuhelu- ja selvennyskykyjen avulla Microsoft testasi ChatGPT:n kykyä kielellisenä rajapintana teknisesti tietämättömän käyttäjän ja lennokkien välillä. Kuten tutkijat huomauttavat paperissaan, vaikka GPT-3, LaMDA ja Codex osoittivatkin lupaavia tuloksia robotiikan suunnittelu- ja koodigenerointitehtävissä, ChatGPT on erityisesti "mahdollisesti monipuolisempi työkalu robotiikan alalla, koska se yhdistää luonnollisen kielimallien ja koodigenerointimallien vahvuudet yhdessä vuoropuhelun joustavuuden kanssa".

Tutkijat huomauttavat blogipostissaan: "ChatGPT pyysi selvennystä, kun käyttäjän ohjeet olivat epäselviä, ja kirjoitti monimutkaisia koodirakenteita kopterille, kuten zik-zak-kuvion hyllyjen visuaaliseen tarkastukseen."

Microsoft testasi ChatGPT:tä käyttämään robottikättä, jolla siirretään lohkoja ympäriinsä Microsoft-logon muodostamiseksi. Tutkijat antoivat myös ChatGPT:lle tehtäväksi kirjoittaa algoritmi drone:n saavuttamiseksi pisteeseen törmäämättä esteisiin. He testasivat myös, osaako ChatGPT päättää, minne robotti pitäisi mennä sensoripalautteen perusteella reaaliajassa.

Google Researchin ja Alphabetin omistaman Everyday Robotsin tutkijat ovat myös työskennelleet samankaltaisissa robotiikkahaasteissa käyttäen suurta kielimallia PaLM:ää (Pathways Language Model). Se auttoi robottia käsittelemään avoimia kysymyksiä ja vastaamaan järkevästi.

Liittyvät artikkelit

Näytä lisää >>