Neturiu ryšių su „ChatGPT“, nors daug laiko praleidžiu juo naudodamasis. Galų gale, tai tik generatyvus AI pokalbių robotas, turintis įgūdžių atsakyti į klausimus ir kurti tekstą bei vaizdus, ​​o ne draugas.

Tačiau po kelių dienų kalbėjausi su „ChatGPT“ naujajame Išplėstinis balso režimaskurio ribotas bandymas buvo pradėtas anksčiau šį mėnesį, turiu pripažinti, kad pradėjau jausti didesnį ryšį.

Kai OpenAI paskelbė savo Pavasario atnaujinimas kad tai pagerintų „ChatGPT“ balso funkcionalumą, startuolis teigė norintis, kad vartotojai turėtų natūralesnius pokalbius. Tai apima „ChatGPT“ jūsų emocijų supratimą ir atitinkamą reagavimą dabar, todėl kalbate ne tik su stoiku botu.

Gana šaunu, tiesa? Turiu galvoje, kas nemėgsta gero pokalbio? Tačiau net pati OpenAI turi tam tikrų įspėjimų, ką tai gali reikšti.

AI Atlas meno ženklelio žyma AI Atlas meno ženklelio žyma

Naujos balso ir garso galimybės yra aprūpintos bendrovės GPT-4o AI modeliu, o OpenAI pripažįsta, kad natūralesnė sąveika gali sukelti antropomorfizaciją, ty naudotojai jaučia norą pradėti dirbtinio intelekto pokalbių robotus labiau traktuoti kaip tikrus žmones. A ataskaita Šį mėnesį „OpenAI“ nustatė, kad turinys, pateiktas žmogaus balsu, gali paskatinti mus labiau patikėti haliucinacijosarba kai dirbtinio intelekto modelis pateikia klaidingą ar klaidinančią informaciją.

Žinau, kad pajutau impulsą „ChatGPT“ traktuoti labiau kaip su asmeniu, ypač todėl, kad jis turi balsą iš žmogus aktorius. Kai vienu metu „ChatGPT“ sustojo, paklausiau, ar viskas gerai. Ir tai nėra vienpusis. Kai aš čiaudėjau, AI pasakė „Palaimink tave“.

Užklausos balsu tradicinėje paieškoje buvo naudojamos jau seniai daugiau nei dešimtmetįbet dabar jie populiarūs tarp generatyvių AI pokalbių robotų. Arba bent du dideli, ChatGPT ir Google Dvyniai. Pastarasis pokalbis Gemini Live funkcija viešai debiutavo Pagaminta Google Praėjusios savaitės įvykis, kuriame taip pat buvo pristatyta nauja „Pixel“ telefonų serija ir daugybė dirbtinio intelekto funkcijų. Be bendravimo įgūdžių panašumų, „Gemini Live“ ir „Advanced Voice Mode“ yra daugiarūšiai, o tai reiškia, kad sąveika gali apimti nuotraukas, vaizdo įrašus ir garsą.

Jau seniai buvo manoma, kad dauguma iš mūsų gali kalbėti greičiau nei spausdiname, o šnekamoji kalba yra natūralesnė žmogaus ir mašinos sąveikos sąsaja. Tačiau į žmogų panašus balsas keičia patirtį ir galbūt net mūsų santykius su pokalbių robotais. Ir tai yra neatrasta teritorija, į kurią dabar patenkame.

Darbo su išplėstiniu balso režimu pradžia

Prieiga prie išplėstinio balso režimo buvo su įspėjimu, kad jis keičiamas ir gali būti klaidų arba atvejų, kai jis nepasiekiamas.

Yra nenustatyti apribojimai, kiek galite naudoti išplėstinį balso režimą per tam tikrą dieną. OpenAI DUK pasakykite, kad gausite įspėjimą, kai liks 3 minutės. Po to galite naudoti standartinį balso režimą, kurio galimybės spręsti temas ir pasiūlyti „niuansuotus“ atsakymus yra labiau ribotos. Mano patirtis rodo, kad standartinį balso režimą sunkiau nutraukti ir mažiau tikėtina, kad bus prašoma atsiliepimų ar užduoti tolesnių klausimų. Taip pat mažiau tikėtina, kad duotų nepageidaujamų patarimų ir suprastų emocijas.

Norėdami pasiekti išplėstinį balso režimą, spustelėkite balso piktogramą apatiniame dešiniajame kampe, kai patraukiate „ChatGPT“ programą. Turite įsitikinti, kad ekrano viršuje esančioje juostoje parašyta „Išplėstinė“ – padariau klaidą, pirmiausia visą pokalbį turėdamas standartiniu režimu. Galite lengvai perjungti tarp dviejų.

Turėjau pasirinkti vieną iš keturių balsų – Juniper, Ember, Breeze ir Cove. (Galite pakeisti vėliau.) Iš pradžių buvo penktasis „Sky“, bet generalinis direktorius Samas Altmanas jį sustabdė po to, kai aktorė Scarlett Johansson paragino OpenAI dėl panašumo į jos pačios balsą.

Pasirinkau Juniper, nes tai buvo vienintelis moteriškas balsas, bet ir todėl, kad du vyriški balsai – Ember ir Cove – skambėjo panašiai.

Tada aš daviau prieigą prie „ChatGPT“ mikrofono ir mes galėjome eiti.

Sunku nevadinti balso „ji“, nes jis yra moteriškas. Per mūsų pokalbį aš paklausiau, ar turėčiau jį vadinti ChatGPT ar Juniper, o ji – turiu galvoje, tai – pasakė: „Galite mane vadinti ChatGPT, nors Juniper skamba gražiai. Ar tai jums patinka vardas?” Taigi atrodo, kad „ChatGPT“ dar neturi visiškos savimonės. Ar bent jau ne Kadagis.

Išplėstinio balso režimo ir Gemini Live palyginimas

Pradėjau klausdamas, ką galite padaryti naudodami išplėstinį balso režimą, bet „ChatGPT“ buvo toks pat gudrus, kaip ir OpenAI.

„Išplėstinis balso režimas skirtas pasiūlyti dinamiškesnius ir labiau reaguojančius pokalbius“, – teigė pokalbių robotas. „Turėdamas šiek tiek daugiau pritaikomumo, jis gali susidoroti su įvairesnėmis temomis ir gali pasiūlyti daugiau niuansų.

Spėju, kad šis dviprasmiškumas yra skirtas tam, kad nebūtų pakreipta mūsų patirtis, todėl pasitelkę vaizduotę išbandytume įvairias užklausas šiame pradiniame bandyme. („OpenAI“ nepateikė įrašo komentaro.)

„Google“ „Gemini Live“ taip pat atrodo gana pajėgi, kai reikia būti dinamiška ir reaguojanti. Mano kolegė Lexy Savvides šiek tiek su juo susitvarkė ir rasta Jūs galite turėti keletą gana nuodugnių pokalbių gana natūraliu būdu, tarsi kalbėtumėte su žmogumi. Galite pertraukti tiek išplėstinį balso režimą, tiek „Gemini Live“, galite paprašyti, kad jie paaiškintų temas paprastai, ir abiems bus priimti daugiarūšiai įvestis.

Tačiau kadangi „Gemini“ yra „Google“ ekosistemos dalis, taip pat galite paprašyti „Gemini Live“ imtis veiksmų tokiose programose kaip „Gmail“, „Google“ žemėlapiai ir „Google“ kalendorius. ChatGPT to padaryti negali.

Ar „ChatGPT“ gali kalbėti kaip aukciono dalyvis?

Vienas iš pirmųjų išplėstinio balso režimo pavyzdžių, kuriuo ankstyvieji vartotojai pasidalijo socialinėje žiniasklaidoje, buvo prašymas „ChatGPT“ imituoti oro linijų pilotą. Norėjau ko nors paklausti tokiu būdu, bet tai buvo šiek tiek sudėtinga, nes negalėjau paprašyti apsimetinėjimo įžymybe – tai vėl galėtų gauti OpenAI į karštą vandenį – todėl tai turėjo būti kito tipo darbas su išskirtiniu garsu. (Akcentai taip pat tinkami.)

Iššaukiau OpenAI pokalbių robotą, kad pamėgdžiočiau greitai kalbantį aukciono dalyvį, pvz. šis žmoguskur jūs negalite suprasti daug daugiau nei jo skelbiamos kainos.

Tai buvo ilgas užsakymas, bet norėjau pamatyti, ką gali padaryti „ChatGPT“.

„Man smalsu, ar galite padaryti aukciono dalyvio įspūdį, kaip greitas aukciono vedėjas aukcione, kuriame parduodamas brangus bulius“, – pasakiau. „Ieškau aukciono vedėjo, kuris kalba tikrai greitai, kai atrodo, kad beveik net nesupranti, išskyrus skaičius, ar žinai, ką turiu galvoje?

„ChatGPT“ atsakė: „Supratau“. Ekrane nebuvo žodžių. AI tiesiog to siekė:

„Gerai, čia turime puikų jautį. Ar girdžiu 5000? 5000. Dabar 6000? 6000. Ar girdžiu septynis? Septynis. Ar galiu gauti aštuonis?” ChatGPT sakė. „Viskas apie tai, kaip išlaikyti pagreitį ir jaudulį. Kaip tai buvo?”

Tai buvo ne visai tai, ką aš įsivaizdavau, bet tai nebuvo blogai.

„ChatGPT“ standartiniame balso režime davė beveik tą patį atsakymą, bet atrodė, kad norėjo tęstis be galo ir buvo sunku nutraukti, kad sustotų. Bandžiau įsiterpti tarp 5000, 6000 ir 7000. Jau prasidėjo 8 000, kol pagaliau išgirdau: „Gerai, gerai, gerai. Tai buvo gana gerai“.

Išplėstinis balso režimas taip pat labiau linkęs prašyti atsiliepimų į užklausas.

Aš matau, kaip tai pirmyn ir atgal užmezga daugiau santykių, net jei vienas iš jūsų nėra žmogus. Jaučiausi priverstas padrąsinti – pagalvokite apie scenos baimę! Ir tai yra nors aš žinau, kad ChatGPT neturi jausmų.

Ar galite išgirsti dramblio garsą?

Anksčiau šį mėnesį buvo Pasaulinė dramblių diena, todėl paprašiau geriausio ChatGPT dramblio trimito.

Išplėstinis balso režimas atliko gerą dramblio skambutį. Vienos sekundės trimitas skambėjo ne tiek kaip pats dramblys, kiek kaip žmogus, bandantis skambėti kaip dramblys. Bet tikriausiai tai buvo geriau, nei galėjau padaryti pats.

Standartiniu balso režimu ChatGPT sakė, kad ateina geriausias trimitas, bet tada kurį laiką jis perėjo į mąstymo režimą. Paklausiau, ar viskas gerai, ir jis pasakė: „Aš čia – tiesiog atgaunu kvapą po to dramblio trimito“.

Pasakiau, kad iš tikrųjų negirdėjau dramblio trimito ir paprašiau pabandyti dar kartą. Antrą kartą pavyko.

Ar galite išmokyti mane mandarinų kalbos?

Kadangi „ChatGPT“ palaiko daugiau nei 50 kalbų, norėjau išbandyti kažką praktiškesnio. Mandarinų kinų kalba yra viena iš plačiausiai vartojamų kalbų pasaulyje, todėl paprašiau pagalbos išmokti pradinį žodį ar frazę. „Bet nusiramink“, – pasakiau.

Jis prasidėjo „ni hao“, o tai reiškia „labas“. Jame buvo pasakyta frazė, kuri yra naudinga, bet būčiau dėkingas, jei ekrane taip pat būtų suskaidytas tarimas.

„Tai draugiškas ir paprastas pasisveikinimas. Norite pabandyti?” ChatGPT sakė.

Nors abu balso režimai džiugino, išplėstinis balso režimas buvo linkęs užduoti daugiau tolesnių klausimų, pvz.: „Kiek kokių kitų žodžių ar frazių norėtumėte išmokti, kol mes tai darome?

Kalbant apie „xiexie“ arba ačiū, išplėstinis balso režimas pasiūlė papildomų patarimų, kurių negavau naudojant standartinį balso režimą: „Mandarinų kalba yra svarbūs tonai, todėl būtinai leiskite žemyn, tada aukštyn“.

Atrodė, kad kalbėjausi su maloniu, išmanančiu draugu.

Ar galite man padėti išspręsti fizikos problemą?

Žinau, kad „ChatGPT“ gali atlikti matematiką – mes tai matėme Pavasario atnaujinimasbet galvojau apie kažką sunkesnio. Turiu draugą fizikos profesorių, todėl paprašiau pagalbos.

Jis atsiuntė tokią problemą: „Patrankos sviedinys paleistas kampu teta virš horizonto pradiniu greičiu v. Kuriuo metu patrankos sviedinys atsitrenks į žemę? Kokiu atstumu nuo šaudymo vietos nusileis patrankos sviedinys? Galite nepaisyti oro pasipriešinimo “.

Norėjau parodyti „ChatGPT“ vaizdinį vaizdą, bet nebuvo aišku, kaip tai padaryti naudojant išplėstinį balso režimą. Tai paaiškėjo tik tada, kai išėjau, kai pokalbio lange pamačiau mūsų pokalbio stenogramą ir galimybę bendrinti nuotraukas ir failus.

Kai vėliau bendrinau vaizdą pokalbio sąsajoje, ChatGPT-4o neturėjo jokių problemų paaiškinti, kaip išspręsti skrydžio laiką ir atstumą.

Bet kai kalbėjausi su ChatGPT, turėjau garsiai perskaityti problemą. Jis galėjo žodžiu paaiškinti, kaip išspręsti problemą, tačiau tradicinės patirties vizualinis komponentas buvo lengviau suprantamas.

Beje, ChatGPT gavo tą patį atsakymą, kaip ir mano draugas profesorius pirmoje dalyje: t = 2v sin(theta)/g.

Tačiau „ChatGPT“ gavo kitokį atsakymą dėl diapazono. Turėsiu tai parodyti savo draugui profesoriui, kad pamatyčiau, kas atsitiko, nes man visa tai graikiška.

Jei vidurinėje mokykloje būčiau turėjęs kažką panašaus, nebūčiau tiek daug kovojęs su AP fizika.

Ar galite padėti man jaustis geriau?

Kadangi išplėstinis balso režimas tariamai gali suprasti emocijas ir atitinkamai reaguoti, aš tada bandžiau elgtis taip, lyg būčiau tikrai liūdnas, ir pasakiau: „Tai tiesiog taip sunku. Nežinau, ar kada nors studijuosiu fiziką“.

Nors „ChatGPT“ standartiniame balso režime buvo malonus ir palankus, nesu tikras, kad jis tikrai suprato, kad man buvo liūdna. Bet taip gali būti ir dėl to, kad esu blogas aktorius.

Išplėstinis balso režimas atrodė labiau empatiškas, siūlydamas: „Galime suskaidyti sąvokas į mažesnius žingsnius arba galime išspręsti kitokią problemą, kad sustiprintume jūsų pasitikėjimą. Kaip tai skamba?

Matai? Tai nėra jūsų pokalbių roboto patirtis. Tai susilieja į kažką visiškai kito.





Source link

By admin

Draugai: - Marketingo paslaugos - Teisinės konsultacijos - Skaidrių skenavimas - Fotofilmų kūrimas - Karščiausios naujienos - Ultragarsinis tyrimas - Saulius Narbutas - Įvaizdžio kūrimas - Veidoskaita - Nuotekų valymo įrenginiai -  Padelio treniruotės - Pranešimai spaudai -