Nauja Google Meet funkcija, varoma Gemini technologijos, leidžia palaikyti sklandžius ir natūralius pokalbius dirbtinio intelekto dėka.
Google neseniai pristatė revoliucinę funkciją, kuri ne tik verčia ir dubliuoja vaizdo konferencijas realiu laiku iki 100 dalyvių, bet ir imituoja toną, balsą bei emocijas vos su kelių sekundžių vėlavimu. Naujasis vertėjas realiu laiku leidžia palaikyti sklandų pokalbį tarp skirtingomis kalbomis kalbančių pašnekovų.
Kaip tai veikia praktiškai?
„Iki šiol sistema mokėsi balso ir galėjo jį sintetinti bei kalbėti panašiu į jūsų balsu. Šis modelis verčia jūsų garsą ir grąžina jį tiesiogiai. Didžioji šios naujos sistemos revoliucija yra ta, kad verčiame garsą į garsą”, – paaiškina Javier Martínez, Google Cloud pardavimų komandos direktorius.
Išbandyti šią funkciją yra stebėtinai paprasta. Įprastoje vaizdo skambučio sąsajoje galima aktyvuoti sinchroninio vertimo funkciją panašiai, kaip jau egzistuoja subtitrams pridėti. Nuo to momento, jei pašnekovas kalba angliškai, girdėsite jį kalbant ispaniškai. O jei kalbate ispaniškai, jis jus girdės angliškai. Originalus garsas išlieka žemesniame lygyje, o dubliavimas tampa pagrindiniu.
Technologijos pagrindas
Ši nauja funkcija verčia jūsų ištartus žodžius į klausytojo pageidaujamą kalbą – beveik realiu laiku, su maža delsa ir išsaugant jūsų balsą, toną bei išraišką. Sistema pagrįsta Google DeepMind AudioLM technologija, specialiai apmokytu aukštos kokybės kalbos vertimui.
Rezultatas panašus į televizijoje matomą tiesioginį diskurso vertimą, tik šiuo atveju tai, ką girdime, puikiai atitinka kalbančiojo balso toną ir ritmą.
Prieinamumas ir ateities planai
Nuo gegužės mėnesio balso vertimas Google Meet prieinamas beta versijoje Google AI Pro ir Ultra planų prenumeratoriams. Iš pradžių tik anglų ir ispanų kalboms, nors artimiausias savaites bus pridėtos kitos kalbos.
Google patvirtino planus netrukus pridėti italų, vokiečių ir portugalų kalbas. Svarbu tai, kad tik vienas pokalbio dalyvis turi turėti prenumeratą, kad funkcija veiktų visiems.
- Vokietija legalizuoja nuotoliniu būdu valdomus automobilius – pokyčiai nuo gruodžio
- Kaip elektromobiliai įveikė didžiausią savo priešą? Pokyčiai, apie kuriuos mažai kas žino
- „Oppo Find X9 Pro“: naujas flagmanas su 200 MP teleobjektyvu ir milžiniška baterija
- Pietų Korėja taps dirbtinio intelekto galybe: „Samsung“ ir „Hyundai“ gaus daugiau nei 260 tūkst. naujausių „Nvidia Blackwell“ procesorių
- Tele2 antrą dieną iš eilės vėl stringa: klientai pyksta dėl nuolatinių ryšio problemų
Iššūkiai ir ateities perspektyvos
Nors technologija įspūdinga, daugelis kalbos modelių vis dar verčia žodis po žodžio. „Didžiausias iššūkis dabar yra užtikrinti, kad vertimas būtų teisingas ir tinkamas kontekstui”, – teigia Pilar Sánchez Gijón, Barselonos autonominio universiteto vertimo ir interpretavimo katedros profesorė.
Julio Gonzalo, UNED universiteto kalbų ir informacinių sistemų katedros profesorius, mano, kad šių sistemų tobulėjimas ir toliau sparčiai keičia mūsų bendravimo būdus. Einame link „kažkokio tipo įrenginio, galinčio apdoroti tą pačią audiovizualinę informaciją, kurią gauname mes patys”.
Pažiūrėkite, kaip tai veikia:
Ką tai reiškia praktiškai?
Ši technologija atveria naujas galimybes:
- Tarptautiniams verslams bendradarbiauti be kalbos barjerų
- Šeimoms, kurias skiria kalbos, natūraliai bendrauti
- Mokytojams dirbti su daugiakalbėmis klasėmis
- Kelionių ir turizmo sektoriui aptarnauti klientus jų gimtąja kalba
Google Meet realaus laiko vertimas – tai žingsnis į ateitį, kur kalbos barjerai nebetrukdys žmonių bendravimui ir bendradarbiavimui visame pasaulyje.