Nauja Google Meet funkcija, varoma Gemini technologijos, leidžia palaikyti sklandžius ir natūralius pokalbius dirbtinio intelekto dėka.
Google neseniai pristatė revoliucinę funkciją, kuri ne tik verčia ir dubliuoja vaizdo konferencijas realiu laiku iki 100 dalyvių, bet ir imituoja toną, balsą bei emocijas vos su kelių sekundžių vėlavimu. Naujasis vertėjas realiu laiku leidžia palaikyti sklandų pokalbį tarp skirtingomis kalbomis kalbančių pašnekovų.
Kaip tai veikia praktiškai?
„Iki šiol sistema mokėsi balso ir galėjo jį sintetinti bei kalbėti panašiu į jūsų balsu. Šis modelis verčia jūsų garsą ir grąžina jį tiesiogiai. Didžioji šios naujos sistemos revoliucija yra ta, kad verčiame garsą į garsą”, – paaiškina Javier Martínez, Google Cloud pardavimų komandos direktorius.
Išbandyti šią funkciją yra stebėtinai paprasta. Įprastoje vaizdo skambučio sąsajoje galima aktyvuoti sinchroninio vertimo funkciją panašiai, kaip jau egzistuoja subtitrams pridėti. Nuo to momento, jei pašnekovas kalba angliškai, girdėsite jį kalbant ispaniškai. O jei kalbate ispaniškai, jis jus girdės angliškai. Originalus garsas išlieka žemesniame lygyje, o dubliavimas tampa pagrindiniu.
Technologijos pagrindas
Ši nauja funkcija verčia jūsų ištartus žodžius į klausytojo pageidaujamą kalbą – beveik realiu laiku, su maža delsa ir išsaugant jūsų balsą, toną bei išraišką. Sistema pagrįsta Google DeepMind AudioLM technologija, specialiai apmokytu aukštos kokybės kalbos vertimui.
Rezultatas panašus į televizijoje matomą tiesioginį diskurso vertimą, tik šiuo atveju tai, ką girdime, puikiai atitinka kalbančiojo balso toną ir ritmą.
Prieinamumas ir ateities planai
Nuo gegužės mėnesio balso vertimas Google Meet prieinamas beta versijoje Google AI Pro ir Ultra planų prenumeratoriams. Iš pradžių tik anglų ir ispanų kalboms, nors artimiausias savaites bus pridėtos kitos kalbos.
Google patvirtino planus netrukus pridėti italų, vokiečių ir portugalų kalbas. Svarbu tai, kad tik vienas pokalbio dalyvis turi turėti prenumeratą, kad funkcija veiktų visiems.
- Kiek pinigų galima priimti į banko sąskaitą iš artimųjų, draugų ir pažįstamų: kokios ribos nereikėtų peržengti
- ES priėmė sprendimą dėl vairuotojo pažymėjimų ir senjorų. Protingas sprendimas. Tai dalis didesnių pokyčių
- „Xiaomi“ pristato naują išmanųjį telefoną – „Redmi Note 14 SE 5G“: ką žinome jau dabar
- Lietuviai nebeperka prabangių automobilių, pavyzdžiui „Mercedes-Benz“ už 100 tūkst. eurų. Dabar daugelis imasi nuomos
- Pagal ES teisės aktus, nuo kitų metų saulės panelės / elektrinės turi būti privalomas naujų pastatų elementas
Iššūkiai ir ateities perspektyvos
Nors technologija įspūdinga, daugelis kalbos modelių vis dar verčia žodis po žodžio. „Didžiausias iššūkis dabar yra užtikrinti, kad vertimas būtų teisingas ir tinkamas kontekstui”, – teigia Pilar Sánchez Gijón, Barselonos autonominio universiteto vertimo ir interpretavimo katedros profesorė.
Julio Gonzalo, UNED universiteto kalbų ir informacinių sistemų katedros profesorius, mano, kad šių sistemų tobulėjimas ir toliau sparčiai keičia mūsų bendravimo būdus. Einame link „kažkokio tipo įrenginio, galinčio apdoroti tą pačią audiovizualinę informaciją, kurią gauname mes patys”.
Pažiūrėkite, kaip tai veikia:
Ką tai reiškia praktiškai?
Ši technologija atveria naujas galimybes:
- Tarptautiniams verslams bendradarbiauti be kalbos barjerų
- Šeimoms, kurias skiria kalbos, natūraliai bendrauti
- Mokytojams dirbti su daugiakalbėmis klasėmis
- Kelionių ir turizmo sektoriui aptarnauti klientus jų gimtąja kalba
Google Meet realaus laiko vertimas – tai žingsnis į ateitį, kur kalbos barjerai nebetrukdys žmonių bendravimui ir bendradarbiavimui visame pasaulyje.