Tekoälyn mahdollisuudet videotuotannossa
Videotuotanto on muuttunut merkittävästi viime vuosina. Mitä ovat tekoälyn hyödyt mahdollisuudet videotuotannossa?
29.1.2024
Tekoäly videotuotannossa – mitä tekoälyllä, eli keinoälyllä, eli AI:lla voi tuoda videotuotantoon?
^Terminaattori ampuu kameralla. Kuvan generointiin Midjourneylla meni noin yksi minuutti.
Videotuotanto on prosessi, jossa on erilaisia tekoälylle soveltuvia osasia. Monet tekoälykehittäjät ovat myös ottaneet videotuotannon ja vaikkapa valokuvauksen sekä äänituotannon ja musiikkituotannon pelikentäkseen. Ja tällä pelikentällä tapahtuu paljon ja nopeasti. Kehitys menee eteenpäin vauhdilla ja lähes viikoittain saa lukea jostain uudesta palvelusta tai mahdollisuudesta, mitä kaikkea keinoälyllä voikaan videolle tehdä.
Siksipä tämäkin artikkeli vanhentunee nopeahkosti, mutta onpahan mukava ajankuva historiassa.
Tekoälysovelluksia on jo niin paljon eri vaiheisiin, että ei ole mielekästä tässä alkaa käymään läheskään kaikkea läpi, emmekä edes tiedä kaikkea.
Katsotaan, mitä me olemme kokeilleet.
Useimmat lienee tutustuneet ensimmäistä kertaa kunnolla generatiiviseen tekoälyyn loppuvuodesta 2022 ChatGPT:n merkeissä.
Chat vastaa, kun siltä kysyy. Siltä on joskus hauska kysyä apua vaikkapa ideoiden tai konseptien merkeissä. Mutta helpotusta tähän työhön ei ole luvassa, sillä useimmiten ideat ja konseptit ovat jo nähtyjä, ilmeisiä ja ennalta-arvattavia. Uuden ideoimiseen chatin ilmaisversio ei ainakaan ole mikään varsinainen Sampo.
Videoista usein laaditaan ns. treatment, jossa videon suunnittelijat kertovat videosta, mitä siinä tapahtuu, miten video toteutetaan jne. Treatmentissa monesti voidaan näyttää vaikkapa referenssikuvia tavoitellusta kuvamaailmasta. Tähän tarkoitukseen generatiivinen tekoäly tulee erittäin hyödylliseen käyttöön. Erilaiset ”text-to-image” eli tekstistä kuvaksi -palvelut toimivat ikään kuin rajattomana kuvapankkina.
Kuvia voi generoida vaikkapa kuvakäsikirjoitusta varten tai vain havainnollistamaan vaikkapa hahmoa tai tuotetta, rajausta ja valo-olosuhteita. Hyväksi havaitsemiamme kuvageneraattoreita ovat esimerkiksi Adobe Firefly sekä jo vahvan jalansijan markkinoilla ottanut Midjourney.
^Gorilla kameran kanssa keskiaikaiseen öljymaalaustyyliin, Midjourneylla kuvan generointiin meni noin yksi minuutti.
Alkuhuumassa siltä oli hauskaa pyytää erilaisia kirjoitelmia, keksittyjä laulun sanoja tiettyyn tyyliin, lyhyitä tarinoita tietyillä elementeillä sekä vaikkapa mainoscopyja. Hauskaa ja yllättävää! Pian siitä meni kuitenkin maku. Se tuntui tekevän vähän niin kuin sen näköistä, mutta ei sitä itseään. Tekoälyn kirjoittamat tarinat niin ikään ovat ennalta-arvattavia, eikä niissä tapahdu mitään kovin yllättävää. Toisaalta taas joskus tapahtuu yllättävänkin tyhmää tai epäloogista.
Tekoäly kuulemma generoi jo valmiiksi olevasta materiaalista ja datasta. Täysin uutta sillä tuntuu olevan vaikeaa luoda.
Käsikirjoitusapuna ihan kiva vaikkapa puhtaaksikirjoitusvaiheessa, jos tekstiä on paljon.
Kuvitellaan tilanne, että firman johtajalla on tervehdysteksti, jonka hän haluaisi organisaatiolleen lähettää videona. Tämä voidaan tehdä normaalisti kuvaamalla esiintyjä kameralle. Video sitten siistitään, ehkäpä tekstitetään ja mahdollisesti tekstittämällä siitä luodaan versio Englanniksi.
Olemme kokeilleet esimerkiksi Heygen -nimistä palvelua. Heygenissä voi paitsi generoida tekstiä omien vaatimusten mukaan tai laittaa itse kirjoitettu teksti palveluun, ladata myös vaikkapa still-kuvan johtajasta samaan paikkaan ja laittaa tämä puhumaan kyseinen teksti. Ei tarvita kuvauksia eikä editointia, saat videon palvelusta nimittäin myös tekstitettynä. Palvelussa voit myös kääntää tekstin eri kielille ja laittaa firman johtajan puhumaan vaikka Mandariiniksi. Toki johtajan pää ja suu liikkuvat, mutta on se vielä aika epäaidon näköinen, mutta toisaalta monissa tapauksissa tämä voi ajaa asiansa.
Heygenissä voi tehdä huomattavasti uskottavamman näköisiä kieliversiota oikeasti kuvatusta videopätkästä.
Jos johtajan tervehdys on kuvattu vaikkapa Suomeksi studiossa ja tämä ladataan palveluun sekä käännetään siellä, esiintyjä voidaan laittaa ihan mukavasti puhumaan vaikkapa Englanniksi (erilaisilla aksenteilla), Arabiaksi, Venäjäksi, Ranskaksi, Japaniksi, Ruotsiksi, Saksaksi yms ja jne.
Usein viestintään ja markkinointiin käytettävissä videoissa kuuluu kertojaääni eli voiceover. Näihin liittyviä palveluita on paljon ja olemme kokeilleet muutamaa. Monet täysin synteettiset puhujaäänet ovat vielä aika konemaisen kuuloisia, eivätkä kuulosta aidolta ihmisen puheelta. Joihinkin palveluihin voi kuitenkin syöttää esimerkiksi lyhyen näytteen vaikkapa omasta tai haluamastaan äänestä, jolle voi palvelussa syöttää tekstiä, jota tämä sitten puhuu. Näin tulee jo huomattavasti aidomman kuuloista kertojaääntä.
Esimerkiksi Play.HT ja Descript ovat käteväksi havaittuja palvelualustoja voiceovereihin.
Voi, kun tekisimmekin vain englanninkielisiä videoita, niin kyllä olisi helppoa. Nykyisissä versioissa ammattimaisissa videoeditointiohjelmissa on jo sisäänrakennettu puheentunnistus ja tekstitysominaisuus, mutta ei Suomeksi.
Suomenkielisiä videoita voi ladata kyllä palveluihin, esimerkiksi yksinkertaisimmillaan Microsoft Streamiin, joka kuuluu ns. Microsoft Office -pakettiin ja palvelu generoi puheentunnistustekniikalla valmiin tekstitystiedoston, jonka voi taas viedä sinne videoeditointiohjelmaan, jossa sitten tsekataan ja tarvittaessa muokataan tekstitystä.
Mutta voi, jos siellä onkin joku erisnimi, niin eihän se välttämättä tule isolla kirjaimella. Ja jos joku puhuu murretta, niin heti on systeemit sekaisin.
Suomi on pieni kielialue ja tässä sen on saanut huomata. Esimerkiksi Englanniksi tilanne on aivan toinen.
Tällä hetkellä olemme siinä tilanteessa, että tekoäly on mahtava lisäosa pieniin korjauksiin ja yksityiskohtiin videoissa sekä videotuotannossa. Sillä voi nopeuttaa kyllä jotain teksitysasioita, taustoista voidaan poistaa helpommin ei-toivottuja elementtejä, kertojaääntä voidaan muokata äänityksen jälkeen puhumaan sittenkin hieman erilailla joku asia, dronenkin voi laittaa itsekseen tekemään ns. perus lentoradat kuvauspaikalla.
Markkinoilla on siis monia pieniä ja avittavia juttuja, joita mielellämme käytämme ja jäämme odottamaan innolla tekoälyn kehitystä ja sen tuomia uutuuksia myös videotuotantoon.
Videotuotanto on muuttunut merkittävästi viime vuosina. Mitä ovat tekoälyn hyödyt mahdollisuudet videotuotannossa?
Tämän vuoden Oscar-gaala lähestyy kovaa vauhtia. Kuvaajamme Samuli tarkastelee tämän vuoden parhaan kuvauksen ehdokkaita.
Teemme tarjouksen ja projektin toteutusideat aina maksutta.