Tekoäly videotuotannossa

29.1.2024

Tekoäly videotuotannossa – mitä tekoälyllä, eli keinoälyllä, eli AI:lla voi tuoda videotuotantoon?

^Terminaattori ampuu kameralla. Kuvan generointiin Midjourneylla meni noin yksi minuutti.

Videotuotanto ja tekoäly

Videotuotanto on prosessi, jossa on erilaisia tekoälylle soveltuvia osasia. Monet tekoälykehittäjät ovat myös ottaneet videotuotannon ja vaikkapa valokuvauksen sekä äänituotannon ja musiikkituotannon pelikentäkseen. Ja tällä pelikentällä tapahtuu paljon ja nopeasti. Kehitys menee eteenpäin vauhdilla ja lähes viikoittain saa lukea jostain uudesta palvelusta tai mahdollisuudesta, mitä kaikkea keinoälyllä voikaan videolle tehdä.

Siksipä tämäkin artikkeli vanhentunee nopeahkosti, mutta onpahan mukava ajankuva historiassa.

Tekoälysovelluksia on jo niin paljon eri vaiheisiin, että ei ole mielekästä tässä alkaa käymään läheskään kaikkea läpi, emmekä edes tiedä kaikkea.

Katsotaan, mitä me olemme kokeilleet.

Videoiden konseptit ja ideat

Useimmat lienee tutustuneet ensimmäistä kertaa kunnolla generatiiviseen tekoälyyn loppuvuodesta 2022 ChatGPT:n merkeissä.

Chat vastaa, kun siltä kysyy. Siltä on joskus hauska kysyä apua vaikkapa ideoiden tai konseptien merkeissä. Mutta helpotusta tähän työhön ei ole luvassa, sillä useimmiten ideat ja konseptit ovat jo nähtyjä, ilmeisiä ja ennalta-arvattavia. Uuden ideoimiseen chatin ilmaisversio ei ainakaan ole mikään varsinainen Sampo.

Videon treatment

Videoista usein laaditaan ns. treatment, jossa videon suunnittelijat kertovat videosta, mitä siinä tapahtuu, miten video toteutetaan jne. Treatmentissa monesti voidaan näyttää vaikkapa referenssikuvia tavoitellusta kuvamaailmasta. Tähän tarkoitukseen generatiivinen tekoäly tulee erittäin hyödylliseen käyttöön. Erilaiset ”text-to-image” eli tekstistä kuvaksi -palvelut toimivat ikään kuin rajattomana kuvapankkina.

Kuvia voi generoida vaikkapa kuvakäsikirjoitusta varten tai vain havainnollistamaan vaikkapa hahmoa tai tuotetta, rajausta ja valo-olosuhteita. Hyväksi havaitsemiamme kuvageneraattoreita ovat esimerkiksi Adobe Firefly sekä jo vahvan jalansijan markkinoilla ottanut Midjourney.

^Gorilla kameran kanssa keskiaikaiseen öljymaalaustyyliin, Midjourneylla kuvan generointiin meni noin yksi minuutti.

Videon käsikirjoitus

Alkuhuumassa siltä oli hauskaa pyytää erilaisia kirjoitelmia, keksittyjä laulun sanoja tiettyyn tyyliin, lyhyitä tarinoita tietyillä elementeillä sekä vaikkapa mainoscopyja. Hauskaa ja yllättävää! Pian siitä meni kuitenkin maku. Se tuntui tekevän vähän niin kuin sen näköistä, mutta ei sitä itseään. Tekoälyn kirjoittamat tarinat niin ikään ovat ennalta-arvattavia, eikä niissä tapahdu mitään kovin yllättävää. Toisaalta taas joskus tapahtuu yllättävänkin tyhmää tai epäloogista.

Tekoäly kuulemma generoi jo valmiiksi olevasta materiaalista ja datasta. Täysin uutta sillä tuntuu olevan vaikeaa luoda.

Käsikirjoitusapuna ihan kiva vaikkapa puhtaaksikirjoitusvaiheessa, jos tekstiä on paljon.

Tekstistä videoksi

Kuvitellaan tilanne, että firman johtajalla on tervehdysteksti, jonka hän haluaisi organisaatiolleen lähettää videona. Tämä voidaan tehdä normaalisti kuvaamalla esiintyjä kameralle. Video sitten siistitään, ehkäpä tekstitetään ja mahdollisesti tekstittämällä siitä luodaan versio Englanniksi.

Olemme kokeilleet esimerkiksi Heygen -nimistä palvelua. Heygenissä voi paitsi generoida tekstiä omien vaatimusten mukaan tai laittaa itse kirjoitettu teksti palveluun, ladata myös vaikkapa still-kuvan johtajasta samaan paikkaan ja laittaa tämä puhumaan kyseinen teksti. Ei tarvita kuvauksia eikä editointia, saat videon palvelusta nimittäin myös tekstitettynä. Palvelussa voit myös kääntää tekstin eri kielille ja laittaa firman johtajan puhumaan vaikka Mandariiniksi. Toki johtajan pää ja suu liikkuvat, mutta on se vielä aika epäaidon näköinen, mutta toisaalta monissa tapauksissa tämä voi ajaa asiansa.

Heygenissä voi tehdä huomattavasti uskottavamman näköisiä kieliversiota oikeasti kuvatusta videopätkästä.
Jos johtajan tervehdys on kuvattu vaikkapa Suomeksi studiossa ja tämä ladataan palveluun sekä käännetään siellä, esiintyjä voidaan laittaa ihan mukavasti puhumaan vaikkapa Englanniksi (erilaisilla aksenteilla), Arabiaksi, Venäjäksi, Ranskaksi, Japaniksi, Ruotsiksi, Saksaksi yms ja jne.

Jo hieman vanhentunut demonstraatio Heygenistä.

Videon voiceover eli kertojaääni

Usein viestintään ja markkinointiin käytettävissä videoissa kuuluu kertojaääni eli voiceover. Näihin liittyviä palveluita on paljon ja olemme kokeilleet muutamaa. Monet täysin synteettiset puhujaäänet ovat vielä aika konemaisen kuuloisia, eivätkä kuulosta aidolta ihmisen puheelta. Joihinkin palveluihin voi kuitenkin syöttää esimerkiksi lyhyen näytteen vaikkapa omasta tai haluamastaan äänestä, jolle voi palvelussa syöttää tekstiä, jota tämä sitten puhuu. Näin tulee jo huomattavasti aidomman kuuloista kertojaääntä.

Esimerkiksi Play.HT ja Descript ovat käteväksi havaittuja palvelualustoja voiceovereihin.

Videon tekstitys

Voi, kun tekisimmekin vain englanninkielisiä videoita, niin kyllä olisi helppoa. Nykyisissä versioissa ammattimaisissa videoeditointiohjelmissa on jo sisäänrakennettu puheentunnistus ja tekstitysominaisuus, mutta ei Suomeksi.

Suomenkielisiä videoita voi ladata kyllä palveluihin, esimerkiksi yksinkertaisimmillaan Microsoft Streamiin, joka kuuluu ns. Microsoft Office -pakettiin ja palvelu generoi puheentunnistustekniikalla valmiin tekstitystiedoston, jonka voi taas viedä sinne videoeditointiohjelmaan, jossa sitten tsekataan ja tarvittaessa muokataan tekstitystä.

Mutta voi, jos siellä onkin joku erisnimi, niin eihän se välttämättä tule isolla kirjaimella. Ja jos joku puhuu murretta, niin heti on systeemit sekaisin.

Suomi on pieni kielialue ja tässä sen on saanut huomata. Esimerkiksi Englanniksi tilanne on aivan toinen.

Pienet korjaukset videoissa

Tällä hetkellä olemme siinä tilanteessa, että tekoäly on mahtava lisäosa pieniin korjauksiin ja yksityiskohtiin videoissa sekä videotuotannossa. Sillä voi nopeuttaa kyllä jotain teksitysasioita, taustoista voidaan poistaa helpommin ei-toivottuja elementtejä, kertojaääntä voidaan muokata äänityksen jälkeen puhumaan sittenkin hieman erilailla joku asia, dronenkin voi laittaa itsekseen tekemään ns. perus lentoradat kuvauspaikalla.

Markkinoilla on siis monia pieniä ja avittavia juttuja, joita mielellämme käytämme ja jäämme odottamaan innolla tekoälyn kehitystä ja sen tuomia uutuuksia myös videotuotantoon.

Ota yhteyttä

Teemme tarjouksen ja projektin toteutusideat aina maksutta.

Minuun saa ottaa yhteyttä
Kenttä on validointitarkoituksiin ja tulee jättää koskemattomaksi.