Vintage CRT televizor v temni sobi, en topel amber pas čez zaslon kot caption.
Vodniki7 min branja

Kako dodati slovenske podnapise na Youtube

Trije načini za slovenski caption track na vašem kanalu. Šumniki, jezikovna koda, format datoteke. Kdaj se izplača avtomatizacija.

Slovenski caption track na YouTubu ni ista zgodba kot angleški. Whisper ujame slovenščino drugače kot angleščino, YouTubov auto-translate dela z drugim modelom, šumniki pa znajo razbiti SRT parser, če kje v pipeline-u ni UTF-8. Trije načini, kako jih dodati. Kateri vam ustreza, je odvisno od tega, koliko posnetkov objavljate in koliko lastnih imen tam pade.

Najhitrejša pot: prilepite YouTube URL v Titlomat

Če želite slovenske podnapise za en konkreten posnetek brez povezovanja kanala, OAuth-a in čakanja na naslednji upload, ima Titlomat tudi flow, kjer samo prilepite URL. Od registracije do gotovega prepisa mine nekaj minut, odvisno od dolžine posnetka.

  1. Registracija. Odprite titlomat.com/signup, vnesite email in geslo, potrdite verifikacijski mail. Prvi posnetek je brezplačen, kartica ni potrebna.
  2. Odprite Videos. V levem meniju kliknete Videos. Na vrhu strani je polje YouTube URL in gumb Add video.
  3. Prilepite link in kliknite Add video. Format je standarden https://www.youtube.com/watch?v=... (ali youtu.be/...). Posnetek ni nujno vaš, dovolj je, da je javen ali unlisted.
  4. Spremljajte pipeline. Stran se samodejno osveži in gre skozi faze: downloading → transcribing → translating → uploading → done. Za 10-minutni posnetek tipično 1 do 3 minute skupaj, daljši posnetki linearno skalirajo.
  5. Pregled prepisa. Ko status preide v done, se odpre podrobna stran posnetka s slovenskim caption trackom, segmentiranim po času. Lahko berete, kopirate posamezne segmente ali eksportirate celoten SRT.

Če želite, da se podnapisi na koncu pipeline-a samodejno naložijo nazaj na YouTube posnetek (namesto da jih le vidite v Titlomatu), to zahteva OAuth na vaš kanal. Pokriva ga ločen Connect YouTube korak v onboardingu, in po tem vsak nov upload na kanal gre skozi isti pipeline brez ročnega lepljenja URL-ja.

Za single-URL različico ne potrebujete ničesar od tega. Katerikoli javen YouTube posnetek, en paste, slovenski caption track v nekaj minutah.

Kaj slovenski caption track dela drugačnega

Slovenščina je morfološko bogata, ima dvojino kot ločeno število, tri specifične črke (č, š, ž) in razmeroma majhno trening korpusno bazo za ASR modele. Štiri praktične posledice za caption track:

  • Manjši trening korpus. Whisper-large-v3 vidi precej manj slovenščine v treningu kot npr. angleščine ali nemščine. Posledica: WER na čisti pripovedi je primerljiv hrvaškemu, na hitrem govoru ali code-switchingu pa pada hitreje. Podrobnosti v Whisper in slovenščina: kaj dela, kaj ne.
  • Šumniki. Če se datoteka shrani kot Windows-1250 ali ANSI, se na upload-u č pretvori v ? ali napačen znak. SRT/VTT morata biti UTF-8, brez BOM-a (YouTube ga sprejme, nekateri video orodja ne).
  • Lastna imena. Whisper na slovenski pripovedi pogosteje zgreši lastna imena kot splošne besede. „Slavoj Žižek" zna postati „Slavoj Zizek", „Đorđe" → „Djordje". Brez post-processinga vsaka epizoda ugiba znova.
  • Code-switching. Slovenski tech ali poslovni podcast vstopa in izstopa iz angleščine vsako drugo stavek. Model sliši angleško besedo in jo zapiše v napačnem sklonu ali napačni morfologiji. WER na takšni vsebini naraste 2 do 3-krat v primerjavi s čisto pripovedjo.

Nič od tega ni razlog za obup. Razlog je, da veste, kaj izbirate, ko izbirate pot.

Pot 1. YouTube auto-captions v slovenščini

Naložite posnetek, nastavite jezik zvoka na slovenščino (sl) v koraku Details, YouTube v približno 30 minutah ustvari caption track sam. Lahko vklopite auto-translate, da iz te slovenščine ustvari angleški (ali drug) track.

Kaj dela solidno: jasna pripoved z enim govorcem, knjižna slovenščina, počasnejši tempo. Šumniki se prikazujejo pravilno (YouTube interno deluje v UTF-8).

Kje pade:

  • Lastna imena: ujema po sluhu, zgreši po pisavi. Imena gostov, blagovne znamke, kraji izven Ljubljane in Maribora.
  • Narečja in pogovorni jezik: štajerščina, primorščina, prekmurščina padajo slabše od knjižnega standarda.
  • Angleški vrinki: ostajajo kot angleški tekst sredi slovenskega stavka, brez sklonske morfologije.
  • Številke in datumi: loterija. „Dva tisoč šestindvajset" zna postati „2026" ali „2 tisoč 26".

Strošek: 0 €. Čas dela: 0 ur.

Kdaj se izplača: osebni vlog, eksperimentalna vsebina, kanal, kjer malo gledalcev dejansko uporablja CC gumb. Bolje nekaj kot nič.

Pot 2. Ročno tipkanje v YouTube Studio

Studio → Subtitles → Add language → Slovenian → Type manually. Odpre timeline editor: poslušate, tipkate, nastavljate čas začetka in konca.

Čas: 4 do 6-kratnik dolžine posnetka. 60-minutna epizoda znaša 4 do 6 ur, če delate sami. Outsource v Sloveniji se giblje okrog 8 do 15 €/min vhodnega zvoka, odvisno od ekspresnosti in teme. 60-min × 12 € ≈ 720 €.

Kaj dobite: najvišjo možno kakovost. Vi (ali profesionalni titler) ujamete naglas, ironijo, lastna imena, code-switching s pravilnimi skloni, narečne posebnosti. WER praktično 0%.

Kdaj se izplača: en posnetek na leto, ki se ne sme zmotiti. Uradni oglas, izobraževalna vsebina, ki se prevaja v več jezikov, intervjuji s prepoznavnimi govorci, katerih imena morajo biti zapisana pravilno.

Pot 3. Zunanji SRT/VTT upload

Studio → Subtitles → Add language → Slovenian → Upload file → izberite With timing. Format .srt ali .vtt, kodiranje UTF-8 brez BOM-a.

Ta pristop uporabite, če podnapise pripravljate izven YouTuba: lasten Whisper run, Aegisub editor, profesionalni titler, ki dostavi SRT. YouTube ne spreminja vrstnega reda, ne spreminja časa, samo pripne datoteko kot caption track.

Pomembno za slovensko datoteko:

  • Shraniti kot UTF-8 (Notepad++: Encoding → Convert to UTF-8 without BOM; macOS default je že UTF-8).
  • Preveriti šumnike v predogledu pred upload-om. Če vidite ? ali ć namesto č, je datoteka v napačnem encodingu.
  • Maks. 42 znakov na vrstico, 2 vrstici na segment. YouTube renderira do 3, a bralci odnehajo nad 2.

Strošek: odvisno od tega, kako ste prišli do SRT-ja. Whisper-large-v3 na lokalnem GPU-ju: efektivno 0 € na posnetek. Profesionalna dostava titlerja: zgoraj omenjenih 8 do 15 €/min.

Kdaj se izplača: imate lasten transkripcijski pipeline, ali kupujete SRT od tretjega ponudnika, ali želite nadzor nad nastavitvami (slovar, segmentacija) preden YouTube sploh dobi datoteko.

Katero jezikovno kodo izbrati

YouTube sprejema za slovenščino:

  • sl (jezik, brez regije)
  • sl-SI (jezik + regija Slovenija)

Praktično, oba končata kot „Slovenian" v UI-ju. sl je dovolj v večini primerov; sl-SI uporabite, če cilji vključujejo zamejske govorce v Avstriji, Italiji ali Madžarski in želite jasno regionalno označbo.

Slovenščino je vredno postaviti kot primarni jezik posnetka, ne kot prevod iz angleščine. YouTube algoritem caption track v primarnem jeziku ocenjuje drugače pri rangiranju. Več o tem v Angleški podnapisi za slovenske ustvarjalce.

Kako preveriti kakovost pred objavo

Obstaja standardna metoda, ki zahteva 3 do 5 minut na posnetek:

  1. Odprite Studio → Subtitles → izberite slovenski track → Edit.
  2. Skočite na 3 naključne časovne točke (začetek, sredina, konec). Poslušajte 30 sekund in berite podnapis hkrati.
  3. Označite vsakič, ko podnapis odstopa od tega, kar slišite. Tri kategorije: zamenjava (napačna beseda), izbris (preskočena beseda), vstavitev (beseda, ki ni bila izgovorjena).
  4. Lastna imena in številke so prioriteta. Napačna imena škodijo bolj kot napačen pomožni glagol.

To ni WER merjenje, a v 3 minutah dobite občutek, ali je track uporaben za objavo. Podrobnejše merjenje opisujemo v analizi Whisper napak na slovenščini.

Primerjava poti za slovenščino

PotČasStrošekKakovost (SL)Skalira
Auto-captions30 min čakanja0 €spremenljivaDa
Ročno (vi)4 do 6h na posnetek0 €praktično 0% napakeNe
Ročno (outsource)1 do 2 dni~720 €/60 minpraktično 0% napakeDrago
SRT upload (lasten pipeline)sekunde po upload-uspremenljivodvisno od pipeline-aDa

Kdaj se izplača avtomatizacija

Pragmatika: če objavljate dve ali več epizod mesečno in vsaka traja 30+ minut, ročno se ne izplača, auto-captions pa vam ne dajo kakovosti, ki jo zahteva mednarodno občinstvo. Lasten pipeline (Whisper + custom slovar + post-processing) ali managed storitev postanejo opcije.

Titlomat dela tretjo pot. Povežete kanal enkrat, mi za vsak nov upload ustvarimo slovenski caption track (po želji tudi angleški auto-translate iz njega), s custom slovarjem na kanal, ki ujame imena gostov in blagovne znamke, specifične za vašo vsebino. Poskusite brezplačno na svojem zvoku, prvi posnetek je na nas.

Če vas zanima konkretna primerjava vseh treh poti s številkami za slovenščino + angleščino, smo o tem že pisali: Kako dodati slovenske in angleške podnapise na YouTube.