Tri poti od zvoka do podnapisov. Vsaka deluje. Vsaka vas stane drugače. S časom, denarjem ali kakovostjo. Kaj resnično dobite, je odvisno od tega, katero izberete.
Caption track je ločena datoteka, pripeta posnetku, in ne hardkodirana čez sliko. Gledalec ga vklopi z gumbom CC; YouTubov algoritem ga bere kot discoverability signal. Vsak posnetek ima lahko več caption trackov, po enega za vsak jezik.
Pot 1. Ročno tipkanje v YouTube Studio
YouTube Studio → Subtitles → Add language → Type manually.
Odpre timeline editor. Poslušate zvok, tipkate, kar slišite, nastavljate čas začetka in konca vsakega segmenta.
Čas: 4 do 6-kratnik dolžine posnetka na jezik. 60-minutna epizoda pomeni 4 do 6 ur dela, če ste posameznik. Dva jezika (SL + EN) skupaj 8 do 12 ur.
Strošek, če outsource-ate: profesionalni titler v Sloveniji zahteva približno 8 do 15 €/min vhodnega zvoka, odvisno od ekspresnosti in kompleksnosti vsebine. 60-min × 12 € ≈ 720 € na jezik. SL + EN tako naraste na ~1440 €.
Kakovost: najvišja možna. Človeško uho ujame naglas, ironijo, lastna imena.
Kdaj se izplača: premium produkcije, blagovno znamčena vsebina, kjer se ne sme zmotiti, kratki a pomembni posnetki (npr. uradni oglas).
Pot 2. YouTube auto-captions
Naložite posnetek → YouTube samodejno ustvari caption track v jeziku zvoka. Lahko vklopite auto-translate za drug jezik (angleščino iz slovenščine, itd.).
Čas: 0 ur neposrednega dela. YouTube obdela v 30 minutah po nalaganju.
Strošek: 0 €.
Kakovost (vtis, ni izmerjen WER):
- Slovenski auto-captions zajamejo čisto pripoved z enim govorcem solidno. Lastna imena padajo, code-switching razbije, številke so loterija.
- Angleški auto-translate iz slovenščine je slovnično spreten, a imena prevaja nedosledno, idiomi se izgubijo, tehnična terminologija pogosto zaide.
Kdaj se izplača: osebni VLOG-i, eksperimentalna vsebina, kanali, kjer gledalci ne vklapljajo podnapisov. Bolje nekaj kot nič. A ne za mednarodno občinstvo.
Pot 3. Samodejni pipeline (Titlomat)
Povežete kanal prek OAuth-a, mi za vsak nov upload ustvarimo slovenski in angleški caption track ter ju naložimo nazaj na posnetek.
Čas: 30 sekund za povezavo, 0 za vse naslednje. Pred objavo lahko pregledate, če želite.
Strošek: od 19 €/mes za 5 ur video gradiva. Cenik.
Kakovost: Phase-0 baseline na 3 kanalih daje WER od 1.85% do 12.48%, odvisno od vsebine (glej: Zakaj Whisper greši na hrvaščini). Custom dictionary po kanalu napako dodatno zmanjša za 3+ odstotnih točk.
Kdaj se izplača: redni kanali (≥2 epizodi/mes), podcasti in intervjujski formati, kanali, ki želijo rasti zunaj slovenskega govornega prostora.
Primerjalna tabela
| Pot | Čas na 60-min epizodo | Strošek | WER (SL) | Skalira |
|---|---|---|---|---|
| Ročno (vi) | 8 do 12h za SL + EN | 0 € | ~0% | Ne |
| Ročno (outsource) | 1 do 2 dni čakanja | ~1440 € (SL+EN) | ~0% | Drago |
| YT auto-captions | 30 min čakanja | 0 € | spremenljiv | Da |
| Titlomat | ~5 min obdelave | od 19 €/mes | 1.85% do 12.48% | Da |
Kako YouTubov algoritem to gleda
YouTube priporoča captions kot discoverability signal. Posnetki s podnapisi se uvrstijo bolje v državah, katerih jezik šele caption track pokrije. Konkretno: slovenski podcast z angleškim caption trackom postane kandidat za prikaz gledalcem v Nemčiji, ZK, ZDA.
Naša interna metodologija merjenja, koliko več gledalcev to dejansko prinese: tu.
Kaj izbrati
- En pomemben posnetek na leto? Ročno, outsource. Premium kakovost upravičena s premium ceno.
- Kanal, ki ni primarno za rast? YT auto-captions. Boljšega brezplačnega izhoda ni.
- Reden kanal z ambicijo mednarodnega občinstva? Samodejni pipeline.
Titlomat pokriva tretjo kategorijo. Povežite kanal, naslednja epizoda samodejno dobi slovenske in angleške podnapise, WER in reach lift vidite v dashboardu. Poskusite brezplačno. Prvi teden je na nas.



