Vintage CRT televizor u tamnoj sobi, jedna topla amber traka preko ekrana kao caption.
Vodiči7 min čitanja

Kako dodati hrvatske titlove na Youtube

Tri načina za hrvatski caption track na vašem kanalu. Diakritike, jezični kod, format datoteke. Što YouTube radi dobro, gdje pada, kada se isplati automatizacija.

Hrvatski caption track na YouTubeu nije isto što i engleski. Whisper hvata hrvatski drugačije nego engleski, YouTubeov auto-translate radi drugim modelom, a diakritike znaju odlepiti SRT parser ako nešto u pipeline-u nije UTF-8. Tri puta da to dodate, koji vam treba ovisi o tome koliko videa objavljujete i koliko vam vlastita imena tu padnu.

Najbrži put: zalijepite YouTube URL u Titlomat

Ako želite hrvatske titlove za jedan konkretan video bez spajanja kanala, OAuth-a i čekanja na sljedeći upload, Titlomat ima i flow gdje samo zalijepite URL. Od registracije do gotovog transkripta prolazi koja minuta, ovisno o duljini videa.

  1. Registracija. Otvorite titlomat.com/signup, unesite email i lozinku, potvrdite verifikacijski mail. Prvi video je besplatan, kartica nije potrebna.
  2. Otvorite Videos. U lijevom izborniku kliknete Videos. Na vrhu stranice je input YouTube URL i gumb Add video.
  3. Zalijepite link i kliknite Add video. Format je standardni https://www.youtube.com/watch?v=... (ili youtu.be/...). Video ne mora biti vaš, dovoljno je da je javan ili unlisted.
  4. Pratite pipeline. Stranica se automatski osvježava i prolazi kroz faze: downloading → transcribing → translating → uploading → done. Za 10-minutni video tipično 1 do 3 minute ukupno, dulji videi linearno skaliraju.
  5. Pregled transkripta. Kad status pređe u done, otvori se detaljna stranica videa s hrvatskim caption trackom segmentiranim po vremenu. Možete čitati, kopirati pojedine segmente ili exportirati cijeli SRT.

Ako želite da se titlovi pri kraju pipeline-a automatski uploadaju natrag na YouTube video (umjesto da ih samo vidite u Titlomatu), to traži OAuth na vaš kanal. Pokriva ga zaseban Connect YouTube korak u onboardingu, i nakon toga svaki novi upload na kanal prolazi isti pipeline bez ručnog paste-a URL-a.

Za single-URL verziju ne treba ništa od toga. Bilo koji javni YouTube video, jedan paste, hrvatski caption track u koju minutu.

Što hrvatski caption track čini drugačijim

Hrvatski je morfološki bogat, fonetski blizu pismu i ima pet znakova koje engleski tipkovnice ne znaju (č, ć, š, ž, đ). Tri praktične posljedice za caption track:

  • Diakritike. Ako se file sprema kao Windows-1250 ili ANSI, na uploadu se č pretvori u ? ili u krivi znak. SRT/VTT moraju biti UTF-8, bez BOM-a (YouTube prihvaća, ali neki video alati ne).
  • Vlastita imena. Whisper na hrvatskoj naraciji griješi na imenima češće nego na općim riječima. „Stjepan Bedić" zna postati „Stjepan Beđić". Bez post-processinga, svaka epizoda pogađa iznova.
  • Code-switching. Hrvatski tech ili poslovni podcast ulazi i izlazi iz engleskog svaku drugu rečenicu. Model čuje englesku riječ i napiše ju krivim padežom ili krivom morfologijom. Detaljnije u Zašto Whisper griješi na hrvatskom.

Ovo nije razlog da odustanete. Razlog je da znate što birate kad birate put.

Put 1. YouTube auto-captions na hrvatskom

Upload video, postavite jezik audia na hrvatski (hr) u Details koraku, YouTube unutar otprilike 30 minuta generira caption track sam. Možete uključiti auto-translate da iz tog hrvatskog napravi engleski (ili drugi) track.

Što radi solidno: jasna naracija s jednim govornikom, standardni štokavski, sporiji tempo. Diakritike se pojavljuju ispravno (YouTube interno radi u UTF-8).

Gdje pada:

  • Vlastita imena: hvataju se po sluhu, gađaju krivo. Imena gostiju, brendovi, gradovi izvan Zagreba.
  • Dijalekt i regionalizmi: dalmatinski, kajkavski, slavonski padaju lošije nego standard.
  • Engleski umetci: ostaju kao engleski tekst usred hrvatske rečenice, bez padežne morfologije.
  • Brojevi i datumi: lutrija. „Dvije tisuće dvadeset i šeste" zna postati „2026" ili „2 tisuće 20 i 6".

Trošak: 0 €. Vrijeme rada: 0 sati.

Kada se isplati: osobni vlog, eksperimentalni sadržaj, kanal gdje malo gledatelja stvarno koristi CC gumb. Bolje nešto nego ništa.

Put 2. Ručno tipkanje u YouTube Studio

Studio → Subtitles → Add language → Croatian → Type manually. Otvara timeline editor: slušate, tipkate, postavljate vrijeme početka i kraja.

Vrijeme: 4 do 6 puta duljine videa. 60-minutna epizoda iznosi 4 do 6 sati ako radite sami. Outsource u Hrvatskoj se kreće oko 8 do 15 €/min ulaznog audia, ovisno o ekspresnosti i temi. 60-min × 12 € ≈ 720 €.

Što dobivate: najviša moguća kvaliteta. Vi (ili profesionalni titler) hvatate akcent, ironiju, vlastita imena, code-switching s ispravnim padežima. WER praktično 0%.

Kada se isplati: jedan video godišnje koji se ne smije pogriješiti. Službena reklama, edukativni sadržaj koji se prevodi na više jezika, intervjui s prepoznatljivim govornicima čija imena moraju biti točno napisana.

Put 3. Vanjski SRT/VTT upload

Studio → Subtitles → Add language → Croatian → Upload file → odaberite With timing. Format .srt ili .vtt, kodiranje UTF-8 bez BOM-a.

Ovo je pristup ako titlove pripremate izvan YouTubea: vlastiti Whisper run, Aegisub editor, profesionalni titler koji isporučuje SRT. YouTube ne ruši red, ne mijenja vrijeme, samo prikače file kao caption track.

Bitno za hrvatski file:

  • Sačuvati kao UTF-8 (Notepad++: Encoding → Convert to UTF-8 without BOM; macOS-ov default je već UTF-8).
  • Provjeriti diakritike u predpregledu prije uploada. Ako vidite ? ili ć umjesto ć, file je u krivom encoding-u.
  • Maks. 42 znaka po retku, 2 retka po segmentu. YouTube renderira do 3, ali čitatelji odustaju iznad 2.

Trošak: ovisi o tome kako ste došli do SRT-a. Whisper-large-v3 na lokalnom GPU-u: efektivno 0 € po videu. Profesionalni titler isporuka: gore navedeni 8 do 15 €/min.

Kada se isplati: imate vlastiti transkripcijski pipeline, ili kupujete SRT od trećeg pružatelja, ili želite kontrolu nad postavkama (rječnik, segmentacija) prije nego što YouTube uopće dobije file.

Koji jezični kod odabrati

YouTube prihvaća dva oblika za hrvatski:

  • hr (jezik, bez regije)
  • hr-HR (jezik + regija Hrvatska)

Praktično, oba završavaju kao „Croatian" u UI-u. Razlika je relevantna ako ciljate dijasporu: hr-BA (Hrvatski iz BiH) i hr-RS (Hrvatski iz Srbije) postoje kao BCP-47 oznake, ali YouTube ih trenutno tretira jednako kao hr. Koristite hr ako nemate poseban razlog, manji je rizik za downstream alate.

Ako imate i bosanski (bs) ili srpski (sr) caption track za isti video, YouTube ih prikazuje kao zasebne opcije u CC izborniku. Gledatelji iz različitih regija dobiju svoj track. Vidi YouTube auto-translate vs. native titlovi ako razmatrate i to.

Kako provjeriti kvalitetu prije objave

Postoji standardna metoda koja zahtijeva 3 do 5 minuta po videu:

  1. Otvorite Studio → Subtitles → odaberite hrvatski track → Edit.
  2. Skočite na 3 random vremenske točke (početak, sredina, kraj). Slušajte 30 sekundi i čitajte titl istovremeno.
  3. Označite svaki put kad titl odstupa od onoga što čujete. Tri kategorije: zamjena (pogrešna riječ), brisanje (preskočena riječ), umetanje (riječ koja nije rečena).
  4. Vlastita imena i brojevi su prioritet. Krive riječi u tom skupu šteti više nego pogrešan pomoćni glagol.

Ovo nije WER mjerenje, ali u 3 minute dobijete dojam je li track upotrebljiv za objavu. Detaljno mjerenje opisujemo u analizi Whisper grešaka.

Usporedba puteva za hrvatski

PutVrijemeTrošakKvaliteta (HR)Skalira
Auto-captions30 min čekanja0 €varijabilnaDa
Ručno (vi)4 do 6h po videu0 €praktično 0% greškeNe
Ručno (outsource)1 do 2 dana~720 €/60 minpraktično 0% greškeSkupo
SRT upload (vlastiti pipeline)po uploadu sek.varijabilanovisi o pipelineuDa

Kada se isplati automatizacija

Pragmatika: ako objavljujete dvije ili više epizoda mjesečno i svaka traje 30+ minuta, ručno se ne isplati i auto-captions vam ne daju kvalitetu koju traži međunarodna publika. Vlastiti pipeline (Whisper + custom rječnik + post-processing) ili managed servis postaju opcije.

Titlomat radi taj treći put. Spojite kanal jednom, mi za svaki novi upload generiramo hrvatski caption track (po želji i engleski auto-translate iz njega), s custom rječnikom po kanalu koji hvata imena gostiju i brendove specifične za vaš sadržaj. Phase-0 baseline na tri javna podcasta dao je WER između 1.85% i 12.48% ovisno o sadržaju. Vidite na svom audiju u 5 minuta.

Ako vas zanima konkretna komparacija sva tri puta s brojkama, već smo to napisali: Kako dodati hrvatske i engleske titlove na YouTube.