YouTubeov auto-translate vs. native EN titlovi: usporedni test na 8 epizoda

YouTubeov auto-translate je impresivan tehnološki uradak. Generiran iz Googleove ASR + MT linije, podržava 100+ jezika, radi automatski na svakom uploadanom videu. Za većinu jezika na engleski. Radi dovoljno dobro.

Pitanje koje rješavamo ovim člankom: koliko je dovoljno dobro dovoljno za hrvatski podcast koji želi međunarodnu publiku?

Metodologija

8 epizoda iz našeg benchmark seta (proširenog s pet dodatnih kanala):

Lider Lab. 1 Epizoda
Netokracija „Slažem se / Ne". 1 Epizoda
Superhuman Life. 1 Epizoda
5 dodatnih, miks žanrova (poslovanje / tech / društvo)

Po epizodi: 3-minutni uzorak na istom timestamp-u. Za svaki uzorak, generirano je dva EN caption tracka:

YT auto-translate: izvezen iz YouTube Studio nakon 24 sata od učitavanja.
Titlomat: naš pipeline (WhisperX → custom dict → lokalni 70B prijevod).

3 native English speakera (jedan s iskustvom u medijima) ocjenjivali su svaki par bez znanja koji je koji (slijepa ocjena). Ljestvica 1-5 po četiri osi:

Faithfulness: koliko prijevod nosi izvorni smisao.
Fluency: koliko zvuči kao prirodan engleski.
Terminology: koliko su tehnički pojmovi i imena točni.
Timing alignment: koliko se titl pojavljuje u sinkronu s govorom.

96 ocjena ukupno (8 × 4 × 3).

Rezultati

[Bit će popunjeno kad raters završe ocjenjivanje.]

Os	YT auto-translate	Titlomat	Razlika
Faithfulness	TBD	TBD	TBD
Fluency	TBD	TBD	TBD
Terminology	TBD	TBD	TBD
Timing alignment	TBD	TBD	TBD

Konkretni primjeri

[5 ComparisonTable-ova s realnim outputom. TBD nakon Story 14.]

YT auto-translate

Titlomat

Gdje je YT auto-translate dovoljno dobar

Hipoteze koje testiramo:

Single-speaker monologue, formalna registar, malo vlastitih imena.
Tehnički slabo specijalizirane teme.
Govornici koji zaobilaze code-switching.

Gdje nije

Panel s više govornika (timing alignment pada).
Tehnička terminologija (čisti gubitak na Terminology osi).
Brendovi i imena (Faithfulness pada gotovo na nulu).
Brzi govor (ASR baseline pada pa MT nasljeđuje šum).

Kad isplati ulaganje

[Argumentacija temeljena na stvarnim brojkama kad rezultati stignu.]

Ograde

Veličina uzorka n=8 je mala. Statistička signifikantnost nije primarna. Kvalitativni obrasci jesu.
MT modeli imaju verzije. YouTube i naš pipeline oba se mijenjaju. Ovaj test je snimak u vremenu.
Native EN ocjenjivači imaju vlastite pristranosti. Pokušat ćemo to detektirati slaganjem među ocjenjivačima (Cohen's kappa).

Što očekujemo

Ako rezultati pokažu malu razliku (Titlomat <0.5 prosječno bolji), revidiramo argumentaciju za ručno-generirane titlove i preusmjerimo proizvod prema slučajevima uporabe gdje razlika jest signifikantna (panel, tehnički kanali).

Ako rezultati pokažu veliku razliku (>1.0 prosječno), to je glavni argument koji koristimo u marketingu.

Ako rezultati budu mješoviti, što je najvjerojatnije, članak postaje vodič „kad se isplati uložiti, kad ne".

auto-translate usporedba kvaliteta prijevod

PodijeliteLinkedIn

Povezani članci

Tri logotipa ASR pružatelja s ocjenama postavljenim preko.

Usporedbe12. 05. 2026.4 min

Whisper vs Deepgram vs AssemblyAI: zašto Titlomat radi na Whisper-large-v3

Tri kandidata, jedna odluka. Što smo testirali, što hrvatski jezik traži, i gdje druga dva padaju u praksi.

Vintage CRT televizor u tamnoj sobi, jedna topla amber traka preko ekrana kao caption.

Vodiči16. 05. 2026.7 min

Kako dodati hrvatske titlove na Youtube

Tri načina za hrvatski caption track na vašem kanalu. Diakritike, jezični kod, format datoteke. Što YouTube radi dobro, gdje pada, kada se isplati automatizacija.

Karta svijeta s istaknutim hrvatskim govornim područjem.

Industrija13. 05. 2026.4 min

Pet razloga zašto vaš hrvatski podcast nema inozemnu publiku

Tri od pet razloga možete popraviti ove sedmice. Dva traže promjenu strategije. Bez floskula o „globalnom dosegu”, samo konkretni obrasci.