Saznajte Kompatibilnost Po Znaku Zodijaka
Najbolji alati za automatsku transkripciju za novinare
Tehnika I Alati

Siri je upravo navršila šest godina. Alexa je upravo navršila tri godine. Ako možemo pitati naše telefone za vrijeme u Albuquerqueu i prisiliti plastični cilindar u našim dnevnim sobama da naglas čita Washington Post, zašto još uvijek ručno prepisujemo intervjue?
Pa, pokazalo se da baš i ne moramo. Alati za automatsku transkripciju već su neko vrijeme na tržištu i konačno postaju dobri. Sada je potrebno samo nekoliko minuta i nekoliko dolara za prijenos audio ili video zapisa na web-mjesto i primanje prilično opsežnog prijepisa.
Ali, kao i svi alati, neki su bolji od drugih. Testirali smo (ili pokušali testirati - više o tome kasnije) osam najpopularnijih alata za transkripciju namijenjenih novinarima, uključujući Zmajev diktat , Sretan Scribe , o Transkribirajte , rekordno , vlč , Sonix , Trint i YouTube. Proveli smo svaki alat kroz razne scenarije iz stvarnog svijeta, eksperimentirajući s tim kako se svaki od njih pokazao u odnosu na tipičnu upotrebu novinara.
Iako niti jedan od alata nije bio savršen, jedan je odbacio ostale kao najbolji u kategoriji.
Naš odabir
Kombinacija točnosti, značajki i jednostavnosti korištenja čine Trint najboljim izborom za automatsku transkripciju za novinare. Iako nije bio najtočniji, najbogatiji ili najjeftiniji alat koji smo isprobali, njegovi alati za uređivanje transkripata i sposobnost da se malo bolje uklope u tijek rada novinara pomažu mu da nadmaši svoje konkurente. Čitajte dalje da vidite zašto.
Eksperiment, pokus
Kao što ćete vidjeti, stope točnosti ovih alata su niske. To je zato što smo ih svim silama pokušali zbuniti.
Prvo, kako bismo odrazili širok raspon ljudi, glasova i naglasaka, snimili smo naš uzorak zvuka s četiri sudionika. Oni su uključivali:
- Alexios Mantzarlis , profesor Poynter i direktor Međunarodne mreže za provjeru činjenica, koji potječe iz Rima i opisao se kao šapat i 'neke smiješne riječi koje miješaju britanski, talijanski i neobični američki naglasak'
- slatki buketi , voditeljica programa za Međunarodnu mrežu za provjeru činjenica, koja je u Poynter došla iz Mexico Cityja u rujnu
- Kristen Hare , novinarka u Poynteru, koja misli da zvuči 'pomalo kao djevojka iz doline' kada sluša samu sebe na snimkama
- Ja, i premda je Kristen rekla da imam 'bivolski naglasak', mislim da je moja sklonost mrmljanju, prebrzo pričanju i preskakanju dijelova riječi vjerojatno izazovnija za transkripciju (Snimanje sebe u iščekivanju transkripcije jasno vodi do malog samo- odraz.)
Kristen nam se pridružila putem Google Hangouts/YouTube Live ( otkrivanje: donacija Google News Laba djelomično financira moju poziciju ), na što većina automatskih alata za transkripciju otvoreno upozorava. Čini se da im je univerzalno teško rukovati zvukom s telefona ili videochata.
Da bismo još više mučili algoritme, čitali smo i odlomke puno bržim tempom nego što obično govorimo, Dulce i Alexios su govorili razne strane jezike (talijanski, španjolski, francuski i grčki), izgovarali smo što više vlastitih imenica (Apalachicola , Michael Oreskes i razni grčki otoci, da spomenemo samo neke), postali su kreativni s Urban Dictionary (a telećak Paula Manaforta i grubu riječ koja opisuje stanje njegove pravne situacije) i često su razgovarali jedno preko drugog.
Snimili smo naš 14-minutni test u Poynterovom studiju za webinare i prekinuo nas je zvuk barem jednog glasnog aviona iznad glave (nekoliko blokova dalje je zračna luka), vozila hitne pomoći i galama Kristeninog telefona.
Zvuk smo snimili na tri načina:
- S Zoom H4nPro ručni mikrofon, postavljen između nas
- S mojim iPhoneom 6S Plus, koristeći aplikaciju Recordly za snimanje, smještenu pored Zooma
- Uz privatni YouTube Live, tako nam se pridružila Kristen
Zatim smo prenijeli audio zapis na svaki alat i pratili koliko je vremena potrebno za transkripciju. Dobivene transkripte normalizirali smo koristeći Microsoft Word, uklonivši vremenske oznake i pobrinuvši se da imena govornika budu kongruentna. Kao kontrolu, sam sam transkribirao zvuk (pomoću oTranscribe) i zatim nekoliko puta preslušao kako bih provjerio potpunu točnost. Isprobali smo i Rev, plaćenu uslugu koja koristi ljudske transkribatore, a ne algoritme, kako bismo vidjeli kako se slaže.
Isprobali smo razne alate za usporedbu dokumenata kako bismo vidjeli koji je najbolje funkcionirao Copyscape kao najzvučnija opcija. Usporedili smo prijepise koje su generirali alati i usluge sa 100 posto točnim onim koji sam napravio pomoću oTranscribe.
Nekoliko dodatnih napomena:
- Zvuk iz Zooma pokazao se najkvalitetnijim, pa smo ga koristili za većinu naših testova. Čini se da aplikacija Recordly ne prihvaća zvuk snimljen iz drugih izvora, tako da je to jedna iznimka od ovog procesa. Također nismo prenijeli Zoom audio na YouTube, već smo se umjesto toga oslanjali na zvuk sa snimke YouTube uživo. Usporedba jabuka i naranča čini ovaj eksperiment manje od znanstvenog, ali više u skladu s načinom na koji bi novinari zapravo koristili ove alate u stvarnom svijetu.
- Iako je popularan alat, nismo mogli testirati Dragon Dictation, jer ne radi na iOS-u 11. Ažurirati ćemo ovu recenziju kada i ako razvojni programer riješi ovaj problem.
- Nismo kontaktirali nijednu od tih tvrtki prije testiranja, tako da nije bilo posebnog tretmana ili pozadinskog dovršavanja prijepisa. Trint, Sonix i Recordly nude ograničene besplatne minute za nove korisnike, pa smo ih iskoristili za eksperiment. Koristili smo kreditnu karticu kolege koji nije novinar za Happy Scribe i nismo spomenuli Poynter budući da sam se dopisivao s njegovim osnivačima u prošlosti. I platili smo punu cijenu za Revovu ljudsku transkripciju. YouTubeova usluga titlova i oTrankripcija uvijek su besplatni.
- Postoji mnogo, mnogo više alata za automatsku transkripciju koje nismo uključili u ovu recenziju. Pokušali smo se fokusirati na one o kojima su nas novinari pitali. Ako mislite da smo nepravedno preskočili jednu, obavijestite nas i ažurirat ćemo recenziju.
Kvaliteta prijepisa (pobjednik: Happy Scribe)
Čini se da ljudi zabrinuti zbog pobune umjetne inteligencije imaju još barem nekoliko godina za pripremu, jer je jedina ljudska transkripcijska usluga koju smo testirali pobijedila automatske transkripcije s velikom razlikom.
Rev je dobio ocjenu točnosti od 82 posto, s tim da ljudski prevoditelj uglavnom nije uspio uhvatiti strane jezike (što je, da budemo pošteni, zasebna usluga), nekoliko vlastitih imenica, nešto preslušavanja, nekoliko sleng riječi i mrmljanja. Iako su i drugi alati uglavnom propustili ove stvari, ljudski prepisivači u Rev barem su zabilježili stvari poput '[nečujno]' i '[preslušavanje]' i '[strani jezik]', koji su bili korisni rezervirani mjesta za kasnije ispravke.
Čak i s dijelovima koji nedostaju, Rev transkript je u potpunosti čitljiv i koherentan. Da niste bili u blizini za početni razgovor, mogli biste shvatiti srž onoga o čemu smo razgovarali samo čitajući.
Sljedeća najtočnija transkripcija bila je YouTube. Stranica za hosting videozapisa automatski je izradila titlove za naš YouTube video uživo koji su bili 72 posto točni. No, čak i uz samo 10-postotni pad ukupne kvalitete, transkript je znatno manje čitljiv od Rev's-a jer YouTube ne pruža interpunkciju ili segmentaciju govornika. Naslovi postoje kao masivni blok teksta. Bez uparivanja sa zvukom, bilo bi gotovo nemoguće da netko tko nije bio dio razgovora razumije naš razgovor.
Postoje i drugi nedostaci YouTubeove ponude, ali o njima ćemo govoriti kada dođemo do značajki.
Happy Scribe pokazao se kao najtočniji namjenski alat za transkripciju koji nije ljudski, sa 62 posto točnosti u našem eksperimentu. Alat upozorava na svojoj stranici za učitavanje da 'izbjegavajte jaku pozadinsku buku, 'izbjegavajte jake naglaske', 'izbjegavajte Skype i telefonske intervjue' i 'držite mikrofon blizu zvučnika', a sve to smo poslušno zanemarili.
Transkript je skoro točan na mjestima gdje sam govorio, pogotovo kada nije bilo preslušavanja i nisam koristio vlastite imenice, ali sam se poprilično mučio s transkripcijom Dulce, Kristen i Alexiosa. Na nekim mjestima je razbio različite zvučnike u nove odlomke, ali na drugima nije uspio. Cjelokupni prijepis varira između potpuno koherentnog na nekim mjestima i bizarno nekoherentnog na nekima, na primjer kada je transkribirao Alexios koji kaže 'dopusti mi da otvorim Urban Dictionary i možemo proći kroz neke od njih' kao 'Mislim, čak i u urbanom rječniku, djevojke su bliske .”
Trint je ponudio slične rezultate, s točnošću od 61 posto. Zabrljao je na mnogim istim mjestima, petljajući s naglascima, zvukom s YouTubea i odjeljcima s preslušavanjem ili tihim govorom. Ipak, nije krivo prepisao na potpuno iste načine kao Happy Scribe. Rečenica Urban Dictionary odozgo se pojavila kao 'Mislim, čak iu urbanom rječniku možemo proći kroz njih.'
Sve u svemu, Trintov je prijepis nešto lakši za čitanje od Happy Scribea jer bolje razlikuje govornike i razbija ih u nove odlomke. Nije savršen, ali dodaje puno jasnoće kada radi.
Sonix se pokazao sljedećim najpreciznijim s 50 posto. Sonix je radio nešto bolje od Happy Scribea i Trinta kada je jedan zvučnik glasno govorio. Ali bilo kakva količina preslušavanja, pozadinske buke ili čak smijeha - sve stvari koje će se vjerojatno pojaviti u bilo kojoj stvarnoj uporabi alata - činilo se da ga zbunjuju više od ostalih. Rečenicu Urban Dictionary je obuhvatio kao 'otvoriti u urbanom rječniku i možemo proći kroz neke od njih.'
Poput ostalih alata, Sonix je pokušao razbiti zvučnike u različite paragrafe, ali činilo se da je bio nešto lošiji u tome.
Rekordno je bio najmanje točan od alata za automatsku transkripciju, s 48 posto točnosti. Rečenicu Urbanog rječnika je zahvatila kao “dopustite mi da otvorim taj urbani rječnik i možemo. Prođite kroz neke”, što nije loše, ali taj dio teksta nije reprezentativan za ostatak transkripta. Poput YouTubea, Recordlyjev transkript je golemi blok teksta. Za razliku od YouTubea, dodaje interpunkcijske znakove, iako rjeđe i s manjom preciznošću od ostalih alata.
Transkript Recordly je najmanje od pomoći izvan konteksta.
Općenito, najbolji prijepis je došao iz moje ruke s oTranscribe. Rev je ispao najbolji prijepis koji nisam morao sam prepisivati. Ali ovo je pregled alata za automatsku transkripciju, a u toj kategoriji Happy Scribe je jedva izvukao Trint da bi došao na prvo mjesto.
Značajke (pobjednik: Sonix)
Čini se da su neke stvari industrijski standardi alata za automatsku transkripciju. Mogućnost reprodukcije prenesenog zvuka je očita. Svi alati korisnicima omogućuju izvoz prijepisa u različitim formatima.
Alati temeljeni na pregledniku (što znači svi osim Recordly) također nude zajednički paket. Svi omogućuju korisnicima da kliknu različite točke u tekstu i preskoče izravno na taj dio snimke. Svi imaju opcije za reprodukciju zvuka manjom brzinom (prečacima ili petljanjem s postavkama), ručno uređivanje transkripata, prijenos videa uz audio i pohranjivanje transkripata za kasniju upotrebu.
Trint ide korak dalje i sadrži vizualizirani valni oblik zvuka na dnu transkripta koji korisnici mogu preskočiti po želji. Također ima ugrađene alate za pronalaženje i zamjenu, isticanje ili precrtavanje teksta. Korisnici mogu dodati popis govornika u alat i priložiti svoje ime svakom odlomku. Također ima zgodnu značajku za slanje transkripta e-poštom jednim klikom.
Sonix sadrži sve ove alate (osim interaktivnog valnog oblika) i još nekoliko. Najkorisnije su 'boje samopouzdanja', koje dodjeljuju različite boje riječima u koje Sonix ima manje samopouzdanja; ocjenjivač kvalitete zvuka, koji vam govori koliko je Sonix siguran u njegovu transkripciju; i automatizirana identifikacija zvučnika, beta značajka koja pokušava identificirati različite zvučnike i dodijeliti im ID-ove.
U našem testu, Sonix je identificirao samo dva različita zvučnika, tako da ovaj alat treba malo poraditi, ali je i dalje od velike pomoći.
Zabilježeno, jedina aplikacija (samo za iOS) u skupini nudi najmanje značajki. To je prilično iskustvo snimanja i čekanja. Prijepis se isporučuje u formatu sličnom Appleovoj ugrađenoj aplikaciji za bilješke, s ograničenom funkcijom uređivanja. Također omogućuje korisnicima izvoz zvuka ili teksta u drugu aplikaciju.
Iako su Trintove značajke pronalaženja i zamjene i valnog oblika korisne pri ispravljanju prijepisa, Sonixove značajke dodaju vitalnu transparentnost procesu transkripcije. I premda beta identifikacija zvučnika nije posve pouzdana, to je ambiciozan alat koji bi od sada trebao postati samo bolji.
Vrijeme (pobjednik: Happy Scribe, Trint i rekordno)
Evo gdje blista automatska transkripcija. Svi alati dali su prijepis za manje minuta od duljine audio datoteke koju smo poslali. Razlika između Happy Scribe (pet minuta), Trint (šest minuta) i Recordly (šest minuta) bila je zanemariva, ali Sonixu je trebalo nešto duže (11 minuta). (Ažuriranje: Predstavnik tvrtke Sonix javio se da je njegova brzina u skladu s drugim alatima kada je značajka identifikacije zvučnika isključena.) U stvarnom okruženju, to bi mogla biti ključna razlika, osobito kod dužih transkripcija.
YouTube je ovdje pomalo misterij. Za ovaj prijepis, trebalo je samo nekoliko minuta da se automatizirani titlovi pojave. U prošlim iskustvima, otkrili smo da duljina vremena koje je potrebno da se pojave može prilično varirati. Budući da YouTube zapravo nije namijenjen za korištenje na ovaj način, nismo sigurni koliko to obično traje.
Revovim ljudskim prepisivačima trebalo je oko četiri sata i 15 minuta da završe svoj transkript. Trebalo mi je otprilike polovica toga da to sam napravim s oTranscribe, ali ne bez nekoliko pauza, Spotify's Duboki fokus playlistu i dva galona kave.
Cijene (pobjednik: rekordno)
Ne možete pobijediti besplatno (YouTube, oTranscribe), ali kada su u pitanju namjenski alati za automatsku transkripciju, cijena uvelike varira. Da biste odredili najbolju cijenu, morate uzeti u obzir koliko često ćete koristiti alat.
Sonix je najskuplji, s osnovnim planom koji počinje od 15 USD mjesečno plus 8 USD za svaki sat prepisanog zvuka. Ali alat nudi pozamašan popust od 33 posto za godišnje plaćanje umjesto mjesečno.
Trint također nudi planove počevši od 15 USD na sat za transkripcije uz plaćanje ili 40 USD mjesečno za do tri sata vrijednih transkribiranih audiozapisa. Dodatne transkripcije koštaju sjeverno od 13 USD po satu.
Happy Scribe košta 10 centi po minuti prenesenog zvuka. Za tipove manje sklone matematici, to je 6 USD po satu.
Za slabih 2 USD po satu, uz prvi sat besplatno, Recordly je daleko najjeftinija opcija automatske transkripcije.
Nije iznenađujuće da ljudski prepisivači u Rev koštaju više od ostalih alata. Naš 13-minutni isječak koštao je 14 USD za transkripciju, a platili smo 3,50 USD više za vremenske oznake. Ipak, jeftin relativni trošak za uključene sate rada tjera nas da se zapitamo gdje su Revovi prepisivači u svijetu i koliko dobro dobivaju naknadu.
Jednostavnost korištenja (pobjednik: trint)
Nijedan od ovih alata nije težak za korištenje. U svaki od njih učitavate datoteku (ili s njom snimate audiozapis, u Recordlyjevom slučaju) i, nešto kasnije, šalje vam vezu na transkript koji se može uređivati.
Trint čini veliki korak dalje od prijenosa datoteka i prihvaća audio ili video iz raznih izvora, uključujući Dropbox, Google Drive i FTP, te čak dopušta korisnicima da jednostavno unesu vezu. Ovo je jedinstveno među alatima koje smo testirali. Trint također postavlja nekoliko korisnih pitanja o pozadinskoj buci, unakrsnom razgovoru i još mnogo toga prije početka prijenosa. Neće popraviti snimku, ali je koristan UX nod koji uči korisnike kako snimiti više transkribbilnog zvuka u budućnosti.
Happy Scribe, Rev, Sonix i Trint šalju e-poštu kada je transkripcija spremna, tako da nema potrebe sjediti i buljiti u ekran.
Donja linija
Nije najjeftiniji, niti je općenito najtočnija opcija transkripcije koja je dostupna, ali Trint je pobijedio kao najbolji sveobuhvatni alat od onih koje smo testirali.
Tvrtka je stara nešto više od godinu dana i dobila je sredstva od Zaklade Knight (odricanje od odgovornosti: Poynter također prima financiranje od Knighta) i Googleova inicijativa za digitalne vijesti, nudi najbolju ukupnu kombinaciju funkcionalnosti, točnosti i jednostavnosti korištenja.
Samo YouTubeova značajka automatskog titlovanja, koja je postigla stopu točnosti od 72 posto, prošla je znatno bolje od Trint-a u transkripciji vođenoj algoritmom. No YouTube nije dizajniran za vrstu transkripcije koja je novinarima potrebna svakodnevno i ne nudi nikakvu vrstu funkcionalnosti uređivanja.
Iako je mladi startup Happy Scribe prošao nešto bolje u našim testovima točnosti sa stopom od 62 posto, a cijena mu je otprilike trećina od Trint-a, nedostaju mu mnoge dodatne značajke koje Trint čine korisnim. Mogućnost učitavanja iz mnogih izvora, pronalaženja i zamjene teksta i identifikacije zvučnika mali su, ali važni alati tijeka rada. Ako samo tražite brzi i prljavi prijepis, Happy Scribe bi mogao biti pravi način.
I premda je istina da je njegovih 61 posto daleko od savršenih, naši su testovi bili malo teži od većine stvarnih upotreba.
Također smo testirali Rev, uslugu ljudskog prevođenja, i oTranscribe, koji nudi zgodne alate za novinare da sami prepisuju audio zapis. Za 1 USD/minuti transkribirane audiozapise, otkrili smo da je Rev preskup za prosječnog novinara da ga redovito koristi. I premda je oTranscribe bio zgodan, ne rješava zamor i vrijeme prepisivanja.
Imajući na umu tipične namjene, Trint je najbolji svestrani alat za automatsku transkripciju za novinare.
Ispravak: Prethodno smo izvijestili da Sonix ne radi ponuda pronaći i zamijeniti alat, ali zapravo radi. Ispričavamo se što smo ga propustili.
Saznajte više o alatima za novinarstvo uz Try This! — Alati za novinarstvo. Pokušaj ovo! se pokreće pomoću Google News Lab . Također ga podržavaju Američki institut za tisak i Zaklada Johna S. i Jamesa L. Knighta