Najbolji softver govora u tekst: diktiranje rezultata

Softver za prepoznavanje glasa postaje sve bolji iz dana u dan. Unatoč svojoj reputaciji koja ne baš radi, moderni alati mogu pristojno obaviti posao prevođenja vašeg glasa u tekst za diktiranje i unos naredbi. Pogledali smo neke od mogućnosti kako bismo vam predstavili ovaj pregled najboljeg softvera za obradu teksta u tekstu. Naš je omiljeni Dragon NaturallySpeaking, ali oko nas ima puno besplatnih (ili barem jeftinijih) opcija.


Ako želite diktirati dok radite druge stvari, govor u tekst je savršen. Na primjer, tijekom kuhanja možete napisati govor za rad. Većina ljudi govori brže nego što pišu, pa to može učiniti produktivnijima pod uvjetom da je softver točan. Za osobe s tjelesnim oštećenjima, možda je to njihov jedini način korištenja računala, što točnost postaje još važnije.

Kilometara se može razlikovati ovisno o vašem jeziku ili naglasku. Oni od nas iz udaljenijih dijelova svijeta možda će naše naglaske prepoznati manje vjerojatno od ostalih. Amerikanci su, primjerice, bolji u odnosu na ljude iz Škotske. Različiti jezici predstavljaju različite izazove sustavima računalne interpretacije. U našem testiranju ćemo se usredotočiti na engleski jezik, ali možda ćemo baciti isječke drugih jezika da vidimo što se događa.

Za naše testiranje glavna stvar koju ćemo gledati je točnost. Čitat ćemo fiksni skup teksta svakom alatu da bismo usporedili kako se rukuje. Također ćemo pregledati prepoznavanje naredbi ako je prikladno.

Veliko pitanje koje smo željeli postaviti bilo je je li softver za prepoznavanje glasa prešao s povremeno korisne novosti na nešto što nudi razumnu ili čak superiorniju alternativu tipkanju..

Naš mikrofon su standardne slušalice i ne slute ništa. Provodit ćemo većinu svog testiranja na istom računalu te ćemo koristiti iPad i Android telefon da bismo pogledali ponude Applea i Googlea. Naš Mac mini nije uspio prepoznati mikro ulaz, tako da je prema zadanim postavkama.

Prozori-prepoznavanja govora-slušanje

Prepoznavanje govora u sustavu Windows

Prepoznavanje govora u Windows ugrađeno je u Windows. Sve što trebate učiniti je postaviti u prepoznavanju govora u polju za pretraživanje sustava, a zatim kliknite čarobnjaka za instalaciju. Trebat ćete naglas ponoviti par rečenica. Nakon što završite, nudi vam da se poboljšate prelazeći putem e-poruka i dokumenata. Ne, momci.

Prozori-prepoznavanja govora-postavljanje

Možda biste imali zabrinutosti oko omogućavanja prepoznavanja govora u sustavu Windows s obzirom na njegovu privatnost. Ako je to slučaj, vrijedi provjeriti naš članak o postavkama privatnosti sustava Windows 10.

Krenuvši dalje, Windows toplo preporučuje da uzmemo vodič za glasovne naredbe. Čudno, iako koristimo Windows 10, mi možemo odabrati samo Windows 7 ili 8.1. Vodič je videozapis koji prolazi kroz popis naredbi i u našem jasno piše da je Windows 10 na vrhu, tako da smo preskočili pokušati.

Počeli smo s uspjehom i otvorili prozor za pretragu kako je i planirano. Pokušavajući dodati novi redak dokumentu dao nam je “što je to bilo?” poruka, ipak. Isto je bilo s drugim pokušajem. Treći je pokušaj otvorio novi dokument, a četvrti je pokušao odabrati sve brojeve u našem dokumentu, tako da nije bio osobito koristan..

Izreka “idi na početak rečenice” odvela nas je na početak naše tipkane rečenice. “Idi na kraj rečenice” također radio. Međutim, obojici je trebalo duže nego udaranje po tipkama doma ili kraja.

Clippy može govoriti, ali može plesati?

Naše se računalo borilo onoliko koliko smo bili u tom trenutku. Naš i5-7600 testni sustav doživio je zabrinjavajuće rezultate zbog korištenja prepoznavanja govora i imali smo poteškoća prilikom prebacivanja između dokumenata i kartica na preglednik na način koji nas je podsjećao na starog Microsoftovog favorita, Clippyja.

Prozori-prepoznavanja govora-ono

Windows prepoznavanje govora brzo se isključuje, umjesto da traje 45 sekundi za učitavanje animacije koja se raspršila u daljinu, zato hvala na malim milosrđima. Takođe je najbolje što nam Microsoftovo prepoznavanje govora ne predstavlja lice za udaranje. Monitori nisu tako izdržljivi kao nekada.

Budući da je često pogrešno tumačilo naše naredbe, a ne ništa, smatramo se sretnima što nije ništa ozbiljno učinilo dok smo to koristili. Ipak, postoji potencijal za radnu katastrofu. Nastavila je raditi i nakon što smo spustili i mikrofon.

Pošteno je reći da smo imali zajednički uspjeh s prepoznavanjem govora u sustavu Windows. Impresivno je kad djeluje, ali pogrešno se često često koristi. Mogla bi biti korisna za tjelesno oštećene, ali postoje i bolje mogućnosti.

Siri govor u tekst

Budući da nas je Microsoft iznevjerio, mislili smo da nas Apple neće razočarati; Naposljetku, pokreće ga Nuance, ista tvrtka koja stoji iza Zmaja. Međutim, odbili smo prepoznati mikrofonski ulaz, pa smo umjesto gledanja Appleovog govora na radnoj površini u tekst odlučili testirati Siri na iPadu.

Siri je usluga najviših profila, a iPhone popularnost koncepcijom govora u tekst i rušenjem rekorda u tehnologiji koja se najviše pokazuje u barovima.

Appleovi uređaji uvijek izgledaju dobro i usmjereni su prema korisniku. Nestrpljivo smo željeli vidjeti hoće li to prevesti u funkcionalni softver za prepoznavanje govora. Da vidimo kako se Siri ponašala tijekom našeg testiranja.

jabuka-valni oblik

Nakon pokretanja aplikacije Notes, uključili smo se u diktat, koji uključuje slanje ulaza u oblak da bi Apple mogao obraditi. Ako vas zanima aspekt privatnosti ovog, pročitajte naš članak o najboljim zakonima o privatnosti u oblaku.

Upotreba oblaka omogućava da se puno računskih konjskih snaga baci na tumačenje onoga što govorite. Možda mislite da bi taj pristup bio spor, ali iznenađujuće brz. Postoji primjetno kašnjenje, ali nije dugo i još uvijek radi brže od tipkanja.

jabuka-tipkovnica

Korištenje iPad prepoznavanja govora je jednostavno. Samo kliknete mikrofon kad god je tipkovnica vidljiva, to je slučaj na koji radi većina aplikacija koje koriste tipkovnicu.

Što Dickens?

Apple je obavio pristojan posao, ali i dalje je imao problema s Dickensom. Većina je riječi u našem testnom djelu izgovorena točno, ali još uvijek je postojala neobična buka, poput: “Oliver je bio bezobziran prema Missouri.”

Bilo je bolje s jednostavnim frazama, a većina onoga što smo rekli pravilno se čulo sve dok smo se držali osnovnog rječnika. Odustala je, međutim, povremena riječ.

Pri pretraživanju weba traženje Siri često je brže od tipkanja, posebno na manjim uređajima koji imaju vrlo tipkovite tipkovnice.

jabuka-rezultati

Zatim smo ga testirali s nekoliko stranih riječi i naziva mjesta. Nosili su „konnichi wa“, ali nisu uspjeli prepoznati imena članova K-pop benda. Ipak, Appleovu je zaslugu što smo se osjećali dovoljno samopouzdano.

Sveukupno, Siri dobro funkcionira s jednostavnim frazama i to je dovoljno dobra upotreba kada želite nešto potražiti u žurbi. Međutim, kako će korisnici biti svjesni, to čini puno pogrešaka i prilično je ograničeno. Ipak, to je dobar napor Applea.

Upisivanje glasa s Google Dokumenata

Glasovno pisanje Google Dokumenata besplatno je i dostupno gdje god se nalazi Chrome. Ne zahtijeva postavljanje i može se aktivirati s izbornika alata u bilo kojem dokumentu.

google-glas-tipkanje-mic

Počevši s našim Dickensovim testom, ustanovili smo da je „Oliver Twist“ ponekad bio „Oliver“, a drugi put „svuda“. Mnogo je riječi preskočeno i rezultati su bili puni pogrešaka. Google Docs glasovno tipkanje automatski se isključuje i u jednom je trenutku prestao reagirati iako je uključen, pa smo morali ponoviti odjeljak.

google-glas-tipkanje-Oliver

Nakon što smo postigli loše rezultate na našim testovima diktata, pokušali smo dati naredbe i bolje smo funkcionirali. Prebacivali smo se između kurzivnog slova i podebljanog tipa, dodavali interpunkcijske znakove i diktirali riječi, koje smo prepoznali.

Ipak, Google Docs glasovno tipkanje jednostavno je korištenje, čak i ako njegova točnost ostavlja nešto što želite. Čini se da djeluje bolje ako govorite glasno i jasno.

Kad se stvari vode sporo i jednostavno, to postaje više ispravno, ali nije dovoljno točno da bi bilo puno više od trikova. Ako vam je neko vrijeme trebalo diktirati handsfree, to možete učiniti i ispraviti pogreške nakon toga, ali bit će ih puno.

google-glas-tipkanje-stranica

Googleovo prepoznavanje glasa djeluje bolje na mobilnom nego na stolnom računalu

Razočarani performansama na radnom stolu, odlučili smo pružiti još jednu priliku Googleu. Ovaj put koristili smo Gmail na Androidu i, začudo, prošli smo puno bolje. Točnost je bila gotovo 100 posto za diktat i tekst, ali Dickensovi testovi su opali znatno. Sve u svemu, otkrili smo da verzija Androida funkcionira mnogo bolje od one za stolnu verziju.

Jasno je da u Googleovoj tehnologiji postoji potencijal. Android nam je dao bolje rezultate i, ako ste voljni tolerirati mnoge pogreške, može biti korisna alternativa njegovoj tipkovnici.

Speechnotes

Speechnotes je usluga gledanja u tekst na temelju preglednika koja vam omogućuje diktiranje u pregledniku. Ne zahtijeva postavljanje osim davanja dopuštenja za upotrebu mikrofona, tako da možete preći izravno na diktiranje.

Ne može biti jednostavnije za upotrebu. Postoji veliko područje za unos teksta i veliki mikrofon koji možete kliknuti kad želite pokrenuti i prestati diktirati.

Za naš prvi test pokušali smo ga pogoditi rapom i to je podjednako dobro moglo procijeniti s obzirom na kvalitetu naših pjesama. Dobio je skicu kada smo testirali interpunkcijske znakove. Puni zastoji, zarez i upitnici radili su većinu vremena, ali koloni su postali “kodoni” ili “Kyle Long”, za koje nikada nismo čuli.

speechnotes-rap

Emaji komande donijele su osmijehe na naša lica, kao i na naše ekrane, ali crtica i crtica postali su “dodge Hartford”.

Naš Dickensov test vratio se, “Oliver Twist je bio očajan glađu, a doručak s bijedom”, što je, barem, bilo u duhu priče. Gospodin Bumble bio bi dodatno bijesan kad bi se opisao kao “alfa mama”, premda smo izabrali britanski engleski.

speechnotes-Oliver

Pokušali smo ga postaviti na američki engleski i govoreći našim najboljim američkim naglaskom samo da otkrijemo „mama“ pretvorena u „bombu“. Bilo je beznadno. Bojeći se da bi to mogla biti naša dikcija, okrenuli smo se Jamesu Earlu Jonesu. Snimanje ikoničnog prizora iz određenog filma nije uspjelo ispravno. Pokušali smo vikati u naš mikrofon. Ni to nije pomoglo.

Neka bude jednostavno

Bilo nam je bolje kad smo koristili jednostavne izraze. Učinio je pristojan posao ispravljanja stvari, iako je još bilo pogrešaka.

Možete koristiti Speechnotes da napravite grubu skicu, pod uvjetom da su stvari jednostavne i govorite sporo. Međutim, bilo bi nekoliko pogrešaka koje treba ispraviti, ostavljajući dojam perilice posuđa koja neće raditi ako ne operete tanjure prije nego što ih stavite unutra.

Speechnotes funkcionira u bilo kojem pregledniku, sve dok je preglednik Chrome. Možete izvesti u .doc ili .txt format ili je poslati na Google disk.

Transkribiraj

Fokusiranje prepisa je na audio datotekama, tako da ako želite snimiti .mp3 i prepisati ga kasnije, to je alat za vas. Ipak to ne testiramo. Samo gledamo njegovu sposobnost diktiranja.

Tvrdi da njegova mogućnost diktiranja omogućava rad dva do tri puta brži od tipkanja. Da bi to bila istina, treba vam precizno prevesti vaš govor u tekst. Međutim, kao što vlastita web stranica ističe, to je san s cijevima još uvijek.

Pruža vam tjedan dana besplatne usluge, nakon čega naplaćuje 20 dolara godišnje. To neće slomiti banku i stalna naplata, a ne velika jednokratna naknada, sugerira da je tvrtka uvjerena da će vas zadržati kao kupca. Pretplata također znači da uvijek možete iskoristiti najnoviju verziju softvera.

Transkribiraj-glavni-zaslon

Međutim, kao plaćena usluga, naplaćuje se isporuka usluge Transcribe. S konkurentima uglavnom ne uspijevaju pružiti ništa na način jake konkurencije, međutim, traka nije postavljena na visoku razinu. Otkrijmo može li Transcribe to očistiti.

Nakon prijave, dobili smo kratak obilazak s skočnim prozorom koji objašnjava nekoliko alata i kontrola. Zatim smo se uputili prema gumbu “diktat”, nestrpljivi da vidimo što će Transcribe napraviti od našeg raskalašnog slaganja.

Počeli smo s Oliverom. Kao i obično, dobili smo oko 50 posto točnosti, s tim da se neobična rečenica savršeno tumači, a drugi su nam se vratili kao “napredovanje prema gospodaru, bizonu i žličici u ruci”, što je donekle probilo čaroliju. Oliver je istog trenutka preimenovan u “cijelu”.

Transkribiraj-Oliver

Učinkovitost prepisa poboljšana je jednostavnim rečenicama. Započelo je dobivanjem osam uzastopnih rečenica 100 posto tačnih. Prva greška dogodila se kada smo se uvjerili i na brzinu počeli izgovarati riječi, ali stvari su bile ispravne kad smo se vratili i ponovili polako.

Transkribiraj-jednostavna-rečenice

Razuman posao biti koristan

U odnosu na Windows, Speechnotes i Google, Transcribe je naprijed i pouzdano prelazi Siri. Još uvijek ne može upravljati s “Oliver Twist”, ali čini dobar posao izricanja jednostavnih rečenica. Nisu razumjeli naš francuski, ali teško da se za to može kriviti, kao što to čine i mnogi Francuzi.

Ako ne možete upisati ili vam je toliko loše da u svakoj rečenici napravite grešku ili dvije, moglo bi se dogoditi da Transcribe poboljšava vašu produktivnost. Također može biti korisno za snimanje sastanaka ili razgovora u situacijama u kojima su vam potrebne samo grube bilješke ili se rado vraćate i ispravljate pogreške kasnije.

Transcribe se temelji na pregledniku, ali diktat djeluje samo u Chromeu. Međutim, možete izvesti u .doc, pa niste vezani za uslugu.

Zmaj, naravno

Posljednji smo put pogledali Dragon NaturallySpeaking, koji je najskuplji na ovom popisu. Na našem računalu testirali smo najjeftiniju verziju kuće. Tvrdi da „bilježi vaše misli onoliko brzo koliko ih možete izgovoriti“. Nakon razočaranja drugim softverom, nadali smo se da je uspio, ali bili su skeptični.

Postavljanje je teško, s nespretnim vezama za preuzimanje i serijskim brojem koji je potrebno unijeti u pet različitih polja, a da ne dopustite korisnicima da cijelu stvar zalijepe odjednom. Pogledavši mogućnosti instaliranja pronašli smo na raspolaganju nekoliko engleskih modula. Možete birati australijsku, kanadsku, američku, američku, indijsku ili jugoistočnu Aziju, što je impresivno, ali možda biste mogli onesposobiti one koje ne želite jer jedu preko 200 MB prostora..

Međutim, to postaje zbunjujuće pri odabiru naše regije i naglaska. Ako bismo odabrali Sjedinjene Države kao našu regiju, mogli smo birati između svih dostupnih akcenata, ali kad smo odabrali američki, nismo mogli odabrati španjolske ili pakistanske naglaske. Kad je naša regija postavljena na Indiju, Australiju ili Novi Zeland, uopće nismo mogli odabrati svoj naglasak.

Putnici koji regiju postave na svoju lokaciju bez pažljive provjere možda nisu svjesni da mogu prilagoditi Zmaja njihovom naglasku, što izgleda kao greška iz perspektive upotrebljivosti.

Pod pretpostavkom da je naš američki akcent “standardni”, nastavili smo. Bilo je naprednih opcija za odabir naše riječi vokabulara, ali bila je dostupna samo velika. Možete odabrati i govorni akustički model, ali on nudi samo prethodnu verziju zadanog BestMatch V.

Uđite u Zmaja

Dragon-NaturallySpeaking-logo

Prilikom pokretanja dobili smo mogućnost pokretanja u probnom načinu, iako nismo pronašli besplatnu probnu vezu na web mjestu ili aktivirali proizvod koji smo odabrali.

Od nas se tražilo da pročitamo neki tekst kako bismo potvrdili da je naš mikrofon radio. Zmaj je bio toliko samouvjeren, presjekao nas je na pola puta, i pustio nas da krenemo prema udžbeniku. „Prođite kroz ove progresivne simulacije i učinkovito ćete naučiti važne vještine!“ objavila je.

Vodiči su izgledali nespretno, ali bili su bolji kada je u pitanju sadržaj. Naša prva prilika da testiramo Zmajevo prepoznavanje govora došla je kada je tražio da isključimo mikrofon svojim glasom. Učinili smo to u dva pokušaja. Prvi diktatorski test diktata trajao je i dva pokušaja prije nego što nas je saslušao, ali problem je nestao i izvan udžbenika, tako da nije tako ozbiljan.

Od tog trenutka nadalje, sve je ispravno, uključujući složenu interpunkcijsku i numeričku oznaku. Budući da smo samo govorili ono što nam je rekao, ipak smo zadržali svoj sud.

Vodič vam daje savjete kako govoriti kada koristite aplikaciju, što je dobrodošlo i pomoći će u poboljšanju šansi korisnika za razumijevanje. Također vas uči da koristite “ispravan” izbornik kad čini greške.

U jednom trenutku pojavio se skočni prozor koji nam je rekao da ono što smo rekli nije prepoznatljivo. Pitali smo se je li to zapravo naša greška. Još jedan skočni prozor ponudio je instaliranje proširenja preglednika za nas. Neki bi mogli smatrati ove skočne prozore korisnim, drugi ih mogu smatrati iritantnima.

Korištenje Dragon NaturallySpeaking

Nakon što preskočite sve te obruče, Zmaj se lako koristi. Njegova traka izbornika nalazi se pri vrhu zaslona i ima veliki crveni mikrofon koji želite kliknuti kad ga želite uključiti. Dragon vas ne pušta da započnete s izgovorom “mikrofon uključen.” Za početak morate kliknuti.

speechtotext-konjska bar

Traka izbornika je dobro dizajnirana i omogućava vam pristup mnogim korisnim značajkama. Dragon vam omogućuje odabir korisničkih profila, što je korisno ako na istom stroju imate ljude s različitim naglascima. Može analizirati svoj vokabular gledajući dokumente koje je odabrao korisnik, što znači da ih možete obučiti s podacima koji odražavaju vašu osobnu upotrebu jezika.

Postoji nekoliko opcija kalibracije zvuka i značajka koja vam omogućuje da uvježbavate određene izraze. Također možete pregledati povijest prepoznavanja da biste vidjeli ima li nešto što Dragon često pogreši.

Ima i niz značajki za pomoć. Postoji pomoćnik za performanse i nekoliko opcija za pomoć i podršku. Web stranica sadrži bogatu dokumentaciju, ali čini se raširena slika. Veza korisničkog vodiča koju smo vidjeli nije pokrivala puno više od instalacije. Postoje korisni vodiči za naredbe za verziju Profesionalne i Pravne, ali nismo ih mogli pronaći za dom.

Postoji i baza znanja, pa ako vam je potrebna podrška, postoji puno mogućnosti. Tijekom pregledavanja ovoga članka saznali smo da je dopušten samo jedan korisnik na računalu, tako da će korištenje mogućnosti višestrukih profila biti skupo..

“Ispravan” izbornik je koristan i daje vam popis alternativnih tumačenja onoga što ste rekli. Na spisku su tako da ih možete odabrati prema broju ako vidite željenu.

Budući da smo bili impresionirani njegovim osobinama, ali razočarani manjim pitanjima upotrebljivosti tijekom postavljanja, započeli smo naš test “Oliver Twist” pitajući se hoće li Dragon opravdati cijenu.

Pet minuta kasnije dobili smo odgovor. Zmaj se spušta čeljusti kada je u pitanju njegova osnovna značajka prepoznavanja onoga što govorite. Pogledajte naše rezultate ispitivanja diktata.

speechtotext-zmaj-diktat

To su 200 riječi proze iz 19. stoljeća izrečene s tri pogreške. “Rebel” je postao “rabel”, “beadle” je postao “buba” i nije imao nikakve šanse sa “Mr. Limbkins „. Skromna interpunkcija svodi se na nas, i upravo ono što je zrno ionako?

Znamo ljude koji nisu tako dobri u tumačenju govora. Bilo je toliko dobro da smo morali pribjeći „Mary Poppins“ da iz nje izbacimo zabavnu pogrešku, a „supercalifragilisticexpialidocious“ je postao „Super Kalifornija koja izbacuje zatvaranja“.

Zmaj uključuje zgodan “centar za učenje” koji vam pokazuje naredbe relevantne za sve što radite. To je lijep način za učenje o softveru, posebno pri pokretanju. Osnovni diktat je jednostavan i može se koristiti bez pomoći.

speechtotext-zmaj-učenje-centar

Najbolji softver za obraćanje u tekst?

Po „150 $},

Presuda

Zabavno smo testirali te alate i otkrili njihova ograničenja. Bilo je mnogo zabavnih pogrešaka. Pisci komedija s piščevim blokom mogli bi učiniti i gore od diktiranja nekih od ovih aplikacija i gledanja koji se šaljivih crta materijaliziraju.

Naš prvotni dojam kada smo gledali besplatne mogućnosti bio je da je ova tehnologija impresivna kada djeluje, ali treba postati pouzdanija da bi shvatila svoj potencijal.

Pogled na Zmaja to je promijenio. Točnost je na različitoj razini od ostalih. Razlika je bila noć i dan i vidimo se kako koristimo Dragona u scenarijima u kojima nijedan drugi alat neće biti održiv.

Opcije mobilnih uređaja vrijedi upotrijebiti za pretraživanje, sve dok ste spremni u više navrata krenuti na virtualnu tipkovnicu kada ne rade..

Transcribe čini pristojan pokušaj preciznosti, ali nije dovoljno dobar, a za profesionalnu upotrebu smatramo kako Zmaj vrijedi novac za dodatne performanse.

Iako smo se zabavljali, ovaj je članak dijelom bio vježba za otkrivanje zašto se te usluge ne koriste široko. Besplatne opcije, iako ne bez zasluga, ostavljaju mnogo toga za željeti. Ipak, nema nikakve štete od isprobavanja istih, i tko zna, možda otkrijete da prepoznaju sve što kažete.

Najbolji softver za prepoznavanje glasa

Ako ste spremni platiti Zmaja 150 dolara, stvari se u potpunosti mijenjaju. Nadamo se da će se njegova tehnologija odvojiti do besplatnih ponuda. To bi moglo biti izmjenjivač igara i zauvijek promijeniti način na koji komuniciramo sa svojim uređajima.

Znanstvenofantastični san naših računala koji reagiraju na naše riječi možda je bliži nego što mislimo, mada će vam u većini slučajeva trebati velika tolerancija za pogreške.

Ako imate preporuke za ostale usluge, javite nam se. Bili bi nam zanimljivi da čujemo kako ste s njima. Može biti da ljudi s različitim glasovima imaju različita iskustva, pa kupujte okolo ako vam se ne sviđaju naše preporuke. Hvala na čitanju.

Kim Martin Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map