Opplæringen

Talegenkjenning: Ettertanke på dets styrker og svakheter

Jeg må innrømme at jeg ikke hadde brukt noen form for talegjenkjenning i lang tid da jeg ble bedt om å gjøre opplæringen. Siste gang jeg hadde prøvd talegjenkjenning, var det med Dragon Dictate, som var nytt da Windows 98 også var nytt. For lenge siden i dataarket!

Jeg var glad for å takle dette emnet fordi jeg var veldig interessert i å se hvordan talegjenkjenning har forbedret seg. Og gutt, har det blitt bedre! Selv en grunnleggende, innebygd applikasjon som dette gjorde en utrolig god jobb "rett ut av boksen." I denne siste artikkelen om Talegjenkjennelse, vil jeg snakke om det jeg lærte mens jeg reacquainting meg med underkjenningen av talegjenkjenning, og hvor jeg skal reise herfra.

Ikke klar for Star Trek ennå

Jeg er sikker på at mange av oss så på besetningen til Starship Enterprise som sa "Computer!" og får et øyeblikkelig svar. Vi har ikke Starfleet-datamaskiner ennå, men begynner med Windows Vista og fortsetter i Windows 7, vi har datamaskiner som vil høre på oss og svare på det vi forteller dem - og svare oss, hvis "Hva var det?" anses som et svar.

Jeg hadde problemer da jeg først prøvde å bruke talegjenkjenning, og feilsøking var ikke særlig grei. Hjelpefilene er ikke alltid nyttige nok. Jeg var i stand til å finne svarene på Microsofts nettsted og i et utvalg av elektroniske fora uten for mye arbeid. Det var slik at jeg fant ut at jeg hadde glemt at webkameraet mitt (sitter rett foran meg på toppen av skjermen min og direkte i tråd med måten jeg snakket) også hadde en aktiv mikrofon og var med på forvirringen. Når jeg løst det, var det ganske jevnt seiling fra da av.

Jeg prøvde selv å snakke med et utvalg av forskjellige aksenter (for eksempel BBC British og American Redneck) og klarte å få rimelig god anerkjennelse, noe som gjorde det mulig for forskjeller i standard amerikansk uttale. Selvfølgelig, sier "Venner, romere, landsmenn, lån meg dine ører!" mens jeg gjorde mitt aller beste inntrykk av Helen Mirren og Jeff Foxworthy, fikk jeg meg til å le for mye for å få helt nøyaktige resultater.

Språkgjenkjenning

Talegjenkjenning kan brukes på forskjellige språk, og jeg trodde jeg kunne prøve det med min begrensede, amerikansk aksent, spansk, tysk og fransk, men dessverre kan du ikke bruke andre språk, med mindre operativsystemet ditt også er på det språket. Du kan endre operativsystemets språk ved å installere en annen språkpakke fra Microsoft, men du kan bare gjøre det hvis du kjører Windows 7 Ultimate eller Windows 7 Enterprise.

Taleegenkjenning er tilgjengelig for engelsk, engelsk, fransk, spansk, tysk, japansk, tradisjonell kinesisk og forenklet kinesisk, og finnes i disse språkversjonene av Windows 7 (alle versjoner). Jeg var lei meg for ikke å kunne prøve det ut. Jeg har ingen anelse om hva som vil skje med Windows 8, men jeg tror evnen til å installere andre språkpakker ville være et godt tillegg til Windows 8-ekvivalenter av Windows 7 Professional og over.

Hva fungerer bra

Som nevnt, er talegjenkjenning designet for å fungere best med annen Microsoft-programvare. Så lenge jeg eksperimenterte med Microsoft-produkter, var jeg veldig vellykket (selv om man kanskje regner med å bruke Microsoft Office Excel var både begrenset og komplisert). Med annen programvare ble det rammet eller savnet. Jeg kunne bruke Google Chrome- nettleseren ganske bra (definitivt ikke så vel som Internet Explorer ) og Eudora e-postprogrammet mitt, som er ganske mye antikk programvare nå. Det er verdt å eksperimentere med din egen favorittprogramvare for å se hva du kan gjøre. Kommandoen "show numbers" var spesielt nyttig når du valgte elementer og kommandoer.

Jeg fant også at det ikke tok lang tid for nøyaktigheten av anerkjennelsen å forbedre seg markant. Jeg gikk gjennom treningsøvelsene to ganger, og deretter var anerkjennelsen nesten 100% korrekt. Jeg var i stand til å snakke litt raskere og legge inn færre pauser for at programvaren skulle fortsette. Jeg nøt virkelig å se stemmen min oversatt til ord på skjermen. Mine tidlige erfaringer med talegjenkjennelsesprogramvare var ikke i nærheten av dette hyggelige.

Hva fungerer ikke bra

Som nevnt, er noe programvare bare uforenlig med talegjenkjenning . Jeg kunne ikke engang åpne Adobe Reader eller Adobe AIR- versjonen av TweetDeck . Jeg fant ut at jeg ikke kunne logge på Google-kontoen min med Internet Explorer for å prøve ut Google Dokumenter - det syntes ikke å snakke eller stave passordet mitt. Jeg mistenker at dette er et sikkerhetsproblem, og ikke lar passord bli sagt høyt der noen andre kan høre, men det var irriterende.

Jeg kunne åpne iTunes og velge en sang å spille, men kunne egentlig ikke få det til å spille. Jeg kunne åpne Scrivener (min tekstbehandler av valg), men "Vis tall" overlapper ikke tall på alt jeg ønsket å bruke. Jeg gjorde ikke noen veldig omfattende eksperimentering med min favoritt programvare - det er bare noen få som jeg prøvde. Det ville være verdt for alle som ønsker å bruke talegjenkjenning for å teste ut programmene de vil bruke det med, for å være sikker på at det kommer til å være kompatibelt.

Flere lenker og ressurser

Hvis du ikke allerede har sett de forrige artiklene, kan du finne dem her:

  • Arbeider med talegenkjenning: Oppsett og konfigurering
  • Arbeider med talegjenkjenning: Kommandoer, Diktat tekst og surfing på nettet
  • Feilsøking Vanlige Talegenkjenningsproblemer

Merkelig, det er nesten umulig å finne noen informasjon om talegjenkjenningMicrosoft Answers nettsted uten å klikke en kobling fra et Google- eller Bing-søk. Jeg kunne ikke få noen svar i det hele tatt ved å sette "Talegjenkjenning" i søkeboksen, selv om det er noen spørsmål om det i forumene. Bruk denne lenken for å få hjelp om talegjenkjenning fra Windows-webområdet: Søkeresultater for talegjenkjenning.

Her er en kort Wikipedia-artikkel som snakker om historien om talegjenkjenning hos Microsoft: Windows Speech Recognition.

Her er en bloggoppføring som gir forfatterens tanker om å sammenligne talegjenkjenning med Dragon Naturally Speaking: Dragon NaturallySpeaking Versus Windows 7 Voice Recognition.

Wrapping det opp

Jeg nøt virkelig å jobbe med talegjenkjenning og forundre over de forbedringene som har blitt gjort over tid. Det ville sikkert være godt nok for uformell daglig bruk, spesielt med Microsoft-produkter.

Vil jeg fortsette å bruke talegjenkjenning ? Ja, når jeg kan. På dette punktet trenger jeg ikke noe mer sofistikert. Det var vel verdt tiden det tok å trene den og å trene meg selv for å bruke den riktig.