Skriv løs

… og se nu at få det sagt ordentligt

Archive for April 25th, 2022

Jeg tror ikke mine egne ører! eller øren.

En video fra Polsk station “Polish Daily Life” – er den højredrejet eller er den værd at tale om?

Er det rigtigt at fhv. Gerhard Schröder har omfavnet Putin?

Er det rigtigt at Schröder besøgte Putin i Marts – altså efter invasion i Ukraine?

Det er ikke til at finde et review/omtale of bias i “Poland Daily Live”, som muligvis er en del af et større selskab som promoverer Polske produkter, kultur og politik. Det er godt, hvis det bare er sådan; men denne omtale af Schröder og Putin uden en undrende kritik eller forklaring af de større perspektiver, der kan være i videregivelse af en (måske dement) Schröders besøg og vurderinger er helt uacceptabel.

Raw materials needed by Germany … ! ?

Advertisement

Written by Donald

Monday, April 25, 2022 at 15:28 GMT+0000

Posted in Ord

Tagged with

Tale til bogstaver – /talegenkendelse/

Indlægget udtrykker ikke redaktionens holdning.

Der findes flere betegnelser for analyse af digitaliseret lyd indeholdende menneskelige stemmer som taler. Det mest danske er vist “talegenkendelse”, men det er conceptuelt forkert, det er ikke gen-kendelse, men analyse og omsættelse af digitaliseret lyd til bogstavering af de ord, der mest sandsynligt er repræsenteret af lyden.

En kortere og tilfredsstillende betegnelse er trans-skript af video-snak.

Automatisk transkript af tale er en videnskab/teknik, som jeg blev introduceret for for 19 eller 22 år siden, idet nogle computer-fabrikanter af forbruger elektronik (Mobil-telefoner, Appe iPads osv) drømte om at få flere analfabeter og dovne med i kundemængden.

Disse virksomheder drømte også om en verden i stil med Rumrejsen 2001, og lignende science fiction, hvor man råber kommandoer og slavecomputere udfører ordrerne uden at mukke.

Med mit kendskab til dansk udtale afslog jeg trods manglende andre opgaver at deltage i arbejdet på transskript af danske sproglyde. Jeg opfatter dette projekt som et udtryk for “digitaliserings megalomani”.

Megalomani

Jeg er ved at læse om Alexander Den Store (en lille mand <170), som var myndig og viljestærk, dygtig til at iværksætte myrderier og et militær-strategisk geni, som gentagne gange overraskede sine modstandere og overvandt hære af betydelige størrelser. Udstråling eller charisma er frygt for hvad folk kan finde på, han havde charisma.

Han havde til tider 30,000 mand under våben. Håndtering af kommandovejen i en verden uden mobiltelefoner må være noget nemmere end i dag, hvor man dog kan få informationer andre steder fra. Men det er også andre udfordringer, en sådan oldtids-hærfører mødte, og der var til stadighed modstand og kritik af hans enorme felttog (336 fvt til 323).

En bog fra 2005 af Bengt Liljegren, oversat af Finn Abrahamowitz, udgivet som bogklub-bog, fortæller i detailler om Alexander d.Stores 10 år som øverstkommanderende erobrer, og det afsløres, at han efter sine erobringer stadig tænkte længere og mere, han ville erobre Indien efter en tur hjemad og underlæggelse af landene omkring Sortehavet!

Hans erobringer, eller skulle man sige underlagte territorier, omfattede Lille-asien (dengang en del af Persien) og sletterne omkring Eufrat og Tigris, Persien og Afghanistan (dengang også kaldet Persien).

Liljegrens læsning af mange gamle kilder viser at der var modstand, naturligvis, mod en sådan skør erobrer, men at frygten for at blive myrdet var større end frygten for midlertidig at være besat, især når besætteren faktisk også havde sans for civiliserede by-anlæg.

—oooOOOooo—

Så den svage parallel der er mellem en megaloman Alexander og de teknologi-fixerede mennesker i 1990’erne og især i 2000-2010 som arbejdede effektivt på “talegenkendelse”

Engelsk er et stort sprog og der er ofret mange penge og kræfter på transskript af Engelsk tale til skriftsprog (English: Transcript med 1 s redaktionens bemærkning). Men exemplet her viser en af de vanskeligheder, som man ikke endnu har overkommet. Ukrainian bliver transscriberet til “korean” (En.transcripted to “Korean”).

Jeg gætter på følgende fremgangsmåde (i programmerne, som transciberer):

1. Lydgenkendelse,

2. stavelses-genkendelse med lydskrift,

3. flere “homonymer”, findes, prioriteret efter frekvens (forekommer mest almindeligt øverst)

4. Emne og evt. sprog bestemmes (måske for anden gang, idet selve video-titel og udgiver vil være med i bestemmelse af emneområdet). Resultatet er et domæne, ordet betegner emneområde, og det kan være afgørende for valg af homonymer;

5. De almindeligste strukturbærende dele af sætningen genkendes og sættes op i et skelet: Modalverber, på Engelsk yderligere de vanskelige elisioner is, are, he’s, she’s, it’s, og vigtige ord som then, though, not, which, who (+bøjninger), of, …

6. Derefter kan man formentlig bestemme navneordene og tillægsordene.


Det, der sker i ovenstående exempel, er formentlig (som følge af ovenstående rækkefølge):

Domæne: Politik, krig, Russere og angreb

Tillægsord “Ukrainian” udtalt totalt utydeligt høres/analyseres som “krinian” og algoritmen sørger for opslag i næsten enslydende tillægsord, og gerne et som har noget med politik og handel at gøre – ergo: Korean.

Written by Donald

Monday, April 25, 2022 at 12:03 GMT+0000

Posted in Ord

Tagged with