Využití automatického přepisu řeči v pitevním provozu
Usage of automatic voice transcription in autopsy service
The paper describes the computer program NEWTON Dictate which is used for speech recognition and transcription. The possible uses of this program in forensic medicine are discussed, especially concerning the recognition and transcription of the autopsy findings. Specific conditions of the forensic medicine are introduced, with their influence on speech recognition and translation being the focus. The authors analyze program improvement aimed at reducing mistakes in recognition and transcription which may occur during autopsy work flow. Such improvement involves appropriate vocabulary usage and special vocal adaptation. The role of the autopsy secretary is acknowledged.
Keywords:
autopsy – autopsy protocol – speech recognition and transcription – forensic medicine
Autoři:
P. Nečas 1; P. Hejna 2
Působiště autorů:
Ústav jazyků LF UK, Hradec Králové
1; Ústav soudního lékařství LF UK a FN, Hradec Králové
2
Vyšlo v časopise:
Soud Lék., 56, 2011, No. 3, p. 40-42
Kategorie:
Přehledový článek
Souhrn
Autoři referují o počítačovém programu NEWTON Dictate, který je určen k převodu diktovaného textu do písemné podoby, a popisují jeho možné užití v soudním lékařství k přepisu diktovaného pitevního nálezu. Jsou diskutována specifika soudního lékařství a jejich vliv na přepisovací proces, zejména je analyzována otázka, jak výhodně upravit počítačový program, aby nepřesnosti přepisu, zapříčiněné charakterem pitevního provozu, byly co nejmenší. Jde o hlasové adaptace a užití vhodného slovníku. Úloha pitevní dokumentátorky není v textu zpochybňována.
Klíčová slova:
pitva – pitevní protokol – přepis diktovaného textu – soudní lékařství
Počítačový program NEWTON Dictate, 1 který převádí diktovaný text do písemné podoby, je již ve zdravotnictví užíván, a to především na některých radiologických odděleních k popisu výstupů zobrazovacích vyšetření, na některých odděleních patologie k popisu biopsií či na chirurgických odděleních k zápisům operačních protokolů.2
Užití programu na jednotlivých pracovištích má svá specifika daná charakterem daného odvětví (jde o specifika technická i ta, která se týkají užívané terminologie).3
Cílem tohoto sdělení je popis specifik užívání programu v soudním lékařství, konkrétně při zápisu pitevního nálezu diktovaného přímo při pitvě.4
Jde o úvodní poznámky uváděné s vědomím, že teprve další teoretické i praktické testování programu ukáže, zda je program vůbec vhodný pro využití na tomto pracovišti.
VÝHODY PROGRAMU PRO ADMINISTRATIVU
Zavedení programu představuje především zjednodušení práce pitevní dokumentátorky, nenahrazuje ji však a ani to nemá v úmyslu. Práce dokumentátorky zůstává nadále nezastupitelná a spočívá především ve sledování úspěšnosti přepisu, v organizaci nahrávacího a přepisovacího procesu, doplňování identifikačních údajů, v editaci „surového“ textu a korekturách napsaného textu.
Program uchovává5 diktovaný nález ve zvukové podobě, lze jej tedy znovu spustit a sporná místa v textu dle něj zkontrolovat (během poslechu se v textu zvýrazňují slova, která jsou aktuálně přehrávána; může jít o slova vyslovená tak, že je program nerozpozná, nebo o slova, která nejsou v uživatelském slovníku – viz níže). Závěrečnou korekturu vždy musí provést lékař, který nález diktoval.
TECHNICKÝ POPIS ZAŘÍZENÍ
Program6 je nainstalován na počítač, který má doporučené parametry (např. procesor Intel Core 2 Duo 2.2 GHz nebo jiný odpovídajícího výkonu, OS Windows XP, Vista nebo 7, RAM 1 GB pro Windows XP, RAM 2 GB pro Windows Vista nebo 7, běžná zvuková karta). K licencování programu se používá buď softwarová licence (v tom případě je nutné pro provoz programu být připojen na internet), anebo hardwarový klíč, kdy připojení není třeba. Velikost programu na disku se pohybuje dle velikosti slovníku mezi 200 a 500 MB.
Vlastní zařízení se skládá z počítače se zvukovou kartou (běžná zvuková karta podporující vzorkovací frekvenci 16 kHz a šestnácti bitové rozlišení) a ze sluchátek s kvalitním směrovým mikrofonem. 7 Ten by měl být umístěn cca 5 cm před ústy diktujícího, nikoli však přímo před nimi, ale při jejich kraji nebo pod nimi (přesné umístění je nutné individuálně nastavit).
Propojení mikrofonu a počítače pomocí kabelu není v popisované praxi možné, jakkoli by zajistilo vyšší úspěšnost při rozpoznání a přepisování pitevního nálezu (kabel diktujícímu lékaři komplikuje volný pohyb po pitevně, nehledě na hygienické komplikace). Z tohoto pohledu se jako výhodnější jeví bezdrátová forma připojení mikrofonu s počítačem pomocí modulu (USB port). Tím se zvyšují nároky na takový způsob diktování, aby správnost zápisu („míra porozumění“) byla co nejvyšší. Toho lze postupně dosáhnout vedle dodržování zásad pro správné diktování také volbou hlasového profilu a vytvořením individuálního hlasového profilu diktujícího lékaře (viz níže).
Zařízení je citlivé na zvukové ruchy, jakými jsou zejména hlasy dalších lidí v bezprostřední blízkosti diktujícího, zvuky vydávané pitevními nástroji atd. Proto v případě, že lékař potřebuje komunikovat s dalšími pracovníky (s lékaři, sanitáři, dokumentátorkou, fotografkou, laborantkou aj.), je nutno diktát přerušit přímo na klávesnici, či myší (což je velmi nevhodné z hygienických důvodů), pomocí slovního povelu nebo prostřednictvím dokumentátorky.
VLASTNÍ DIKTOVÁNÍ PITEVNÍHO NÁLEZU
Pro správný chod programu je třeba, aby lékař vyslovoval dostatečně srozumitelně, ale zároveň přirozeně rychle.8 Křik, šepot nebo zvýrazňování jednotlivých slov není vhodné. Mezi jednotlivými větami lze dělat pauzy, program „počká“. Program nerozpoznává suprasegmentální prostředky, je proto nutno diktovat interpunkční znaménka.9 Tím se zvyšují nároky na lékaře, aby si osvojil nejen „technický“ způsob diktování, ale i jazykový styl diktování, který není totožný se stylem při diktování dokumentátorce a který musí být explicitnější.
Stejným způsobem se postupuje, když je potřeba diktování nálezu během pitvy přerušit a komunikovat s dalšími pracovníky (za tímto účelem se používá pokyn např. konec diktování).
Stejný způsob lze zvolit též při ukončení diktování. Vedle těchto přímých hlasových povelů lze povely zadávat přímo na klávesnici nebo je provádí dokumentátorka.
HLASOVÁ ADAPTACE
Vzhledem k charakteru práce na pitevně je nutné bezdrátové připojení mikrofonu k počítači; tím se zvyšuje požadavek na vytvoření individuálního hlasového profilu diktujícího lékaře. Podstatou tohoto procesu10 je, že lékař namluví 90 předem speciálně vybraných adaptačních vět, na jejichž základě systém přizpůsobí své parametry přímo hlasu konkrétního lékaře. Tím by měla vzrůst přesnost a rychlost rozpoznání diktovaného pitevního nálezu.
Je třeba kompenzovat ztráty dané bezdrátovým spojením mikrofonu s počítačem. Zohlednění individuálních charakteristik hlasového projevu diktujícího lékaře zapříčiňuje, že je hlasový profil „nepřenosný“, každý lékař si vytváří svůj vlastní hlasový profil. Diktujícím bez individuálního hlasového profilu slouží pouze obecný profil mužský nebo ženský. Individuální hlasovou adaptaci je vhodné provést až poté, co si lékař osvojí základní pravidla diktování. Je třeba ji provést přímo na pitevně za přítomnosti běžných ruchů a šumů, aby se počítačový program naučil rozpoznávat diktát přímo v tomto prostředí (i s příslušnými šumy), protože pracovny lékařů mají jiné akustické vlastnosti. Nahrávky jsou následně zpracovány přímo na pracovišti firmy, která vytvoří speciální hlasový model.
KORPUS TERMÍNŮ
Program rozpoznává a zapisuje slova v diktovaném pitevním nálezu na základě korpusu termínů (slovník). Ten byl generován ze zhruba 500 MB čistého prostého textu anonymizovaných pitevních nálezů v elektronické podobě, získaných z různých pracovišť soudního lékařství po celé republice. Slovník byl vytvořen tak, že bylo provedeno pročistění získaných textů, oprava chyb, rozepsání zkratek atd. Následuje frekvenční analýza, aby se do slovníku dostala nejužívanější slova a slovní spojení. Ve slovníku je nyní zhruba 200 tisíc slov.
Slovník obsahuje běžné termíny a názvy anatomické, patologické a soudnělékařské; obsahuje též základní nelékařské názvy, užívané při vnější prohlídce – oblečení, zdravotní pomůcky, cennosti atd. Objeví-li se však při diktátu nějaké slovo prvně, program jej nerozpozná a zvolí nejbližší zvukově podobné slovo. Příslušné slovo je tak nutno doplnit ručně, čímž se též dostane do uživatelského slovníku a při případných příštích užitích je již programu známo.
V současnosti jsou testovány výhody či nevýhody užití velkého slovníku v porovnání se slovníkem individuálně vytvořeným pro dané pracoviště na základě jím dodaných souborů pitevních nálezů.11
Lze konstatovat (1), že každé soudnělékařské pracoviště má svá terminologická (resp. obecně jazyková) specifika; vytvoření individuálního slovníku se tak jeví jako prospěšné. Dokládá to i naše dosavadní zkušenost: na základě individuálního menšího slovníku je míra porozumění diktovanému pitevnímu nálezu paradoxně vyšší, protože program vybírá sice mezi menším počtem slov, ale mezi slovy s vysokou frekvencí. V případě nejasné artikulace diktujícího tak vznikne podstatně menší pravděpodobnost chybného přepisu, protože program nemá „tolik na výběr“.
Uvedené není v rozporu s výskytem hapax legomenon (tj. slovo, které se vyskytne v souboru pouze jednou), které by neobsahoval ani velký slovník a které by se muselo v obojím doplnit ručně.12 Pokud jde o ruční doplňování slov, které již součástí velkého slovníku jsou, do individuálního slovníku, lze konstatovat, že práce s tím spojená je vyvážena celkovou vyšší mírou porozumění.
ZÁVĚR
Nutné přizpůsobení programu pitevnímu provozu představuje zatím největší úskalí programu: lze práci na pitevně natolik „usměrnit“, aby vzniklo prostředí, kdy bude program fungovat bezchybně a kdy nebude naopak brzdou pitevního provozu? S tím se pojí i otázka, zda by důraz na určitou neměnnou formu diktování nekladl na diktujícího lékaře příliš velké nároky, které by ho odváděly od podstaty jeho práce.
Již nyní se jeví jako vysoce pravděpodobné, že program, bude-li zaveden do praxe, bude určen především pro „běžné“ pitvy prováděné na pracovištích soudního lékařství; při komplikovaných pitvách bude zřejmě i nadále upřednostňován tradiční přepis pořizovaný dokumentátorkou.
1 Program byl vyvinut ve spolupráci s Technickou univerzitou v Liberci.
2 Výčet pracovišť, která zakoupila licenci firmy, se uvádí na propagačních materiálech firmy, viz http:/www.diktovani.cz/reference.php.
3 Už samotné lékařství je specifický obor; počítačový program NEWTON Dictate byl primárně vytvořen pro přepis textů právních. Program je v současnosti diktovací aplikace nezávislá na oboru, ve kterém se používá; k přizpůsobení dochází prostřednictvím používaného slovníku. Byly vytvořeny slovníky advokátní, parlamentní, novinářské atd., pro oblast lékařství jsou vytvořeny slovníky radiologické, mamografické, patologické, histopatologické, soudnělékařské, oftalmologické, otorinolaryngologické, chirurgické, psychiatrické, psychologické, onkologické, neurologické, gynekologicko-porodnické, ortopedické, urologické, hematologické, imunologické, pediatrické, nefrologické a slovníky všeobecného, rehabilitačního a interního lékařství.
4 Sdělení vychází z praxe Ústavu soudního lékařství Lékařské fakulty UK a Fakultní nemocnice v Hradci Králové, kde se diktují pitevní nálezy při pitvách soudních i zdravotních.
5 Otevírá se zde otázka, zda by součástí pitevní dokumentace mohl být CD disk se zvukovým záznamem, který by případně mohl sloužit jako důkazní materiál.
6 Uvedené technické údaje pocházejí z uživatelského manuálu, jsou komentovány na základě vlastního pozorování a na základě konzultací s odbornými pracovníky firmy NEWTON Technologies.
7 Použitím směrového mikrofonu, který má pouze určitý rozsah, ve kterém snímá zvuky pro přepis, jsou odladěny vzdálenější zvuky (např. klimatizace), pokud nemají vysokou intenzitu. Pro silnější zvuky se doporučuje provést speciální hlasovou adaptaci, viz níže.
8 Příklady diktování jsou uvedeny na webových stránkách firmy.
9 V programu je nadefinováno, že slovo „čárka“ se přepíše znaménkem „ ,“ atd.
10 Podrobnější informace o hlasové adaptaci viz Uživatelský manuál.
11 Firma NEWTON Technologies nabízí vytvoření takového slovníku přímo pro dané pracoviště. Technicky se nejedná o náročný proces. Každý slovník respektuje terminologii a pravidla užívaná v daném oboru.
12 Slovní zásoba v soudním lékařství užívaná především při vnější prohlídce je prakticky neohraničitelná (1).
PODĚKOVÁNÍ
Autoři děkují ing. J. Pražákovi z firmy NEWTON Technologies, a. s., za technické údaje a odborné konzultace.
Adresa pro korespondenci:
PhDr.
Pavel Nečas, Ph.D.
ÚJ
LF UK v Hradci Králové
Šimkova
870, 500 38 Hradec Králové 1
tel.:
495 816 450 begin_of_the_skype_highlighting 495 816 450 end_of_the_skype_highlighting
e-mail:
necasp@lfhk.cuni.cz
Zdroje
1. Nečas P, Hejna P. Problematika české anatomické nomenklatury v soudním lékařství. Soud Lek 2009; 45: 33–36.
Štítky
Patológia Súdne lekárstvo ToxikológiaČlánok vyšiel v časopise
Soudní lékařství
2011 Číslo 3
Najčítanejšie v tomto čísle
- Rozbor příčin náhlé srdeční smrti ve vybraném vzorku zemřelých
- Pitva při otravě četnými psychotropními léky
- Smrtelný případ těžké methemoglobinemie pravděpodobně v souvislosti s požitím chlorátu
- Pohoda I. (Smrť na hudobnom festivale)