Читать «Беседы о бионике» онлайн - страница 290

Изот Борисович Литинецкий

Говорят, этот разговор состоялся в Университете в Торонто между канадским ученым Берклеем и электронной вычислительной машиной. В ее "память" ввели триста английских слов и научили поддерживать несложную беседу.

За достоверность приведенного диалога мы не ручаемся. Но если бы вы, читатель, лет пять назад заглянули в одну из комнат Института электроники, автоматики и телемеханики Академии наук Грузинской ССР, то вы бы увидели оригинальную экспериментальную машину, которую ученые назвали "синтезатором человеческой речи". Машина сама формировала отдельные звуки речи — фонемы — и, строго придерживаясь законов фонетики, составляла из них отдельные слова и даже целые фразы. И несмотря на младенческий возраст, она научилась говорить разными голосами — мужским, женским, детским. Она одинаково легко и внятно произносила одно слово "мама" и целую фразу на грузинском языке, которая в переводе означала: "Будь внимательна, дорогая Нона!" Этими словами машина напутствовала молодую грузинскую шахматистку Нону Гаприндашвили, когда та собиралась на международный турнир. Экспериментаторы научили машину четко произносить также несколько фраз на русском языке, например: "Наша машина училась, она узнала жизнь". Хоть все эти фразы были заложены в память машины в виде шутки, но за достоверность того, что она их внятно и четко произносила, мы ручаемся.

Аналогичные устройства, но со значительно большим словарным запасом разрабатываются сейчас в США и ряде других стран с использованием методов синтеза речи из слоговых и из фонемных сегментов. Оба метода пока конкурируют друг с другом. Для передачи фонемных сегментов служит созданное для применения в технике дальней связи устройство "Вокодер", в котором место микрофона занимает "пишущая машинка" для подачи электрических импульсов. Специально обученная машинистка нажимает на клавиши, соответствующие определенным фонетическим знакам. Скорость "печатания" должна быть равна скорости речи. Получается своеобразный "разговор руками". Для передачи слоговых сегментов применяют специальную перфорированную ленту с кодированными номерами сегментов. Эта лента подготавливается на буквопечатающем аппарате со слоговым анализатором, группирующим буквы в слоги и выдающим соответствующий номер сегмента. На приемном конце по сигналам, приходящим из памяти, выдаются в усилитель соответствующие сегменты, и синхронизатор объединяет их в слова. Качество речи пока получается недостаточно высоким из-за стыковых явлений.

Рис. 8. Видиограмма записи гласных у, о, а, э, ы, и (по А. Митронович-Моджеевской). Видны отдельные верхние тона