Читать «Беседы о бионике» онлайн - страница 283

Изот Борисович Литинецкий

Не так давно на Брюссельской автомобильной выставке демонстрировался автомобиль фирмы "Крейслер", управляемый посредством устных распоряжений. Стартер запускал мотор, повинуясь словесному приказу водителя. Устное распоряжение заставляло машину включать и выключать сцепление, переключать скорости. Даже повороты водитель совершал, не прикасаясь к рулю (его вовсе не было на машине!), а лишь произнося условные сигналы. Объемистый багажник автомобиля был весь заполнен электронной аппаратурой, среди которой первое место занимало счетно-решающее устройство и "рецепторы", воспринимающие акустические сигналы.

При разработке различных устройств, управляемых голосом, не остались забытыми и устройства для космонавтов. Так как у космонавта, вышедшего в космос из кабины своего корабля, "не хватает рук" для управления индивидуальным ракетным двигателем — он будет занят выполнением различных операций (работа с инструментами, кино- и фотокамерами и т. п.), — американские инженеры разрабатывают электронное устройство, с помощью которого это управление будет осуществляться командами, подаваемыми голосом космонавта. Для этого, как полагают конструкторы, будет достаточно 10 команд.

В Институте кибернетики Академии наук УССР, в лаборатории, руководимой В. А. Ковалевским, создана машина, "запомнившая" два десятка слов. Она узнает их почти безошибочно, независимо от того, кто их произносит. Если учесть, что из двух десятков слов можно составить не одну сотню разнообразных сочетаний, то выходит, что уже сегодня машина в состоянии воспринимать несколько сот различных голосовых команд. Спору нет, этого слишком мало, чтобы вести с машиной свободную беседу, но достаточно для того, например, чтобы она могла мгновенно "понять" команду о выходе из какой-либо аварийной ситуации.

Из всего приведенного выше следует, что разработка устройств, управляемых голосом человека, идет в определенном направлении. Однако до сих пор еще не созданы устройства для ввода любого речевого сообщения в вычислительные машины. Пока ведутся только научные поиски, эксперименты, ведь совершенно ясно, что поставленная задача много сложнее проблемы опознавания зрительных образов. Преодолеть языковую пропасть между человеком и машиной одним прыжком очень трудно.

Речь состоит из слогов, слов, фраз и т. д. Наименьшим элементом речи является звук (фонема). С физической точки зрения звуки речи различаются и частотным составом, и интенсивностью, и продолжительностью. В речи нет четких границ между звуками. Так же как рукописные буквы соединяются друг с другом промежуточными элементами, звуки речи в словах стыкуются с помощью "переходов" — звуков, которые возникают при перестройке нашего голосового аппарата для произнесения очередного звука. У разных людей форманты даже одних и тех же гласных звуков несколько разнятся по своей частоте и интенсивности (в детском и женском голосе все форманты несколько выше, чем в мужском). Кроме того, даже у одного и того же человека форманты одного и того же звука заметно различаются в зависимости от того, в каком слове произносится звук, ударный он или безударный, высок он или низок. Важной характеристикой звуков являются также число и частота обертонов. Индивидуальные особенности характеристик формант, а также присутствие в голосе еще и других специфических для каждого человека обертонов придают голосу человека неповторимый, присущий только ему одному тембр. Все это многообразие особенностей речевого сигнала заставляет ученых идти различными путями в поисках оптимального решения задачи распознавания речи.