Читать «Последнее изобретение человечества» онлайн - страница 140

Джеймс Баррат

Грейнджер и другие нейробиологи выяснили также, что цепями мозга управляют всего несколько типов алгоритмов. Одни и те же базовые вычислительные системы используются вновь и вновь в различных сенсорных и когнитивных операциях, таких как слуховое восприятие и дедуктивные рассуждения. Не исключено, что, как только эти операции удастся воспроизвести в компьютерах программно и аппаратно, можно будет простым их дублированием создавать модули для моделирования различных частей мозга. А воссоздание алгоритмов, скажем, слухового восприятия должно помочь в усовершенствовании приложений распознавания устной речи. Более того, это уже произошло.

Курцвейл был одним из первых новаторов, применивших знания о мозге в программировании. Как мы уже говорили, он утверждал, что обратное проектирование мозга — самый перспективный путь к созданию УЧИ. В очерке, отстаивавшем эту точку зрения и его предсказания по поводу этапов и вех технического развития, он писал:

Говоря в целом, мы ищем в биологии методы, способные ускорить разработку ИИ, которые в основном ведутся без сколько-нибудь полного представления о том, как аналогичные функции реализует мозг. Из своего собственного опыта в области распознавания речи я знаю, что наша работа сильно ускорилась, когда мы получили достоверные сведения о том, как мозг готовит и обрабатывает слуховую информацию.

Еще в 1990-е гг. фирма Курцвейла делала первые шаги в распознавании речи и разрабатывала приложения, которые позволили бы врачам диктовать медицинские отчеты. Курцвейл продал свою компанию, и на ее, в частности, основе возникла компания Nuance Communications. Всякий раз, прибегая к помощи Siri, вы пользуетесь алгоритмами Nuance, задействованными в речевой части этого волшебства. Распознавание речи — искусство перевода произнесенного слова в текстовую форму (не путать с обработкой естественного языка, цель которой — извлечение смысла из написанных слов). После того, как Siri переведет ваш запрос в текстовый вид, в дело вступают три остальных ее главных таланта: обработка естественного языка, поиск в громадной базе данных и взаимодействие с поисковыми серверами Интернета, такими как OpenTable, Movietickets и Wolfram | Alpha.

Watson — что-то вроде Siri на стероидах и безусловный чемпион по обработке естественного языка. В феврале 2011 г. эта программа, применив построенные по образцу мозга системы, одержала убедительную победу над соперниками-людьми в «Своей игре». Как и шахматный чемпион Deep Blue, для IBM Watson — это способ продемонстрировать свои вычислительные ноу-хау при одновременном продвижении дела ИИ. Известная игра представляла для программы серьезный вызов, ведь в вопросах часто задействованы ассоциации и игра слов. Участники должны понимать каламбуры, сравнения и культурный контекст, а ответы необходимо формулировать в том же стиле, что и вопросы. Однако распознавание речи не является специализацией Watson. Он не способен понимать устную речь. А поскольку он не видит и не чувствует, он не может и читать, так что в ходе игры вопросы приходится вводить вручную. К тому же Watson не слышит, так что аудио- и видеоподсказки исключались.