Читать «Журнал «Компьютерра» № 30 от 21 августа 2007 года» онлайн - страница 66
Компьютерра
Подобные базы обладают и независимой ценностью (например, для исследователей языка) – но, к сожалению, свободной информации такого рода пока не очень много: существующие свободные системы распознавания обычно используют уже готовые модели, "звуковые исходники" которых закрыты. Впрочем, озвучка текста не требует особой квалификации и специальных знаний, так что здесь поговорка "с миру по нитке" вполне применима как руководство к действию. Реализацией этого подхода занимается проект VoxForge.org: всем желающим предлагается озвучить произвольный текст и загрузить его в систему в виде файла (или, например, наговорить по телефону). Получающиеся в результате этой деятельности базы будут выпускаться под GPL и использоваться в различных свободных программах.
Еще одна разработка, о которой шла речь на конференции, – свободный синтезатор eSpeak, также недавно заговоривший по-русски и имеющий определенные преимущества перед (в основном, исследовательским) проектом Festival. Впрочем, его качество звука пока отстает от последнего, и здесь предстоит провести немалую работу.
Наконец, не обошлось и без обсуждения систем распознавания текстов (OCR).
Нельзя сказать, чтобы свободными OCR никто не занимался – напротив, список таких проектов довольно внушителен – но, к сожалению, почти все они были заброшены своими создателями на самых ранних стадиях разработки и так и не добрались до практической применимости. Павел Семин, представлявший на конференции свою библиотеку libocr, связывает это с высокой «наукоемкостью» задачи – получение приемлемого результата требует вложения кучи сил и времени. Сам Павел занимается разработкой libocr для своей диссертации – и хочется верить, что после защиты этот проект не постигнет участь многих других, что возможно, только если он станет точкой приложения усилий специалистов по OCR со всего мира (в одиночку такая задача не решается). Впрочем, следует отметить, что в данный момент Google серьезно заинтересовался свободными OCR-системами (проекты Tesseract и Ocropus), что может привести если не к прорыву на этом фронте, то, по крайней мере, к значительному прогрессу. Правда, про поддержку русского языка и кириллицы в них пока ничего не известно – но участие в Ocropus как минимум одного российского разработчика (Илья Межиров) вселяет некоторый оптимизм.
КАРТЫ В РУКИ
Вспоминая темы, обсуждавшиеся на конференции, – как вошедшие, так и не вошедшие в этот краткий обзор, – не могу не отметить общую мысль, пронизывавшую атмосферу конференции: работая вместе в рамках открытых проектов, мы можем сделать вещи, недоступные ни отдельным разработчикам, ни крупнейшим корпорациям. И именно взаимодействие свободных людей составляет жизнь того, что называется громким словом "сообщество".
СОФТЕРРА: Софтерринки