Два миллиона опознанных голосов

Дмитрий Крылов

Обновлено 24 Январь, 2013 22:58

В ближайшем будущем кто-то где-то всегда будет возможность определить вас по голосу, где бы вы ни находились и куда бы ни звонили

Некоторые изменения в обществе происходят практически незаметно. Узкий круг специалистов, отслеживающих ту или иную технологическую сферу, обсуждает, как меняется социальный ландшафт вслед за распространением информационных технологий. Но это обсуждение редко выходит за профессиональные рамки. В сегодняшней Техносреде речь пойдет об одной из информационных технологий, которая способна в корне изменить то, что происходит с нашими разговорами в публичных местах и по средствам связи.

Излюбленный сюжетный ход приключенческих фильмов и романов, анонимный звонок, вскоре может стать архаикой. Солженицинский герой из «Круга первого» сегодня смог бы остаться неизвестным только первые пять секунд звонка в американское посольство. Разработанная петербуржской компанией «Центр речевых технологий» система позволяет за это короткое время, всего за пять секунд, определить по голосу личность говорящего из десяти тысяч кандидатов. В среднем же системе VoiceGrid Nation требуется десять секунд, чтобы сопоставить голос с одним из образцов в базе данных. Точность определения не хуже 90%.

Клиентами компании, закупившими эту или подобные ей системы определения личности по голосу, выступают государственные учреждения и другие компании в более чем 70-ти странах мира, включая Северную и Южную Америки, Европу и Азию. В США компания известна под названием SpeechPro, и ее системы пользуются популярностью у неразглашаемых государственных организаций. Известно, что VoiceGrid широко используется правоохранительными органами в Мексике. Ее биометрическая база данных способна хранить до двух миллионов образцов голоса. Предлагаемое использование подразумевает сбор образцов по спискам подозрительных лиц и последующий поиск по этой базе в случае, если разговор по телефону, через систему обмена голосовыми сообщениями в интернете или публичном месте вызвал интерес правоохранительных органов. Это не единственное использование системы: ее так же покупают компании для идентификации клиентов по телефону.

Информации об алгоритмах, позволяющих системе VoiceGrid проводить быстрый и точный поиск по огромным базам данных, в свободном доступе нет, что и понятно: на этом рынке довольно острая конкуренция. Питерской компании удалось получить контракты американского государства, несмотря на работу в этой же области американских компаний и на хорошо финансируемые государственные программы. В «Центре речевых технологий» работает около 170-ти сотрудников, в т.ч. 17 докторов наук. Компания поддерживает филиалы в Москве и Германии. Помимо VoiceGrid она продает лабораторный комплекс для криминалистов, позволяющей очищать прослушиваемы голоса от шума и определять по ним личность, а также несколько продуктов по очищению от шума и записи звука.

Размещение системы VoiceGrid сейчас обходится от десятков тысяч долларов до миллионов. Можно предположить, что технологии, основанные на голосовой биометрии будут удешевляться по мере того, как сфера их применения будет затрагивать все более мелких заказчиков. Нетрудно представить, что подобные технологии могут рано или поздно появиться в проектах с открытым кодом. В этом случае ключевым ресурсом станут крупные базы данных, сопоставляющие голоса с определенной личностью. Ограничение в два миллона образцов в текущей версии VoiceGrid не представляется абсолютным. Скорее всего, расширение базы данных вопрос лишь компьютерных мощностей, скорости поиска и оптимизации алгоритмов. Кстати, в материалах ЦРТ не уточняется, как именно их клиенты собирают образцы голосов. В этом свете уведомление на автоответчиках крупных компаний о том, что разговор может быть записан получает новое и неожиданное возможное толкование. Кроме того, компании VoIP и мобильной связи пропускают через свои сети голоса практически всего населения земного шара, и понятно, что они потенциально обладают ресурсами для создания подобных всеобъемлющих баз данных. В условиях правового вакуума, в которых сейчас находятся личные данные практически во всех странах, это может означать только одно: в ближайшем будущем кто-то где-то всегда будет возможность определить вас по голосу, где бы вы ни находились и куда бы ни звонили.

Два миллиона опознанных голосов

This item is part of

Читайте также

Бозон Хиггса, частицы антиматерии и Денисовский человек – научные прорывы года

Линки доступности

Социальные сети

Два миллиона опознанных голосов

This item is part of

Читайте также

Бозон Хиггса, частицы антиматерии и Денисовский человек – научные прорывы года