Словоискатель - сервис поиска слов в аудиозаписях.


Производитель: Сарапульские системы
Код: 000

Цена: 0.00

Отзывов: 0
Отзывов: 0

Назначение 
Система позволяет сократить время на поиск нужной информации, содержащейся в аудиозаписях. 

Особенности:

  • шумоустойчивость;
  • дикторонезависимость;
  • лингвистические алгоритмы, учитывающие особенности русского языка: фонетика, морфология, правила произношения, вариативность;
  • возможность точной настройки параметров системы для работы с избранным списком слов;
  • открытый пользовательский словарь.

Пример работы 
Оператор создает поисковый запрос, выбирая интересующие его слова и определяя период, во время которого были записаны разговоры. После обработки запроса оператор просматривает результат поиска, прослушивает найденные в аудиозаписях звуковые фрагменты со словами и сохраняет заинтересовавшие его результаты.

slovoiskatel-princip.png
Рисунок 1. Общий принцип работы Словоискателя

Система выдает пользователю список найденных фрагментов, среди которых есть как верно обнаруженные ключевые слова, так и ложные срабатывания. Оператору предстоит работа по отделению ложных срабатываний. На это будет уходить примерно 1,5 секунды на одно срабатывание. Таким образом, даже при одновременном поиске 10 слов система в несколько раз эффективнее сплошной отслушки. 

Показатели качества 
Качество поиска ключевых слов и фраз Словоискателем зависит от характеристик записанного звука, длины искомого ключевого слова (или фразы) и фонетического состава слова. Ниже приводятся статистические данные, полученные на реальных записях пользователей систем SpRecord. 
1. Для половины проверенных слов процент обнаружений составляет не менее 60%, а уровень ложных срабатываний не превышает 30 штук в час. 
2. Для 90% проверенных слов можно достичь не менее 70% обнаружения за счет настройки в программе "уровня доверия" (конфиденса). 
Чтобы подобрать оптимальное значение конфиденса обычно достаточно 20 случаев произнесения искомого слова в записях. После коррекции конфиденса в некоторых случаях количество ложных срабатываний может превысить 30 штук в час. 

Использование технологии 
Обратитесь к нам, если вы заинтересованы в использовании технологии Словоискатель. Проект реализуется индивидуально под заказчика. Возможна точная настройка поиска слов, обеспечивая высокое качество обнаружения.

Бесплатная версия Словоискателя 
Скачать руководство пользователя (PDF, 1,1 МБ.)

Написать отзыв

Внимание: HTML не поддерживается! Используйте обычный текст.

Плохо            Хорошо