Программное обеспечение для анализа онлайн-дискуссий


Сотрудник университета University of Southern California Эдуард Хови (Eduard Hovy) и его коллеги разработали компьютерную программу, которая может следить за ходом беседы, проводимой в чат-комнате, выделять ее ключевых участников и составлять краткий конспект дискуссии.

В процессе разработки авторы проанализировали тысячи чат-сообщений и электронных писем. На первом этапе ученые группировали сообщения вручную, отделяя запросы на получение информации и ответы на эти запросы от обычной болтовни ни о чем. После этого ученые использовали базу данных лексических оборотов для обнаружения сходства между ключевыми сообщениями и установления взаимосвязей между ними. Другая аналитическая методика помогла оценить степень полезности той или иной фразы.

Для интеграции применяемых аналитических механизмов разработчики использовали модифицированный алгоритм Hypertext Induced Topic Selection (HITS), который обычно используется для оценки соответствия обнаруженных web-страниц введенному запросу. В указанном случае алгоритм выполнял несколько иную функцию, помогая вычленить наиболее важные сообщения в непрерывном потоке информации.

Разработка была впервые представлена на суд общественности на ежегодной конференции Human Language Technology Conference 2006, которая проходила в Нью-Йорке в мае этого года, сообщает http://www.newscientisttech.com.

http://soft.mail.ru