Разработана новая технология борьбы с несанкционированными рекламными рассылками по электронной почте или, проще говоря, спамом. Как сообщает журнал New Scientist, система, получившая название Чун-Квэй (по имени талисмана в Фэн-Шуй, защищающего жилища от злых духов), основана на алгоритме Тиресия (с
арец-прорицатель в “Финикиянках” Еврипида) для анализа последовательностей дезоксирибонуклеиновой кислоты (ДНК). Этот алгоритм создавался специалистами исследовательского подразделения корпорации IBM и предназначен для поиска повторяющихся участков в цепочках ДНК и аминокислот.
Применительно к электронным сообщениям система Тиресия также анализирует последовательности, правда, состоящие из традиционных символов, которыми представлен текст письма. Ученые просканировали 65 тысяч писем, заведомо являющихся спамом, и выявили около шести миллионов фрагментов, встречающихся более чем в одном сообщении. Далее были проанализированы тысячи сообщений, не относящихся к категории электронного “мусора”. Фрагменты, обнаруженные в обеих категориях писем, впоследствии были исключены.
Таким образом, исследователи получили набор буквенно-числовых последовательностей, характерных для спамерских рассылок. В ходе последующих тестов было установлено, что фильтр на базе алгоритма Тиресия правильно идентифицировал 64665 из 66697 писем, то есть эффективность достигла 96,56 процента. Более того, лишь одно письмо из 6000 было по ошибке отнесено к спаму, то есть, вероятность ложного срабатывания составила всего 0,017 процента. Предполагается, что система Чун-Квэй будет включена в новое антиспамовое программное обеспечение IBM SpamGuru.