10 алгоритмов, которые правят миром

10 алгоритмов, которые правят миромВряд ли кто-то сегодня станет недооценивать значение алгоритмов в нашей повседневной жизни. Алгоритмы окружают нас со всех сторон, они находят нас и в отделениях банков, и на сайтах знакомств. Однако некоторые из них играют гораздо более важную роль, чем другие: всего десять алгоритмов сегодня фактически правят миром.

1. Поиск Google
Бесспорный лидер хит-парада — «великий и ужасный» поисковик Google, индексирующий всё на свете. Казалось бы, ещё совсем недавно несколько крупных поисковых систем сражались за место на рынке. Но Google со своим инновационным алгоритмом расчёта авторитетности ссылок PageRank оказался наиболее эффективным и точным поисковиком и занял доминирующую позицию. На Google приходится, по разным оценкам, чуть менее 80% поисковых запросов в мире, и он оставляет далеко позади все остальные международные поисковые системы, включая Yahoo, Baidu, Live и российский «Яндекс». Для большинства пользователей интернета сегодня именно Google выступает в роли ворот во Всемирную сеть.

Запатентованный алгоритм PageRank работает в связке с автоматическими поисковыми роботами-«пауками» и использует огромный список ключевых слов и веб-адресов. Основная идея проста: страница тем важнее и популярнее, чем больше на неё ведётся ссылок с других сайтов. На основе количества и качества гиперссылок, указывающих на ту или иную страницу, алгоритм оценивает «важность» этой страницы и самого сайта и выводит её на соответствующий уровень при выдаче результатов поиска. Но это не просто конкурс популярности: при расчёте важности используется и масса прочих параметров, в том числе частота и расположение ключевых слов на странице и длительность существования такой страницы.

2. Лента новостей Facebook
Возможно, вы удивитесь, но лента новостей Facebook стала одним из главных мест в интернете, где люди из самых разных стран готовы просиживать часами. Вы можете сознательно выбрать такую настройку, чтобы просматривать все сообщения от всех ваших друзей в хронологическом порядке. Во всех же остальных случаях ваша лента будет формироваться по собственным алгоритмам Facebook, и вы увидите в ней только то, что по этим расчётам окажется необходимым.

Критериями выбора контента для демонстрации служат несколько факторов, среди которых: число оставленных комментариев, статус «важности» автора поста, а также тип сообщения — фото, видео, обновления статуса, репост и так далее. Алгоритм выбирает и «рекомендуемые» посты от тех, кого пока нет у вас в друзьях.

3. Сайты знакомств
Сетевые сайты знакомств — один из старейших бизнесов в интернете, и не удивительно, что, по некоторым оценкам, сегодня это многомиллиардный бизнес. Такие международные сайты, как Match, eHarmony и OKCupid, ежегодно расширяют свою аудиторию на 3,5%, и, по мнению экспертов, в ближайшие пять лет эта тенденция сохранится.

Наверное, кто-то усомнится в такой эффективности, но пары, нашедшие друг друга через подобные сайты, заключают гораздо более успешные браки, чем другие. Секрет кроется в том, что специальные алгоритмы рассчитывают совместимость партнёров, исходя из множества факторов, включая работу, интересы и увлечения и массы прочих, не самых очевидных на первый взгляд деталей.

К примеру, одним из создателей бесплатного сайта знакомств OKCupid был математик из Гарвардского университета Кристиан Раддер, и на его сайте применяется строго аналитический подход, построенный на информации от пользователей. Помимо простого сравнения интересов, алгоритм взвешивает степень важности каждого вопроса для пользователя и для его потенциального партнёра, и это делает OKCupid одним из самых успешных сайтов этого типа.

4. Сбор данных, их интерпретация и шифрование в спецслужбах
За нами всё чаще наблюдают не живые люди, а алгоритмы. Благодаря Эдварду Сноудену стало общеизвестно, что Агентство национальной безопасности (АНБ) и его коллеги во всём мире занимаются постоянным наблюдением за миллионами ничего не подозревающих граждан. Ставшие достоянием общественности документы свидетельствуют о существовании множества программ наблюдения, в частности совместно эксплуатируемых «Пятью глазами» — объединением спецслужб пяти англоязычных государств: США, Великобритании, Канады, Австралии и Новой Зеландии. Электронные системы в автоматическом режиме на основе специальных алгоритмов отслеживают телефонные звонки, электронные письма, изображения с веб-камер и данные GPS.

Что характерно, в самом АНБ утверждают, что вовсе не собирают личную информацию. Согласно инструкции 1982 года, «информация считается «собираемой» только тогда, когда она получена для использования сотрудником разведывательного подразделения Министерства обороны в рамках исполнения им служебных обязанностей». «Данные, полученные электронными средствами, считаются “собираемыми” только тогда, когда они преобразованы в понятную форму».

То есть, по мнению АНБ, вы собираете книги только тогда, когда вы их читаете. Однако алгоритмы тесно связаны с людьми, и сам факт, что некие люди в любой момент могут ознакомиться с накопленными при помощи электронных средств слежения данными, свидетельствует о том, что негласная слежка за каждым может начаться когда угодно, в том числе с какой-либо даты в далёком прошлом: достаточно лишь поднять «несобранные» данные и перевести их «в понятную форму».

Наконец, стоит упомянуть и специальные криптографические алгоритмы, созданные для шифрования и защиты данных.

5. С этим товаром покупают…
Посетители интернет-магазинов, просматривая и покупая какие-то товары, непременно сталкиваются с рекламным блоком, предлагающим ознакомиться с какими-то другими продуктами, которые имеют отношение к сделанной покупке. Такие блоки часто выводятся под заголовками «С этим товаром покупают…» или «Вам может также понравиться…».

Как и любой автоматизированный процесс, эта привычная функция интернет-магазинов тоже имеет свои достоинства и недостатки. В каких-то случаях она может быть действительно полезна, но в других — совершенно излишня. Например, если вы купили в подарок ребёнку игрушку или нижнее бельё подруге, то алгоритмы персонализации и дальше будут упорно предлагать вам плюшевых мишек и женские трусики вместо, например, наручных часов, которыми вы и правда интересуетесь.

Подобные алгоритмы формируют явление, которое Илай Парайзер назвал «пузырём фильтров» (filter bubble), когда пользователи изолируются от всей информации, не соответствующей их ранее выраженным взглядам. Это может быть как культурный, политический, так и потребительский «пузырь» вроде описанного выше. Любые сайты начинают отображать только ту информацию, которая согласуется с прошлой историей сёрфинга, и никакие альтернативные взгляды пользователь уже не увидит. Результатом этого становится «информационный детерминизм», когда история браузера создаёт наше будущее. Звучит чудовищно, не правда ли?

6. Google AdWords
Google AdWords — алгоритм, аналогичный описанному в предыдущем пункте. Интернет-гигант анализирует вашу историю поиска и сёрфинга, а также содержание ваших писем в Gmail и на этой основе демонстрирует подходящую по контексту рекламу, которая должна быть вам потенциально интересна. И если, например, сети Facebook по понятным причинам с трудом удаётся монетизировать эту схему, то для Google алгоритмы AdWords — это главный источник доходов.

7. Алгоритмический трейдинг
На финансовых рынках уже давно используются специальные алгоритмы для предсказания изменения курсов, но сегодня подобные технологии стали широко применяться и на фондовых биржах: они получили название «алгоритмический трейдинг» или «высокочастотная алгоритмическая торговля». Это разновидность автоматической торговли при помощи алгоритмов-ботов, способных принимать решения за доли секунды. Для сравнения: человеку, чтобы оценить ситуацию и отреагировать на неё, требуется как минимум одна секунда.

В результате живые трейдеры всё чаще вытесняются программами, которые, впрочем, неидеальны и тоже могут совершать ошибки. Известная история — «биржевой крах» 6 мая 2010 года, когда всего за несколько минут торгов индекс Доу-Джонса упал сразу на тысячу пунктов. Окончательные причины обвала так и не были объявлены, но некоторые эксперты полагают, что всему виной алгоритмы quote stuffing, способные автоматически генерировать до 5 000 заявок в секунду, мгновенно замусоривая систему.

8. Алгоритм сжатия звука MP3
Различные алгоритмы сжатия данных играют огромную роль в современном цифровом мире. Мы хотим быстро получать информацию без излишних вложений в расширение каналов и приобретения более ёмких жёстких дисков.

К примеру, в далёком 1991 году компания Cisco Systems разработала протокол CRTP, позволяющего сжимать аудио- и видеоданные для передачи трафика по сетям в реальном времени. А в 1994 году усилиями инженеров из немецкого института Фраунгофера появился самый распространённый на сегодня формат психоакустического сжатия звука MP3, позволяющий примерно на порядок уменьшать размеры аудиофайлов при сохранении хорошего качества звучания. Именно этот кодек стал одной из движущих сил кардинальных изменений, произошедших с тех пор в музыкальной индустрии.

9. IBM CRUSH
Этот алгоритм пока ещё не управляет миром, но, очевидно, ждать осталось совсем недолго. Всё больше полицейских подразделений в США, Канаде и некоторых других странах используют тестирующуюся уже около четырёх лет систему Criminal Reduction Utilising Statistical History (CRUSH), предназначенную для прогнозирования времени и места возможного совершения преступлений в будущем. Этот программный комплект фактически копирует идею, обыгранную в известном научно-фантастическом фильме «Особое мнение» («Minority Report»).

Ещё в 2010 году департамент полиции Мемфиса начал использовать систему CRUSH, которая позволила сократить число серьёзных преступлений на 30%, в том числе снизить на 15% количество насильственных преступлений по сравнению с 2006 годом. Проект привлёк внимание других городов и даже стран: интерес к CRUSH проявили в Польше, Израиле и Великобритании. В настоящее время пилотные проекты CRUSH запущены в Лос-Анджелесе, Санта-Крузе и Чарльстоне.

Система CRUSH работает на основе принципа «больших данных», анализируя огромные массивы накопленных за несколько лет данных о различных преступлениях с использованием специализированных алгоритмов. Всё это позволяет с достаточно высокой вероятностью прогнозировать возможность совершения конкретных преступлений в определённых районах в определённое время суток и эффективно их предотвращать. В будущем такие системы получат возможность отслеживать перемещение известных преступников в реальном времени, в том числе и с помощью беспилотников, получать данные GPS и распознавать биосигнатуры, анализировать сообщения в интернете и «просеивать» потоки данных во всех прочих средствах связи.

10. Автотюн
Закончим наш обзор шуткой, в которой, как обычно, есть доля шутки. Технология автотюн, разработанная в своё время компанией Antares для компьютерной обработки голосов и одноголосных (монофонических) инструментов, завоёвывает всё бόльшую популярность у певцов и музыкантов по всему миру. Её смысл заключает в «подтягивании» фальшиво звучащего звука до ближайшего к нему полутона, в зависимости от заданных параметров (мажор/минор, жёсткая, мягкая и незаметная обработка и т. п.).

Первой популярной песней, в которой использовался автотюн, считается «Believe» американской певицы Cher, и здесь этот эффект умышленно сделан нарочито жёстким.

Не стоит путать автотюн с вокодером, который предназначен для кодирования и декодирования голоса и который может быть, в том числе, и аналоговым. Автотюн имеет дело только с цифровым сигналом, способен работать в реальном времени и умеет даже изменять длительность ноты, не отвечающей нужным параметрам тона. Впрочем, если человеку наступил на ухо медведь, то ему не поможет даже жёсткий автотюн.