25 января 2023 года в сети появились исходные коды сервисов Яндекс. Утечка глобальная. Когда именно произошла утечка и каким образом — покажет расследование. Есть версия, что это человеческий фактор (кто-то слил намеренно). Но это лишь версия.
Слитые данные представляют из себя архивы (.tar.bz2), по названиям которых можно идентифицировать соответствующие сервисы Яндекса. Общий объём архивов (в сжатом виде) составляет более 44.7 ГБ.
В своем блоге Яндекс раскрыл первые результаты расследования. В нем сказано, что опубликованные фрагменты действительно взяты из внутреннего репозитория компании. Также Яндекс признал, что в ходе аудита были выявлены несколько случаев серьёзного нарушения Принципов Яндекса и Правил корпоративной этики:
- В коде содержались контактные данные некоторых партнёров. Например, водителей — в некоторых случаях их контакты и номера водительских удостоверений передавались из одного таксопарка в другой.
- Зафиксированы случаи, когда логику работы сервисов корректировали не алгоритмическим способом, а «костылями» (на языке разработчиков так называется временное решение, реализованное неоптимально и впопыхах). Через такие «костыли» исправляли отдельные ошибки системы рекомендаций, которая отвечает за дополнительные элементы поисковой выдачи, и регулировали настройки поиска по картинкам и видео.
- В сервисе Яндекс Лавка существовала возможность ручной настройки рекомендаций любых товаров без пометки об их рекламном характере.
- Наличие приоритетной поддержки для отдельных групп пользователей в сервисах Такси и Еда.
- Некоторые части кода содержали слова, которые никак не влияли на работу сервисов, но были сами по себе оскорбительны для людей разных рас и национальностей.
Наша работа строится на принципах честности и прозрачности. Мы исходим из того, что любой внутренний диалог, документ или исходный код при определённых обстоятельствах может стать публичным. И если это случится, нам не должно быть стыдно. Сейчас нам очень стыдно, и мы приносим извинения нашим пользователям и партнёрам. Считаем необходимым рассказать, почему такое происходило и что в связи с этим мы намерены предпринимать — Яндекс
aapi
admins
ads
alice
analytics
antiadblock
antirobot
autocheck
balancer
billing
bindings
captcha
cdn
certs
ci
classifieds
client_analytics
client_method
cloud
commerce
config
connect
crm
crypta
customer_service
datacloud
delivery
direct
disk
docs
drive
extsearch
frontend
fuzzing
gencfg
groups
helpdesk
infra
intranet
investors
it-office
jupytercloud
kernel
library
load
maps
maps_2
maps_adv
market
metrika
mobile-WARNING-notfull
nginx
noc
partner
passport
pay
payplatform
paysys
portal
privacy_office
products
robot
rt-research
saas
sandbox
search
security
skynet
smart_devices
smarttv
solomon
stocks
switch
tasklet
taxi
tools
travel
wmconsole
yandex360
yandex_io
yaphone
yawe
Список утекших сервисов:
— Search Engine and Indexing Bot
— Maps — Like Google Maps and Street View
— Alice — AI assistant like Siri / Alexa
— Taxi — Uber-like taxi service
— Direct — Ads service like Google Ads / Adwords
— Mail — Mail service like GMail
— Disk — File storage service like Google drive
— Market — Marketplace like Amazon
— Travel — Like a Booking.com plus Airplane, Train and Bus tickets
— Yandex360 — Like Google Workspaces for services on your own domain
— Cloud — Probably not all infrastructure code was leaked.
— Pay — Payment processing like Stripe, but with limited set of features
— Metrika — Like Google Analytics
Хотя Яндекс и говорит, что опубликованные фрагменты не несут какой-либо угрозы для безопасности пользователей или работоспособности сервисов — нужно понимать, что это далеко не так. Имея такое количество информации, исходных кодов внутренних сервисов Яндекса — можно многое натворить.
Кстати, огромное количество программистов, хакеров и энтузиастов активно изучают слитые архивы. Причем, это делают не только наши граждане. Слухи об этой утечки разошлись по всему миру. Так, например, SEO специалисты уже сделали выводы о том, как на самом деле работают алгоритмы поисковика Яндекс и как именно нужно продвигать свои сайты, чтобы выйти в ТОП. И это только начало. Это то, что на поверхности.
P.S. Ходят слухи, что в архивах также есть диалоги, которые происходят между вами и вашей умной колонкой Яндекс (с Алисой). Живите теперь с этим!