Глобальная утечка исходных кодов Яндекс. Что известно?

25 января 2023 года в сети появились исходные коды сервисов Яндекс. Утечка глобальная. Когда именно произошла утечка и каким образом — покажет расследование. Есть версия, что это человеческий фактор (кто-то слил намеренно). Но это лишь версия.

Слитые данные представляют из себя архивы (.tar.bz2), по названиям которых можно идентифицировать соответствующие сервисы Яндекса. Общий объём архивов (в сжатом виде) составляет более 44.7 ГБ.

Глобальная утечка исходных кодов Яндекс. Что известно?

В своем блоге Яндекс раскрыл первые результаты расследования. В нем сказано, что опубликованные фрагменты действительно взяты из внутреннего репозитория компании. Также Яндекс признал, что в ходе аудита были выявлены несколько случаев серьёзного нарушения Принципов Яндекса и Правил корпоративной этики:

  • В коде содержались контактные данные некоторых партнёров. Например, водителей — в некоторых случаях их контакты и номера водительских удостоверений передавались из одного таксопарка в другой.
  • Зафиксированы случаи, когда логику работы сервисов корректировали не алгоритмическим способом, а «костылями» (на языке разработчиков так называется временное решение, реализованное неоптимально и впопыхах). Через такие «костыли» исправляли отдельные ошибки системы рекомендаций, которая отвечает за дополнительные элементы поисковой выдачи, и регулировали настройки поиска по картинкам и видео.
  • В сервисе Яндекс Лавка существовала возможность ручной настройки рекомендаций любых товаров без пометки об их рекламном характере.
  • Наличие приоритетной поддержки для отдельных групп пользователей в сервисах Такси и Еда.
  • Некоторые части кода содержали слова, которые никак не влияли на работу сервисов, но были сами по себе оскорбительны для людей разных рас и национальностей.

Наша работа строится на принципах честности и прозрачности. Мы исходим из того, что любой внутренний диалог, документ или исходный код при определённых обстоятельствах может стать публичным. И если это случится, нам не должно быть стыдно. Сейчас нам очень стыдно, и мы приносим извинения нашим пользователям и партнёрам. Считаем необходимым рассказать, почему такое происходило и что в связи с этим мы намерены предпринимать — Яндекс

Список папок, которые утекли

aapi

admins

ads

alice

analytics

antiadblock

antirobot

autocheck

balancer

billing

bindings

captcha

cdn

certs

ci

classifieds

client_analytics

client_method

cloud

commerce

config

connect

crm

crypta

customer_service

datacloud

delivery

direct

disk

docs

drive

extsearch

frontend

fuzzing

gencfg

groups

helpdesk

infra

intranet

investors

it-office

jupytercloud

kernel

library

load

mail

maps

maps_2

maps_adv

market

metrika

mobile-WARNING-notfull

nginx

noc

partner

passport

pay

payplatform

paysys

portal

privacy_office

products

robot

rt-research

saas

sandbox

search

security

skynet

smart_devices

smarttv

solomon

stocks

switch

tasklet

taxi

tools

travel

wmconsole

yandex360

yandex_io

yaphone

yawe

Список утекших сервисов:

— Search Engine and Indexing Bot
— Maps — Like Google Maps and Street View
— Alice — AI assistant like Siri / Alexa
— Taxi — Uber-like taxi service
— Direct — Ads service like Google Ads / Adwords
— Mail — Mail service like GMail
— Disk — File storage service like Google drive
— Market — Marketplace like Amazon
— Travel — Like a Booking.com plus Airplane, Train and Bus tickets
— Yandex360 — Like Google Workspaces for services on your own domain
— Cloud — Probably not all infrastructure code was leaked.
— Pay — Payment processing like Stripe, but with limited set of features
— Metrika — Like Google Analytics

Хотя Яндекс и говорит, что опубликованные фрагменты не несут какой-либо угрозы для безопасности пользователей или работоспособности сервисов — нужно понимать, что это далеко не так. Имея такое количество информации, исходных кодов внутренних сервисов Яндекса — можно многое натворить.

Кстати, огромное количество программистов, хакеров и энтузиастов активно изучают слитые архивы. Причем, это делают не только наши граждане. Слухи об этой утечки разошлись по всему миру. Так, например, SEO специалисты уже сделали выводы о том, как на самом деле работают алгоритмы поисковика Яндекс и как именно нужно продвигать свои сайты, чтобы выйти в ТОП. И это только начало. Это то, что на поверхности.

P.S. Ходят слухи, что в архивах также есть диалоги, которые происходят между вами и вашей умной колонкой Яндекс (с Алисой). Живите теперь с этим!

Dzhamil - блог