«Яндекс» снова раскрыл личные данные россиян в поисковой выдаче

[ Версия для печати ]
Добавить в Telegram Добавить в Twitter Добавить в Вконтакте Добавить в Одноклассники
Страницы: (4) 1 2 [3] 4   К последнему непрочитанному [ ОТВЕТИТЬ ] [ НОВАЯ ТЕМА ]
Jus
17.07.2018 - 11:17
1
Статус: Offline


Скарификатор перикарда

Регистрация: 30.05.06
Сообщений: 373112
Вышеописанные три домена ВТБ, «Сбербанка» и «Единого транспортного портала Москвы» пренебрегают элементарными требованиями защиты данных — у них даже отсутствует файл robots.txt.

Как могло произойти так, что персональные данные — «Google Таблицы», отчёты с финансовыми показателями компаний в Power Bi могли попасть в выдачу поисковых систем?

Поисковые системы не могут получать доступ и читать информацию со страниц, которые требуют авторизации.

Современные системы требуют сложные пароли, пользователям не всегда удобно запоминать столько паролей, для их удобства доступа к личным страницам создатели сайтов придумали документы с уникальным длинным адресом из случайного набора символов, который невозможно угадать или получить перебором, пример: сайт.ру/проверить-статус-моего-заказа/orjY4mGPRjk5boDnW0uvlrrd71vZw9kphf8eGbhlTpS4q9cvHzFNngSdNNIG8H5Lt3. Проверяем защиту приведенного выше URL на предмет перебора:

Если быть более точным, то 18 миллиардов триллионов триллионов триллионов триллионов триллионов триллионов триллионов триллионов лет для перебора всех возможных вариантов. Звучит надёжно.

«Яндекс» снова раскрыл личные данные россиян в поисковой выдаче
 
[^]
Jus
17.07.2018 - 11:17
1
Статус: Offline


Скарификатор перикарда

Регистрация: 30.05.06
Сообщений: 373112
Как это работает: вам на email или в SMS приходит сообщение с такой ссылкой, и вроде бы логично, что только вы можете воспользоваться ей для просмотра, корректировки своих данных.

Но есть много способов, как поисковая система может узнать о ссылке — например, вы на каком-то полуприватном затерянном на окраинах интернета форуме, где сидите только вы, и пять ваших близких знакомых поделились этой ссылкой.

Поисковые системы регулярно переобходят даже самые малопосещаемые и никому неизвестные сайты, если они доступны для индексации роботам. Такая ссылка рано или поздно проиндексируется, и страница с личной информацией попадёт в индекс. В 2011 году был скандал с попавшими в выдачу SMS «Мегафона». Тогда я даже провёл семантический анализ текстов этих SMS.

«Яндекс» снова раскрыл личные данные россиян в поисковой выдаче
 
[^]
Jus
17.07.2018 - 11:17
1
Статус: Offline


Скарификатор перикарда

Регистрация: 30.05.06
Сообщений: 373112
Мало кто хотел бы, чтобы эта информация попадала в общий доступ, то есть ссылки точно на них не расставляли. Много измен, думаю, тогда было раскрыто. Дальше я в том же 2011 году решил проверить, как хранят персональные данные другие сайты, и сразу же обнаружил множество открытых данных с заказами в интернет-магазинах. Новость тогда прогремела, и запрос для поиска попал в топ-20 самых популярных запросов дня по Liveinternet. Пользователей почему-то больше всего заинтересовали данные покупателей секс-шопов. Хотя если человек покупал в магазине лопату и из-за этого утекли его ФИО, адрес, телефон и иногда паспорта — по-моему, такой же вопиющий провал.

«Яндекс» снова раскрыл личные данные россиян в поисковой выдаче
 
[^]
Schuka
17.07.2018 - 11:18
0
Статус: Offline


Ярила

Регистрация: 8.04.14
Сообщений: 7998
Цитата (Бенгур @ 17.07.2018 - 09:00)
Так он не утечку обнаружил, а вскрыл данные, попробуй просто так в яндексе это открыть, хуй откроешь. Этож нужно знать, как и чем воспользоваться , чтоб попасть куда нужно. А это уже тема для определенных органов, правда им то пофиг почемуто.

Если до данных добрался тупой робот, то и человек доберется.
 
[^]
Jus
17.07.2018 - 11:18
0
Статус: Offline


Скарификатор перикарда

Регистрация: 30.05.06
Сообщений: 373112
Системы аналитики (счётчики, которые устанавливают на каждой странице сайта для исследования поведения посетителей на нём). Самые популярные в России — «Яндекс.Метрика» и Google Analytics.

Заходим в настройки любого счётчика «Метрики» и видим по умолчанию такие опции:

То есть все просмотренные пользователями страницы по умолчанию отправляются на индексацию, если не указать запрет

«Яндекс» снова раскрыл личные данные россиян в поисковой выдаче
 
[^]
Jus
17.07.2018 - 11:18
1
Статус: Offline


Скарификатор перикарда

Регистрация: 30.05.06
Сообщений: 373112
Но даже если установить запрет, приватные страницы всё равно попадают в индекс. Потому что это один из множества источников данных поисковых систем.

У Google есть браузер Chrome, у «Яндекса» — «Яндекс.Браузер». На них приходится более 70% всех посетителей.


Устанавливая браузеры, вы соглашаетесь с возможной обработкой, отправкой браузером анонимных данных о просмотрах и так далее. То есть это вполне легальный способ собрать большую часть когда-либо просмотренных пользователями страниц.

«Яндекс» снова раскрыл личные данные россиян в поисковой выдаче
 
[^]
Jus
17.07.2018 - 11:18
1
Статус: Offline


Скарификатор перикарда

Регистрация: 30.05.06
Сообщений: 373112
Когда вы скачиваете какую-нибудь бесплатную программу, часто с ней агрессивно навязываются программы и плагины для браузера от поисковых систем, которые многие специалисты расценивают как дополнительный канал для анализа трафика и поведения пользователей.

Помимо этого, поисковые системы могут покупать анонимизированные данные о трафике, просмотренных сайтах или страницах, как это делает известный сервис SimilarWeb.

Ваша секретная ссылка уже не выглядит такой защищённой?
Представьте ситуацию: вы купили авиабилет с вылетом через полгода, вам пришла SMS с ссылкой для просмотра и редактирования информации в личном кабинете. Вы перешли на неё в телефоне, проверили и забыли.

Тем временем ваш мобильный «Яндекс.Браузер», Android или счётчик метрики сообщил поисковику, что появилась неизвестная ранее страница, робот проверил — страница работает, проиндексировал её через какое-то время.

Потом злоумышленник вбивает в поиск запрос вроде «билет на Бали октябрь изменить бронирование» — попадает в ваш личный кабинет, переписывает фамилию на свою и через полгода улетает вместо вас. (Можно представить, что и такие сайты существуют, которые даже не предупредят об изменении и не запросят дополнительное подтверждение или авторизацию.)

Легально ли, что поисковики собирают такую информацию
Поисковый робот не знает — персональные ли данные в файле. Коммерческая ли тайна в таблицах с финансовыми показателями или, наоборот, вы хотели бы делиться этой информацией со всеми. Он переходит по страницам, доступ к которым не закрыт владельцами сайта.

Часто структура и навигация сайтов очень запутанные, используются различные хитрые JavaScript, так что попасть на полезные страницы по ссылкам с главной страницы поисковикам бывает просто невозможно. В этом случае выглядит логичным получать адреса страниц для индексации из максимального числа источников.

Кто виноват в сложившейся ситуации
Я считаю, что 80% вины лежит на владельцах сайтов, которые не обеспечивают должного качества разработки и оптимизации. Как специалист по поисковой оптимизации сайтов с 12-летним опытом могу сказать, что большинство сайтов до доработки SEO-специалистами выглядят плачевно, владельцы словно живут в параллельном мире без киберугроз, без поисковых систем, ботов, которые могут проиндексировать личные данные пользователей.

20% отдал бы поисковикам за то, что они недостаточно освещают свои механизмы ранжирования и индексации. Часто сталкиваешься с непониманием от разработчиков сайтов: «Как же поисковые системы проиндексируют страницу, ведь у них нет ссылки этой страницы?». Такие же вопросы часто слышу даже от специалистов по SEO.

Большинство современных разработчиков считает, что документ, доступный по длинной уникальной ссылке, — надёжно защищён и никогда не попадёт в индекс. Рекомендую представителям поисковых систем больше упоминать на своих профильных конференциях и вебинарах для профессионалов о том, что любая страница, доступная без авторизации, может рано или поздно попасть в индекс.

Ещё есть проблема в том, что разные поисковые системы по-разному используют директивы, их рекомендации по индексации иногда противоречат и взаимоисключаемы. То есть разработчики, сделав всё по инструкции Google, будут удивлены, когда в «Яндексе» директивы, наоборот, перестали работать, из-за чего в индекс попало множество документов, которые не должны были индексироваться.

Последний случай с индексацией персональных данных в «Google Документах»
Пароли и личные данные всегда попадали в индекс, можно было найти эти данные, просто не в таких масштабах. Я связываю последнюю утечку с ростом популярности самих сервисов Google — больше людей пользуется таблицами, теперь это не только айтишники, но и воспитатели детских садов, мамочки, составляющие план покупок. То есть это уже не только продвинутые пользователи.

Мои рекомендации для владельцев и разработчиков сайтов
Любые чувствительные данные максимально закрывать от посторонних с помощью авторизации.
Всегда запрещать роботам индексировать любую конфиденциальную информацию. Причём использовать не только один из рекомендуемых поисковой системой способов, а дублировать, используя все методы защиты, такие как robots.txt, clean-param, meta-noindex.
Проверять, чтобы методы защиты были универсальными и работали во всех поисковых системах.
Помимо этого, определять роботов по user-agent и блокировать им доступ к любой приватной информации, отдавая ответ сервера 4хх.
Обращаться к профессионалам SEO для экспертизы поисковой оптимизации сайта.
Рекомендации для поисковых систем и крупных сервисов вроде PowerBi, «Google Документов»
Чаще прислушиваться к мнению и просьбам специалистов по SEO. Например, в «Яндексе» работа некоторых директив индексации отличается от Google — из-за чего приходится делать сложные схемы обхода, например, с междоменными canonical. Из-за этого у мелких сайтов без высококлассных специалистов могут быть проблемы — закрытые страницы массово попадают в индекс, а там могут быть и частные данные.

Google же считает, что она единственная в мире поисковая система и не учитывает при разработке своих сервисов что есть такие системы, как «Яндекс» с их продвинутыми алгоритмами индексации. Из-за этого в индекс попали документы Google, доступные только по ссылке.

Если бы разработчики Google были более компетентны и учитывали работу всех поисковых роботов, они бы добавили в документы доступные по ссылке запрет индексации с помощью метатега robots noindex. А также блокировали бы доступ поисковых роботов к таким документам.

Также нужно выдавать предупреждение при открытии доступа по ссылке — что наличие ссылки только у вас не значит, что о ней никто не узнает — множество программ, браузеров, плагинов, счётчиков, скриптов собирают информацию и только из разработчикам известно, как они её хранят и куда дальше направляют.

Обновлено редакцией 14 июля. Представители «Сбербанка» сообщили vc.ru, что банк разбирается с описанной в статье ситуацией. «Уже сейчас можем сказать, что данных, которые могут нанести ущерб банку или клиентам здесь нет», — сказали они.

via
 
[^]
Jus
17.07.2018 - 11:20
1
Статус: Offline


Скарификатор перикарда

Регистрация: 30.05.06
Сообщений: 373112
В «Яндексе» и Сбербанке прокомментировали утечку личных данных клиентов

В выдачу «Яндекса» попали личные данные клиентов Сбербанка, РЖД и департамента транспорта Москвы. В банке сообщили о начале разбирательства по этому поводу

Компания «Яндекс» прокомментировала утечку данных клиентов онлайн-сервисов, произошедшую через поисковую выдачу, сообщает «Коммерсантъ FM». Ответственность за раскрытие личных данных она возложила на владельцев сайтов, где размещалась такая информация.

На возможность получить личные данные клиентов через поисковик обратил внимание SEO-специалист Павел Медведев. В своем Facebook он опубликовал скриншоты, где видно, что через «Яндекс» возможно получить данные онлайн-сервисов РЖД, Сбербанка, ВТБ, московских муниципальных служб и сервисов бронирования билетов. Среди файлов, которые можно получить через поисковик, оказались даже копии паспортов граждан.

В своей статье на vc.ru Медведев пояснил, что утечка данных связана с тем, что «вышеописанные три домена — ВТБ, Сбербанка и Единого транспортного портала Москвы пренебрегают элементарными требованиями защиты данных: у них даже отсутствует файл robots.txt (в котором создатель сайта прописывает параметры индексирования содержания для поисковых машин. — РБК)».

Как пояснили «Коммерсантъ FM» в «Яндексе», попадание документов в выдачу связано с особенностями работы поисковика. Он индексирует содержание всех страниц, если это не запрещено с помощью настроек, которые устанавливает владелец сайта или вебмастер. Таким образом, владельцы сайта могут сами заблокировать доступ к файлам.

В Сбербанке, комментируя сложившуюся ситуацию, заявили, что проводят разбирательство в связи с попаданием личных данных в выдачу поисковика. В то же время в банке отметили, что в «Яндекс» не попали данные, которые могли бы нанести ущерб самому банку или его клиентам.

via

«Яндекс» снова раскрыл личные данные россиян в поисковой выдаче
 
[^]
Gruner
17.07.2018 - 11:21
2
Статус: Offline


Ярила

Регистрация: 11.10.14
Сообщений: 6128
А представьте, какой "праздник" начнется, когда таким же образом в и-нет попадут данные самозанятых граждан, которые решат стать таковыми с 2019 года.
 
[^]
Schuka
17.07.2018 - 11:22
0
Статус: Offline


Ярила

Регистрация: 8.04.14
Сообщений: 7998
Цитата (Hank13 @ 17.07.2018 - 10:47)
Какой на хрен Яндекса раскрыл, у меня бомбит от этих новостей! Сбербанк, РЖД и Гугл сами лоханулись и разрешили Яндекса индексировать их данные! С Таким же успехом любой человек мог наткнуться на эти данные в сети раньше Яндекса! Этот как банк выкинул на общественную помойку сканы паспортов а бомж их нашел и сообщил, мы что будем обвинять бомжа в сливе наших личных данных?

Дело не в том разрешили или не разрешили индексировать. Дело в том что такие данные вообще не должны быть доступны без авторизации.
 
[^]
igafum
17.07.2018 - 11:26
0
Статус: Offline


Ярила

Регистрация: 10.08.12
Сообщений: 1611
А вы говорите плохой поисковик! ????
 
[^]
sslon72
17.07.2018 - 11:32
1
Статус: Offline


Приколист

Регистрация: 11.04.12
Сообщений: 229
 
[^]
shandib777
17.07.2018 - 11:39
0
Статус: Offline


Здравствуйте

Регистрация: 7.02.10
Сообщений: 1194
Цитата (Intensiv @ 17.07.2018 - 08:32)
Это просто звездец!! Где таких специалистов то берут интересно, а бабла наверное немеренно получает))) Какие нахрен роботсы в папках с данными карт?? Их вообще не должно быть этих папок с доступом по web

Вот именно. "Храните все ваши данные, как можно больше данных, в отечественных датацентрах, не бойтесь, защиту гарантируем."
 
[^]
hostchel
17.07.2018 - 11:41
0
Статус: Offline


Ярилище

Регистрация: 6.02.14
Сообщений: 2249
Так поисковик индексирует то, что смог найти. Вопрос даже не в том, что эти страницы и файлы открыты для индексации, а в том, как их поисковик вообще смог найти и получить доступ на чтение, если они относятся к закрытым разделам.
Хотя ответ просто: рукожопые программеры тендеры на охуллиард попилили с заказчиками
 
[^]
dbezz
17.07.2018 - 11:57
0
Статус: Offline


Ярила

Регистрация: 24.07.12
Сообщений: 5385
Цитата (Schuka @ 17.07.2018 - 11:22)
Цитата (Hank13 @ 17.07.2018 - 10:47)
Какой на хрен Яндекса раскрыл, у меня бомбит от этих новостей! Сбербанк, РЖД и Гугл сами лоханулись и разрешили Яндекса индексировать их данные! С Таким же успехом любой человек мог наткнуться на эти данные в сети раньше Яндекса! Этот как банк выкинул на общественную помойку сканы паспортов а бомж их нашел и сообщил, мы что будем обвинять бомжа в сливе наших личных данных?

Дело не в том разрешили или не разрешили индексировать. Дело в том что такие данные вообще не должны быть доступны без авторизации.

Ну и кто должен за это отвечать? За это должен отвечать тот, кто берёт подпись о согласии получить твои персональные данные. Как только они их получили они обязаны обеспечить их неразглашение. Сейчас любая сраная коммерческая точка по прокату роликовых коньков собирает данные о ФИО, ДР как минимум. Не говоря уже о банках и крупных торговых сетях, которые всю историю твоего потребления могут хранить, все твои доходы и расходы и контакты. Куда бы ты ни сунулся тебе суют анкетку с пунктом "не возражаю против сообщения моих персональных данных". А на основании того же закона они помимо этой бумажки должны принять меры к защите этих твоих данных от утечки, но мало кто это делает. Это дорого как ни странно.
 
[^]
arma35
17.07.2018 - 12:15
-2
Статус: Offline


Балагур

Регистрация: 1.08.12
Сообщений: 938
что значит яндекс сливает? поисковик взломал сбер чтоли?? ))
или у яндекса особый доступ ко всем базам всего интернета?

чтото из серии "как хреновым заголовком слить статью" )))
 
[^]
faramant66
17.07.2018 - 13:26
0
Статус: Offline


Ярила

Регистрация: 21.07.08
Сообщений: 5821
Снизить возможность такой утечки можно — для этого надо проверить все плагины вашего браузера, внимательно прочитать пользовательские соглашения и везде, где это возможно, отключить возможность сбора данных для индексации поисковиками.©

Подробнее - в посте на ФБ и в статье.

https://www.facebook.com/PabloMedvedev/post...883982941623284

https://vc.ru/41908-vtb-sberbank-oficialnyy...prodolzhayutsya

Это сообщение отредактировал faramant66 - 17.07.2018 - 13:28
 
[^]
Hkiper
17.07.2018 - 13:48
0
Статус: Offline


Ярила

Регистрация: 17.07.10
Сообщений: 1584
Да с сайта "госсуслуги" уже хрен знает сколько раз наверно данные утекли. Просто мы об этом не знаем.
 
[^]
dfone
17.07.2018 - 13:56
0
Статус: Offline


ССО

Регистрация: 24.04.14
Сообщений: 4499
Цитата (Семьянин @ 13.07.2018 - 12:29)
Цитата (par9 @ 13.07.2018 - 12:28)
у меня на друга так кредит взяли

Ну да, конечно. Твоя аватарка об этом же говорит..

Давай скан паспорта))) проверишь)))
 
[^]
BS
17.07.2018 - 14:02
0
Статус: Offline


Ярила

Регистрация: 12.12.05
Сообщений: 1437
а яндекс то тут при чем?
яндекс может ходить по ссылкам и распознавать картинки.
всё

так что, нехер на чужую рожу пенять, коль своя кривая...
 
[^]
wanu
17.07.2018 - 14:16
0
Статус: Offline


Ярила

Регистрация: 22.02.10
Сообщений: 1906
а яндекс-то при чем....
он поисковик. если есть утечка, значит на нее ссылки есть. и ответственность лежит на тех, кто сайты держит.
у нас же госсайты и информационные системы лабают известные крутые дезигнеры с нулевым пониманием ынутренних процессов, Ланит, да конторы известных сынков и дочурок. все хотят дорого. но работают херово. пока действительно разумные и опытные работяги сосут. коррупция делает свое дело.
 
[^]
hunter64
17.07.2018 - 14:38
2
Статус: Offline


Ярила

Регистрация: 19.08.11
Сообщений: 3391
Закрыл/не закрыл при помощи: "robots.txt" - это следствие.

Первопричина: Персональные Данные в открытом доступе.

152:ФЗ РФ Персональные Данные - должны быть защищены!

Поисковый робот Яндекса: индексировал Персональные Данные
- легко и свободно доступные, то есть, не защищенные данные!
А это есть грубое нарушение: 152 ФЗ РФ - сотрудниками фирм
выкладывающих персональные данные в свободный доступ!
Все вопросы к: уебадминам, гамнокодерам, и возможно
пользователям - имеющими слишком широкие права доступа.
 
[^]
ДолБилл
17.07.2018 - 14:40
0
Статус: Offline


Юморист

Регистрация: 20.11.17
Сообщений: 556
Хрен знает.Все эти онлайн платежи и прочая современная лабуда может и представляет удобство,но...оно какое-то мнимое.
+все эти блокировки и прочее...
Я уж лучше по старинке:товар-деньги,деньги-товар...по мне так надёжнее.
 
[^]
Алеандр
17.07.2018 - 14:47
2
Статус: Offline


У каждого свои погремушки

Регистрация: 10.03.10
Сообщений: 2811
Цитата (Jus @ 13.07.2018 - 12:26)
«Владельцы сайтов просто не понимают сам процесс индексирования и поэтому неправильно расставляют эти файлики robots.txt, которые должны лежать в определенных директориях. Владельцы сайтов, естественно, не могут правильно их настроить, чтобы ненужные конфиденциальные файлы не регистрировались в этих поисковых машинах», — пояснил специалист отдела технического сопровождения продуктов ESET Russia Борис Соболев.

При чем тут вообще robots? Его инструкции могут быть использованы, а могут и не использоваться, зависит от поисковой системы или бота.

Проблема не в Яндексе или ином роботе, а в тех мудаках, кто программил сайт и не убирал данные в защищенные паролями и аккаунтами зоны. Эти данные вообще никогда не должны быть доступны без авторизации, ни по прямой, ни по косой ссылке.

Идиоты, фигли.
 
[^]
timelap
17.07.2018 - 20:55
0
Статус: Offline


Ярила

Регистрация: 6.02.14
Сообщений: 2733
Интересно, а закон и штрафы о защите данных пользователей, как будет работать в данном случае, в отношении госкомпаний?

... что-то мне подсказывает, что закон писали не для таких случаев и не для этих ребят)))
 
[^]
Понравился пост? Еще больше интересного в Телеграм-канале ЯПлакалъ!
Только зарегистрированные и авторизованные пользователи могут оставлять комментарии. Авторизуйтесь, пожалуйста, или зарегистрируйтесь, если не зарегистрированы.
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей) Просмотры темы: 25044
0 Пользователей:
Страницы: (4) 1 2 [3] 4  [ ОТВЕТИТЬ ] [ НОВАЯ ТЕМА ]


 
 



Активные темы






Наверх