І до чого тут Temu та уйгури
683перегляди Євгенія Підгайна, 28 січня 2025, 19:00 Поділитися
Фото: depositphotos.com
Нещодавно світ сколихнула приголомшлива історія зльоту DeepSeek. «Широко відомий у вузьких колах» китайський стартап лише за рік розробляє та випускає на ринок ШІ-модель DeepSeek-R1, яка начебто перевершує провідні американські розробки. Зовсім (не)випадково DeepSeek публікує реліз як раз під час заяв Дональда Трампа про $500 млрд інвестицій у Stargate. Також зовсім (не)випадково в мережі з’являється дослідження про те, що DeepSeek витратив на навчання моделі в сотні разів менші кошти, ніж OpenAI, Meta, Google тощо. А цей факт уже дійсно невипадково обвалює акції виробників чипів: лише Nvidia за один день втратила $600 млрд капіталізації. Наразі експерти шукають розгадки феномену «мінімальних витрат» у технологічній площині, перевіряють достовірність дослідження та можливість обходу санкцій США щодо постачання чипів до Китаю.
Тим часом Mind спробував перевірити, що заховано «під обшивкою» у DeepSeek. Молодий стартап, який начебто не мріє про окупність, знову ж таки (не)випадково надав безоплатний доступ до свого ШІ-бота в застосунку та десктоп-версії. За останній тиждень лише застосунок скачано понад 1,6 млн разів. У США він обігнав свого конкурента ChatGPT і зайняв перший рядок за кількістю завантажень серед безкоштовних програм у магазині App Store Apple, а в Україні стрімко злетів на друге місце.
Які дані користувачів збирає DeepSeek та кому їх може передавати? «Найголовніший ризик мобільного застосунку DeepSeek – це те, що ваші дані, включаючи листування та файли, з якими ви працюєте, фактично стають доступними для китайського уряду, який, м’яко кажучи, не є союзником чи партнером України в повномасштабній війні проти росії. Це особливо небезпечно для державних службовців і військових», – вважає консультант із використання генеративного ШІ Олексій Мінаков.
Його думку частково підтверджує сам DeepSeek. У політиці конфіденційності компанія розповідає, що сервіс надається та контролюється компаніями Hangzhou DeepSeek Artificial Intelligence Co і Beijing DeepSeek Artificial Intelligence Co., зареєстрованими в Китаї. Ці компанії мають дотримуватися законодавства КНР, зокрема передавати дані користувачів до КПК. «Ми можемо отримувати доступ, зберігати та ділитися інформацією з правоохоронними органами, державними органами…, партнерами-рекламодавцями», – йдеться в описі.
При цьому DeepSeek збирає величезний обсяг даних начебто для ефективної роботи сервісу. «Ми збираємо вашу інформацію трьома способами: інформацією, яку ви надаєте; автоматично зібрану інформацією та інформацією з інших джерел», – пояснюють у DeepSeek.
Тобто станом на тепер – лише за тиждень зі старту сервісу – мінімум 1,6 млн мешканців США, Канади, Великої Британії, України тощо добровільно та безоплатно надали доступ до своїх ІР-адрес, поштових скриньок, номерів телефонів тощо Компартії Китаю. Також користувачі добровільно та безоплатно дозволили рекламодавцям – партнерам DeepSeek – закидувати себе рекламою.
«DeepSeek – це чудовий інструмент для збору розвідданих», – попереджає керівник Центру протидії дезінформації при РНБО України Андрій Коваленко. Та пояснює: будь-який штучний інтелект вивчає користувача і збирає всю інформацію про його переживання, інтереси, сім’ю, фінанси та практично все інше. Люди добровільно ставлять запитання й отримують відповіді, тоді як ШІ зберігає цю інформацію. «Потім можна отримувати моделі поведінки цілих суспільств і далі продумувати інструменти впливу. Справжнє питання в тому, хто володіє цим ШІ і яка його кінцева мета», – наголошує експерт.
Чи надає DeepSeek об’єктивні відповіді без домішок китайської пропаганди? Багато користувачів з України вже скаржаться, що цей ШІ-бот взагалі відмовляється розповідати про лідерів Компартії та криваві події в історії Китаю. «ШІ-система DeepSeek має політичну та ідеологічну цензуру. Наприклад, коли я попросив її перерахувати злочини комуністичних режимів, вона відмовилась відповідати. Не здивуюсь, якщо в найближчому майбутньому розробники цієї ШІ-системи накладуть цензуру ще й на війну росії з Україною, щоб не називати речі своїми іменами», – пояснює Олексій Мінаков.
Поки що, відповідаючи на питання Mind про війну, Крим тощо, DeepSeek видавав досить об’єктивну інформацію та не дивував маніпуляціями в стилі «не все так однозначно», як його «колега» Grok.
Під час тестування Mind DeepSeek навіть розповів небажану в Китаї інформацію про репресії проти уйгурів. «За останні роки китайський уряд значно посилив контроль над Сіньцзяном. Повідомляється про масові арешти, ув’язнення у так званих «центрах перевиховання»… Використовуються технології масового стеження, включаючи штучний інтелект, для контролю за населенням. Уйгурам обмежено доступ до мечетей, а релігійні практики (пост під час Рамадану) часто забороняються. Багато релігійних лідерів заарештовані або зникли безвісти… Повідомляється про примусову працю уйгурів на фабриках та в сільському господарстві, часто в умовах, що нагадують примусову працю», – перерахував ШІ-бот.
Але «спалився» на уточнювальному питанні, чи використовується примусова праця уйгурів на фабриках Temu. Спочатку DeepSeek розповів, що прямих доказів поки немає, але є побічні, та почав їх перераховувати. Втім, не встиг. «Вибачте, це виходить за межі моїх поточних можливостей. Поговоримо про інше», – запропонував бот і видалив свою попередню відповідь.
Хоча до цього DeepSeek заперечував, що в ньому є цензура, та запевняв, що йому заборонено відповідати лише на деякі питання. «Я розроблений, щоб дотримуватися принципів безпеки та етики, тому у мене є певні обмеження, які допомагають уникнути шкоди, поширення неправдивої інформації або порушення законів», – розповів бот.
Та уточнив, що не відповідає на питання, що стосуються:
Наскільки свіжу інформацію видає DeepSeek? На уйгурах цей ШІ-бот «спалився» двічі. Відповідаючи на питання, скільки уйгурів проживало в Китаї 20 років тому, DeepSeek видав: «20 років тому, у 2003 році…». Після уточнення поточної дати, почав переконувати користувача, що насправді зараз не 2025 рік, а 2023-ий (згодом виправив на 2024-ий), дійсний президент США – Джо Байден тощо. Після короткого «допиту» зізнався, що користується застарілою інформацією: «Наразі я не маю доступу до інтернету. Моя база знань оновлюється вручну, і я можу надавати інформацію лише до жовтня 2023 року».
Тож, можливо, в цьому і є одна з розгадок вкрай малих витрат на китайську розробку, яка начебто перевершує модель o1 від OpenAI.
Источник: mind.ua