Би-би-си: так ли хорош DeepSeek, как о нем говорят?
DeepSeek, китайское приложение для ИИ-чатботов, запущенное на прошлой неделе, вызвало хаос на рынках США и поставило вопрос о будущем доминирования Америки в области ИИ. BBC рассказывает о том, как работает это приложение.
Автор: Зои Клейнман
DeepSeek, китайское приложение для ИИ-чатботов, запущенное на прошлой неделе, вызвало хаос на рынках США и поставило вопрос о будущем доминирования Америки в области ИИ. BBC рассказывает о том, как работает это приложение.
DeepSeek выглядит и ощущается как любой другой чатбот, хотя и склонен к излишней болтливости. Как и в случае с ChatGPT от OpenAI или Gemini от Google, вы открываете приложение (или сайт) и задаете ему вопросы о чем угодно, а он делает все возможное, чтобы дать вам ответ. Он дает длинные ответы и не спешит высказать свое мнение, как бы прямо его ни просили.
Часто чатбот начинает свой ответ со слов о том, что тема «крайне субъективна» — будь то политика (хорош ли Дональд Трамп в качестве президента США?) или безалкогольные напитки (что вкуснее, Pepsi или Coke?).
Компания DeepSeek даже не стала говорить о том, лучше ли её продукт чем конкурирующий с ней помощник ChatGPT, но взвесила все за и против обоих — ChatGPT делал точно то же самое и даже использовал очень похожий язык.
DeepSeek утверждает, что его обучали на данных до октября 2023 года, и хотя приложение, похоже, имеет доступ к текущей информации, такой как сегодняшняя дата, версия на сайте этого не делает. Это не отличается от предыдущих версий ChatGPT и, вероятно, является аналогичной попыткой защиты — чтобы чатбот не выплескивал дезинформацию в сеть в режиме реального времени.
Он может быть довольно быстрым в своих ответах, но в настоящее время стонет под тяжестью большого количества людей, спешащих опробовать его, поскольку он стал вирусным.
Есть, однако одна область, в которой он совсем не похож на своего американского конкурента — DeepSeek подвержен цензуре, когда речь заходит о вопросах, касающихся запрещенных в Китае тем.
Иногда он начинает отвечать, но затем ответ исчезает с экрана и заменяется фразой «давайте поговорим о чем-нибудь другом».
Одна из явно запретных тем — протесты на площади Тяньаньмэнь в 1989 году, в результате которых, по данным китайского правительства, военные убили 200 гражданских лиц — по другим оценкам, от сотен до многих тысяч.
Но DeepSeek не будет отвечать ни на какие вопросы об этом или даже в более широком смысле о том, что произошло в Китае в тот день.
Разработанный в США ChatGPT, для сравнения, не сдерживается в своих ответах о площади Тяньаньмэнь.
Кайла Бломквист, научный сотрудник Оксфордского института интернета и директор Оксфордской лаборатории китайской политики, говорит, что китайское правительство «относительно сдержанно» относится к этому приложению.
«Я бы сказала, что наметился сдвиг, так как только за последнюю неделю мы увидели объявление об огромных инвестициях со стороны центрального правительства — так что это, вероятно, станет сигналом к дальнейшим изменениям».
DeepSeek поставляется с теми же предостережениями, что и другие чат-боты, относительно точности, и имеет внешний вид и ощущения более известных американских ИИ-помощников, которыми уже пользуются миллионы людей. Для многих — особенно для тех, кто не подписывается на высококлассные сервисы — это, вероятно, выглядит примерно так же.
Представьте себе математическую задачу, в которой истинный ответ содержит 32 знака после запятой, а сокращенная версия — восемь.
Это не так хорошо — но для большинства людей это не имеет значения.
Возможно, ей удалось сократить расходы и вычисления, но мы знаем, что она, по крайней мере частично, построена на плечах гигантов: использует чипы Nvidia — хотя и старые, более дешевые версии — и использует архитектуру Meta Llama с открытым исходным кодом, а также эквивалент Qwen от AliBaba.
«Я думаю, что это бросает вызов идее стратегии монетизации, которой придерживались многие ведущие американские компании в области ИИ», — говорит Бломквист.
«Это указывает на потенциальные методы разработки моделей, которые являются гораздо менее вычислительными и ресурсоемкими, что потенциально может означать смену парадигмы, хотя это не подтверждено и еще предстоит изучить».
«Посмотрим, что покажут следующие пару месяцев».
Оригинал: BBC