Grok Илона Маска признан более надёжным, чем ChatGPT и Gemini

Чат-бот компании xAI показал самый низкий уровень ложных срабатываний среди протестированных ИИ-моделей

Чат-бот Grok, разработанный компанией xAI Илона Маска, продемонстрировал более высокие показатели надёжности по сравнению с ChatGPT и Gemini. Об этом сообщает Sona.kz со ссылкой на агентство Kazinform.

Согласно отчёту аналитического агрегатора Relum, Grok показал самый низкий уровень ложных срабатываний 8% среди десяти основных протестированных моделей искусственного интеллекта. Исследование было посвящено оценке надёжности ИИ-сервисов, используемых в рабочих процессах.

Для сравнения, ChatGPT продемонстрировал один из наиболее высоких показателей ложных срабатываний 35%, уступив лишь модели Gemini от Google, у которой данный показатель составил 38%.

В ходе исследования чат-боты оценивались по ряду критериев, включая частоту ложных срабатываний, пользовательские рейтинги, стабильность ответов и время простоя сервисов. По совокупности этих параметров моделям присваивался риск-балл надёжности по шкале от 0 до 99, где более высокие значения указывали на наличие серьёзных проблем.

Итоговый риск-балл Grok составил 6, что стало одним из лучших результатов исследования. Второе место занял DeepSeek с показателем 4 и нулевым временем простоя. Высокий уровень галлюцинаций и частые простои обеспечили ChatGPT наивысший риск-балл 99. Следом в рейтинге расположились Claude и Meta AI с показателями 75 и 70 соответственно.