Чат-бот Grok, разработанный компанией xAI Илона Маска, продемонстрировал более высокие показатели надёжности по сравнению с ChatGPT и Gemini. Об этом сообщает Sona.kz со ссылкой на агентство Kazinform.
Согласно отчёту аналитического агрегатора Relum, Grok показал самый низкий уровень ложных срабатываний 8% среди десяти основных протестированных моделей искусственного интеллекта. Исследование было посвящено оценке надёжности ИИ-сервисов, используемых в рабочих процессах.
Для сравнения, ChatGPT продемонстрировал один из наиболее высоких показателей ложных срабатываний 35%, уступив лишь модели Gemini от Google, у которой данный показатель составил 38%.
В ходе исследования чат-боты оценивались по ряду критериев, включая частоту ложных срабатываний, пользовательские рейтинги, стабильность ответов и время простоя сервисов. По совокупности этих параметров моделям присваивался риск-балл надёжности по шкале от 0 до 99, где более высокие значения указывали на наличие серьёзных проблем.
Итоговый риск-балл Grok составил 6, что стало одним из лучших результатов исследования. Второе место занял DeepSeek с показателем 4 и нулевым временем простоя. Высокий уровень галлюцинаций и частые простои обеспечили ChatGPT наивысший риск-балл 99. Следом в рейтинге расположились Claude и Meta AI с показателями 75 и 70 соответственно.









