Илон Масктың xAI компаниясы әзірлеген Grok чат-боты сенімділік көрсеткіштері бойынша ChatGPT және Google-дың Gemini моделінен жоғары нәтиже көрсетті. Бұл туралы Sona.kz Kazinform-ға сілтеме жасап хабарлайды.
Relum аналитикалық агрегаторы дайындаған есепке сәйкес, Grok жалған жауаптар деңгейі бойынша ең төмен көрсеткішке ие болған. Зерттеу барысында он негізгі жасанды интеллект моделінің жұмысы бағаланған, Grok-та бұл көрсеткіш небәрі 8 пайызды құраған.
Салыстыру үшін айтар болсақ, ChatGPT жалған жауаптар бойынша жоғары көрсеткіш көрсетті 35 пайыз. Ал Google-дың Gemini моделінде бұл көрсеткіш 38 пайызға жеткен.
Зерттеу аясында чат-боттар жалған срабатываниелердің жиілігі, пайдаланушылардың бағасы, жауаптардың тұрақтылығы және сервистердің істен шығу жиілігі сияқты көрсеткіштер бойынша бағаланған. Осы деректер негізінде әр модельге 0-ден 99-ға дейінгі сенімділік тәуекелі балы берілген, мұнда жоғары балл сервистегі мәселелердің көп екенін көрсетеді.
Қорытынды нәтижелер бойынша Grok-тың тәуекел балы 6-ны құрады, бұл зерттеудегі ең үздік көрсеткіштердің бірі. Екінші орынға DeepSeek шық. Оның тәуекел көрсеткіші 4 және сервистің істен шығу уақыты тіркелмеген.
Ал ChatGPT-ге жауаптардағы «галлюцинациялар» мен жиі істен шығулар салдарынан ең жоғары тәуекел балы 99 берілген. Одан кейін Claude және Meta AI чат-боттары орналасып, олардың сенімділік көрсеткіштері тиісінше 75 және 70 балды құраған.









