
За решение проблем по 1 баллу получили Google Gemini Pro и ChatGPT, а Grok 3 – 2 балла. Примерно та же ситуация была с математическими вычислениями.
С переводом лучше всего справляются GPT и Perplexity Pro, а вот Grok более сложные фразы переводил слишком буквально и показал себя хуже остальных.
Итоговые оценки вы можете увидеть ниже на изображении.