Есть первый полноценный ИИ-программист
Компания Cognition Labs обнародовала то, что было обещано с тех пор, как мы впервые услышали о генеративном искусственном интеллекте – первого искусственного (синтетического) работника, который называется Devin.
Под катом подробности и то, что он умеет.
Обладая развитыми способностями к рассуждению и долгосрочному планированию, Девин может выполнять сложные задачи с поразительной эффективностью. Его когнитивные способности позволяют ему принимать тысячи решений, вспоминать соответствующую информацию и учиться на собственном опыте. Благодаря комплексному набору инструментов разработчика, интегрированному в его структуру, включая оболочку, редактор кода и браузер, Devin работает в изолированной вычислительной среде, отражая возможности программиста-человека. Более того, Devin активно сотрудничает с пользователями, сообщает о ходе работы в режиме реального времени, принимает отзывы и работает вместе с с ними над выбором дизайна по мере необходимости.
Вот что может сделать Devin:
Devin может учиться использовать незнакомые технологии.
Devin может внести свой вклад в создание зрелых производственных репозиториев.
Devin может обучать и настраивать другие модели ИИ .
Devin работает с фриланс-биржами, где берёт и выполняет задания.
Devin также был протестирован на SWE-bench, сложном тесте, который требует от агентов решать реальные проблемы GitHub, обнаруженные в проектах с открытым исходным кодом, таких как Django и scikit-learn.
ИИ правильно решил 13,86% комплексных проблем, что намного превышает предыдущий уровень в 1,96%. Даже если предоставить точные файлы для редактирования, лучшие предыдущие модели могут решить только 4,80% проблем.
Под катом подробности и то, что он умеет.
Обладая развитыми способностями к рассуждению и долгосрочному планированию, Девин может выполнять сложные задачи с поразительной эффективностью. Его когнитивные способности позволяют ему принимать тысячи решений, вспоминать соответствующую информацию и учиться на собственном опыте. Благодаря комплексному набору инструментов разработчика, интегрированному в его структуру, включая оболочку, редактор кода и браузер, Devin работает в изолированной вычислительной среде, отражая возможности программиста-человека. Более того, Devin активно сотрудничает с пользователями, сообщает о ходе работы в режиме реального времени, принимает отзывы и работает вместе с с ними над выбором дизайна по мере необходимости.
Вот что может сделать Devin:
Devin может учиться использовать незнакомые технологии.
Devin может внести свой вклад в создание зрелых производственных репозиториев.
Devin может обучать и настраивать другие модели ИИ .
Devin работает с фриланс-биржами, где берёт и выполняет задания.
Devin также был протестирован на SWE-bench, сложном тесте, который требует от агентов решать реальные проблемы GitHub, обнаруженные в проектах с открытым исходным кодом, таких как Django и scikit-learn.
ИИ правильно решил 13,86% комплексных проблем, что намного превышает предыдущий уровень в 1,96%. Даже если предоставить точные файлы для редактирования, лучшие предыдущие модели могут решить только 4,80% проблем.
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.