Яндекс Метрика

// категория: Исследования и разработки

OpenAI и PNNL представили DraftNEPABench: ИИ ускорит получение государственных разрешений на 15%ИИ
26.02.20264 мин
OpenAI и PNNL представили DraftNEPABench: ИИ ускорит получение государственных разрешений на 15%
OpenAI в сотрудничестве с Тихоокеанской северо-западной национальной лабораторией (PNNL) разработали новый бенчмарк DraftNEPABench. Инструмент предназначен для оценки эффективности ИИ-агентов в автоматизации подготовки экологической документации, что позволит значительно ускорить модернизацию инфраструктуры.
Кризис оценки ИИ-кодеров: почему популярный бенчмарк SWE-bench Verified теряет актуальностьLLM
24.02.20264 мин
Кризис оценки ИИ-кодеров: почему популярный бенчмарк SWE-bench Verified теряет актуальность
Популярный инструмент для оценки способностей нейросетей в программировании SWE-bench Verified столкнулся с серьезными проблемами загрязнения данных и ошибочными тестами. Эксперты призывают индустрию переходить на версию SWE-bench Pro для получения объективных результатов развития LLM.
Искусственный интеллект берет новую высоту: Нейросети начинают решать сложнейшие математические задачиИИ
21.02.20264 мин
Искусственный интеллект берет новую высоту: Нейросети начинают решать сложнейшие математические задачи
Исследователи представили результаты тестирования новых ИИ-моделей, способных справляться с математическими доказательствами экспертного уровня. Это важный шаг в переходе от простой генерации текста к глубокому логическому рассуждению и научным открытиям.
Математика смыслов: Ученые расшифровали внутреннюю механику Word2vecнейросети
19.02.20264 мин
Математика смыслов: Ученые расшифровали внутреннюю механику Word2vec
Исследователи представили новую теоретическую базу, объясняющую процесс обучения Word2vec — фундаментального алгоритма для обработки текста. Работа доказывает, что обучение нейросети происходит через дискретные шаги и математически сводится к классическим методам анализа данных, таким как PCA.
показано 4 из 4