Исследование, проведенное Сандживом Аророй из Принстонского университета и Анирудом Гойялом из Google DeepMind, доказывает осмысленность действий чат-ботов.
Эти нейросети представляют собой большие языковые модели (LLM), которые могут развивать способности, указывающие на понимание текста, и генерацию ответов, статистически невозможных на основе имеющихся данных обучения.
Исследование предлагает теоретический и математически обоснованный подход для понимания того, как LLM могут приобретать навыки, которые выходят за пределы общепринятых задач.
Ученые разработали метод “skill-mix” для оценки способности LLM использовать несколько навыков при генерации текста и автоматизировали процесс оценки. Теория предлагает новый взгляд на способности LLM и вызывает интерес к вопросу о том, насколько нейросеть по-настоящему понимает текст. Она также дает обоснование их экспертным способностям.
Источник
Уникальность
Эти нейросети представляют собой большие языковые модели (LLM), которые могут развивать способности, указывающие на понимание текста, и генерацию ответов, статистически невозможных на основе имеющихся данных обучения.
Исследование предлагает теоретический и математически обоснованный подход для понимания того, как LLM могут приобретать навыки, которые выходят за пределы общепринятых задач.
Ученые разработали метод “skill-mix” для оценки способности LLM использовать несколько навыков при генерации текста и автоматизировали процесс оценки. Теория предлагает новый взгляд на способности LLM и вызывает интерес к вопросу о том, насколько нейросеть по-настоящему понимает текст. Она также дает обоснование их экспертным способностям.
Источник
Уникальность