4. VGGNet (2014): VGGNet, представленная в 2014 году, стала важным шагом в развитии сверточных нейронных сетей, предложив новый подход к архитектуре сети. Её создание было обусловлено стремлением к увеличению глубины нейронной сети с целью улучшения её способности к извлечению признаков из изображений. В отличие от предыдущих архитектур, VGGNet предлагала использовать последовательные слои свертки с небольшими ядрами размером 3x3, что значительно упростило структуру сети.
Этот подход позволил строить нейронные сети с большей глубиной, что отразилось на их способности к обучению и классификации изображений. Вместо того чтобы использовать большие ядра свертки, как это делали предыдущие модели, VGGNet сосредотачивалась на использовании множества последовательных слоев с более мелкими ядрами, что давало более гибкий и эффективный способ анализа изображений.
Благодаря своей простоте и эффективности, VGGNet стала популярным выбором для многих задач компьютерного зрения. Её способность строить глубокие сети и достигать высокой точности в классификации изображений привлекла внимание исследователей и инженеров, стимулируя дальнейшее развитие сверточных нейронных сетей и их применение в различных областях, от распознавания объектов до медицинской диагностики.
5. GoogLeNet (Inception, 2014): GoogLeNet, представленная в 2014 году, представила инновационный подход к архитектуре сверточных нейронных сетей (CNN), введя новый тип модулей, названных Inception. Эти модули существенно отличались от предыдущих подходов, так как объединяли свертки с различными размерами ядер в одном слое. Это позволило сети одновременно изучать признаки на разных уровнях детализации, что существенно улучшило её способность к анализу изображений.
Использование Inception-модулей в архитектуре GoogLeNet привело к созданию более эффективных сетей с меньшим количеством параметров по сравнению с традиционными архитектурами. Это стало возможным благодаря параллельному применению сверток различных размеров внутри одного модуля, что позволило сети эффективно изучать различные аспекты изображений на разных масштабах.
Кроме того, GoogLeNet внедрила дополнительные техники, такие как использование 1x1 сверток для уменьшения размерности признакового пространства и улучшения вычислительной эффективности. Эти инновации помогли создать сеть, которая достигала высокой точности в классификации изображений при более низкой вычислительной сложности, что было важным преимуществом при работе с огромными наборами данных, такими как ImageNet.
6. ResNet (2015): ResNet, представленная в 2015 году, предложила инновационное решение для проблемы исчезающего градиента, с которым сталкиваются глубокие нейронные сети при обучении. Одной из ключевых проблем при обучении глубоких сетей является затухание градиентов: по мере прохождения градиентов через множество слоев они могут становиться слишком малыми, что затрудняет обучение и приводит к ухудшению производительности СКАЧАТЬ