Сверточные нейросети. Джейд Картер
Чтение книги онлайн.

Читать онлайн книгу Сверточные нейросети - Джейд Картер страница 7

Название: Сверточные нейросети

Автор: Джейд Картер

Издательство: Автор

Жанр:

Серия:

isbn:

isbn:

СКАЧАТЬ (0.5,))

      ])

      train_set = datasets.ImageFolder(root='./data/train', transform=transform)

      train_loader = torch.utils.data.DataLoader(train_set, batch_size=64, shuffle=True)

      # Определение архитектуры нейронной сети с Sigmoid в выходном слое

      class SimpleNN(nn.Module):

      def __init__(self):

      super(SimpleNN, self).__init__()

      self.fc1 = nn.Linear(32*32*3, 128)

      self.fc2 = nn.Linear(128, 64)

      self.fc3 = nn.Linear(64, 1)

      self.sigmoid = nn.Sigmoid()

      def forward(self, x):

      x = torch.flatten(x, 1)

      x = torch.relu(self.fc1(x))

      x = torch.relu(self.fc2(x))

      x = self.fc3(x)

      x = self.sigmoid(x)

      return x

      # Создание экземпляра модели

      model = SimpleNN()

      # Обучение модели и применение Sigmoid в выходном слое

      ```

      В этом примере мы создаем нейронную сеть с тремя полносвязными слоями. После двух скрытых слоев мы применяем ReLU в качестве функции активации, а в выходном слое – Sigmoid. Это позволяет нам получить вероятность того, что каждое изображение принадлежит классу "улыбающееся" (значение близкое к 1) или "неулыбающееся" (значение близкое к 0). Однако важно помнить о проблеме затухания градиента при использовании Sigmoid, особенно в глубоких сетях, что может затруднить обучение модели.

      3. Tanh (гиперболический тангенс): Тангенс гиперболический функция также сжимает выходные значения, но в диапазон от -1 до 1. Это помогает ускорить обучение по сравнению с сигмоидальной функцией, так как выходные значения более центрированы относительно нуля.

      Пример использования Tanh (гиперболического тангенса) в нейронной сети для предсказания значения некоторого непрерывного признака:

      ```python

      import torch

      import torch.nn as nn

      import torchvision.transforms as transforms

      import torchvision.datasets as datasets

      # Загрузка и предобработка данных

      transform = transforms.Compose([

      transforms.Resize((32, 32)),

      transforms.ToTensor(),

      transforms.Normalize((0.5,), (0.5,))

      ])

      train_set = datasets.ImageFolder(root='./data/train', transform=transform)

      train_loader = torch.utils.data.DataLoader(train_set, batch_size=64, shuffle=True)

      # Определение архитектуры нейронной сети с Tanh в скрытых слоях

      class SimpleNN(nn.Module):

      def __init__(self):

      super(SimpleNN, self).__init__()

      self.fc1 = nn.Linear(32*32*3, 128)

      self.fc2 = nn.Linear(128, 64)

      self.fc3 = nn.Linear(64, 1)

      self.tanh = nn.Tanh()

      def forward(self, x):

      x = torch.flatten(x, 1)

      x = torch.relu(self.fc1(x))

      x = torch.relu(self.fc2(x))

      x = self.fc3(x)

      x = self.tanh(x)

      return x

      # Создание экземпляра модели

      model = SimpleNN()

      # Обучение модели и применение Tanh в скрытых слоях

      ```

      В этом примере мы используем нейронную сеть с тремя полносвязными слоями. После двух скрытых слоев мы применяем ReLU в качестве функции активации, а в выходном слое – Tanh. Tanh сжимает выходные значения в диапазоне от -1 до 1, что помогает ускорить обучение по сравнению с сигмоидальной функцией, так как выходные значения более центрированы относительно нуля. Это может сделать обучение более стабильным и улучшить производительность модели.

      4. Softmax: Softmax-функция обычно используется в выходных слоях СКАЧАТЬ