from sklearn.metrics import accuracy_score
# Загрузка набора данных
# Предположим, что у нас есть CSV-файл с данными о банковских клиентах
# Содержащий столбцы: возраст, пол, доход, семейное положение, кредитная история и целевая переменная (дефолт/недефолт)
data = pd.read_csv("bank_clients.csv")
# Разделение данных на признаки (X) и целевую переменную (y)
X = data.drop("target", axis=1)
y = data["target"]
# Разделение данных на тренировочный и тестовый наборы
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# Создание модели логистической регрессии
model = LogisticRegression()
# Обучение модели на тренировочном наборе данных
model.fit(X_train, y_train)
# Прогнозирование классов для тестового набора данных
y_pred = model.predict(X_test)
# Вычисление точности модели
accuracy = accuracy_score(y_test, y_pred)
print("Точность модели: {:.2f}".format(accuracy))
```
В этом примере мы используем модель логистической регрессии для классификации банковских клиентов на дефолтные и недефолтные. Мы загружаем данные из CSV-файла, разделяем их на признаки и целевую переменную, а затем разделяем их на тренировочный и тестовый наборы данных. Модель логистической регрессии обучается на тренировочном наборе, а затем используется для предсказания классов для тестового набора. Наконец, мы вычисляем точность модели с помощью метрики accuracy_score.
Обратите внимание, что этот пример является общим и требует наличия данных в соответствующем формате и установленных библиотек scikit-learn и pandas для работы.
Логистическая регрессия (Logistic Regression) является одним из методов бинарной классификации в машинном обучении. Она используется для предсказания вероятности принадлежности объекта к определенному классу.
Основная идея логистической регрессии состоит в том, чтобы использовать логистическую функцию (также известную как сигмоидная функция) для преобразования линейной комбинации признаков объекта в вероятность принадлежности к классу. Формула логистической регрессии выглядит следующим образом:
p(y=1|x) = sigmoid(w^T * x + b)
где:
– p(y=1|x) представляет собой вероятность принадлежности объекта к классу 1 при условии значения признаков x,
– w – вектор весов, соответствующий признакам,
– b – смещение (bias),
– sigmoid – логистическая функция, определенная как sigmoid(z) = 1 / (1 + exp(-z)).
Для обучения модели логистической регрессии используется метод максимального правдоподобия, который позволяет настроить веса и смещение модели таким образом, чтобы максимизировать вероятность наблюдаемых данных.
После обучения модели логистической регрессии, для новых объектов можно использовать полученные веса для вычисления их вероятности принадлежности к классу 1. Затем можно применить пороговое значение для принятия решения о классификации объекта.
Логистическая СКАЧАТЬ