Python Библиотеки. Джейд Картер
Чтение книги онлайн.

Читать онлайн книгу Python Библиотеки - Джейд Картер страница 7

Название: Python Библиотеки

Автор: Джейд Картер

Издательство: Автор

Жанр:

Серия:

isbn:

isbn:

СКАЧАТЬ style="font-size:15px;">      import pandas as pd

      data = {'Имя': ['Анна', 'Борис', 'Виктория'],

      'Возраст': [25, 30, 22],

      'Город': ['Москва', 'Санкт-Петербург', 'Киев']}

      df = pd.DataFrame(data)

      print(df)

      ```

      Из CSV-файла:

      ```python

      import pandas as pd

      df = pd.read_csv('данные.csv')

      print(df)

      ```

      CSV (Comma-Separated Values) – это текстовый формат для представления табличных данных. В файле CSV данные организованы в виде таблицы, где каждая строка представляет собой отдельную запись, а столбцы разделены разделителем, обычно запятой (`,`). Однако, в зависимости от локали, могут использоваться и другие разделители, такие как точка с запятой (`;`) или табуляция (`\t`).

      CSV-файлы позволяют эффективно хранить и передавать табличные данные между программами. Этот формат широко используется в области обработки данных, анализа данных, а также в различных приложениях для импорта и экспорта информации в табличной форме.

      Пример CSV-файла:

      Имя,Возраст,Город

      Анна,25,Москва

      Борис,30,Санкт-Петербург

      Виктория,22,Киев

      В этом примере каждая строка представляет собой запись с именем, возрастом и городом. Значения разделены запятыми, что является стандартным подходом, но можно использовать и другие разделители.

      CSV-файлы легко читаются и создаются с использованием различных программ, включая текстовые редакторы, электронные таблицы (например, Microsoft Excel, Google Sheets) и программы для обработки данных (например, Python с библиотекой Pandas).

      3. Основные операции с DataFrame

      Просмотр данных:

      ```python

      # Вывести первые n строк DataFrame

      print(df.head())

      # Вывести последние n строк DataFrame

      print(df.tail())

      ```

      Индексация и выбор данных:

      ```python

      # Выбор столбца по имени

      age = df['Возраст']

      # Выбор строки по индексу

      row = df.loc[0]

      ```

      Фильтрация данных:

      ```python

      # Фильтрация по условию

      filtered_df = df[df['Возраст'] > 25]

      ```

      Добавление новых столбцов:

      ```python

      # Добавление нового столбца

      df['Зарплата'] = [50000, 60000, 45000]

      ```

      Операции с группами:

      ```python

      # Группировка данных по столбцу 'Город' и вычисление среднего значения возраста в каждой группе

      grouped_df = df.groupby('Город')['Возраст'].mean()

      ```

      4. Визуализация данных с Pandas

      Pandas также предоставляет встроенные средства для визуализации данных. Например, гистограмму можно построить следующим образом:

      Давайте разберем пошагово строки кода:

      – Импорт библиотек:

      ```python

      import pandas as pd

      import matplotlib.pyplot as plt

      import seaborn as sns

      ```

      Здесь СКАЧАТЬ