Что дальше?

Оценить статью

Закончилось обучение в Практикуме.

Получен диплом.

Накопилась куча долгов)))

Во время учёбы плохо получалось работать. Времени не хватало.

Но!

Как сохранить квалификацию, пока буду выбирать, в какой команде продолжить карьеру аналитика данных?

Буду выполнять аналитику для друзей!

Высылайте запросы!

Карьера в кино

Оценить статью

Сегодня – завтра в ночные смены, уже второй раз, снимаюсь в кино.
По сравнению со съёмкой на ТВ, это развлечение характеризуется бесконечным повторением эпизодов с разных ракурсов камеры.

За смену удаётся отработать не большое – два-три – количество эпизодов.

Мне ещё не попадались роли со словами, но уже обе роли разноплановые.

Актёр Эдуард Дементьев

Монах в телепроекте – реконструкции исторических событий
Продавец на современном празднике Ивана Купалы (детективный сериал)

А вы хотите сниматься в кино?

3D График

Оценить статью

Как отобразить на графике 5 факторов, 5 переменых?

4 категории и одна сумма.

Для одной точки.

Можно построить 3D график.

Например вот такой график Plotly

(если график не видно здесь, то посмотрите на него на странице рубрики)

Этот график можно вращать по вертикали и горизонтали.

Приближать и удалять.

Можно сделать сброс до исходного вида.

Можно выключать из отображения категории товаров.

Можно сохранить кадр, который на экране – именно с таким поворотом и приближением.

При наведении курсора мышки на точку, выводится подробная информация.

Двухэтажные название колонок

Оценить статью

После комплексной группировки таблицы pandas Pynhon dataframe командой groupby напрмер применив такую строку

# сколько заказов у каждого покупателя
agg_func_count = {'order_id': ['count'],
                    'sum_product': [ 'sum']}
count_orders_customer = df.groupby('customer_id')['order_id', 'sum_product'].agg(agg_func_count).reset_index()

Получаем двухэтажное название колонок в итоговой таблице.

Ещё они называются иерархические индексы

Пример dataframe с двухэтажными колонками

Выглядит это очень красиво. Но при попытке обратиться к колонке по названию, возникает сложность.

Что же делать?

Трансформировать иерархические названия столбцов pandas

Вот непонятная, но эффективная строка для этого

count_orders_customer.columns = ['_'.join(col).rstrip('_') for col in count_orders_customer.columns.values]

И получим результат сглаживания

Не земетили подвох?

Как прочесть csv файл с Яндекс Диска в pandas

Оценить статью

Яндекс.Диск официально не предоставляет сервис прямого считывания файлов по прямой ссылке.

Публичная ссылка на файл открывается в окне браузера. И уже в этом окне есть ссылка для скачивания.

Но в задачах анализа данных бывает необходимо в тетрадке Юпитер.Ноутбука прямо считывать данные в переменную из облачного хранилища.

Самый популярный в РФ ресурс для хранения файлов сейчас – это Яндекс.Диск.

Вот пример кода на Python для чтения файла:

import pandas as pd 
import requests 
from urllib.parse import urlencode 
 
# используем api 
base_url = 'https://cloud-api.yandex.net/v1/disk/public/resources/download?' 
public_key = 'https://disk.yandex.ru/d/c_JZSSJSnqWYzA' 
 
# получаем url 
final_url = base_url + urlencode(dict(public_key=public_key)) 
response = requests.get(final_url) 
download_url = response.json()['href'] 
 
# загружаем файл в df 
download_response = requests.get(download_url) 
df = pd.read_csv(download_url, sep='\t') 

Конечно же, может потребоваться подбор кодовой страницы файла и разделителя.

Ну это как для любого файла csv .